生成式人工智能(GenAI)和大語言模型(LLM)的發(fā)展帶來了巨大的算力需求,數(shù)據(jù)中心的能源消耗也因此大幅增加。Gartner 預(yù)測,到 2027 年,新增 AI 服務(wù)器所需的用電量將是 2023 年的兩倍以上,這給數(shù)據(jù)中心運(yùn)營帶來了多方面的挑戰(zhàn)。首先,不斷攀升的電力需求導(dǎo)致運(yùn)營成本上升。為了滿足 GenAI 對電力的需求,數(shù)據(jù)中心需要更多的能源供應(yīng),這將增加電力成本。其次,電力消耗的增加也會影響數(shù)據(jù)中心的性能,可能導(dǎo)致服務(wù)器過熱、網(wǎng)絡(luò)延遲等問題。此外,過度的電力消耗還對環(huán)境造成負(fù)面影響,不符合可持續(xù)發(fā)展的要求。為了應(yīng)對這些挑戰(zhàn),一些企業(yè)開始將 GenAI 處理向終端設(shè)備轉(zhuǎn)移。將更多的 AI 推理工作負(fù)載轉(zhuǎn)移至終端設(shè)備,可以減輕數(shù)據(jù)中心的電力壓力,同時提高響應(yīng)速度和數(shù)據(jù)隱私保護(hù)水平。Gartner 預(yù)測,到 2026 年,終端 GenAI 查詢量將超過云端,這標(biāo)志著 AI 戰(zhàn)略的重大轉(zhuǎn)向。然而,終端 GenAI 處理也需要重新設(shè)計關(guān)鍵技術(shù)。由于終端設(shè)備的外形尺寸限制,其搭載的 GenAI 處理需要極高的能源效率,同時不能影響終端設(shè)備的續(xù)航時間和電池壽命。這就需要在半導(dǎo)體、電池以及 AI 模型開發(fā)領(lǐng)域進(jìn)行顯著的協(xié)同創(chuàng)新。在半導(dǎo)體方面,高效節(jié)能芯片是實(shí)現(xiàn)實(shí)時處理和低延遲的關(guān)鍵。專為終端 GenAI 設(shè)計的專用 AI 處理器、低功耗存儲芯片,以及集成 NPU 的應(yīng)用處理器和 MCU 成為首選方案。此外,氮化鎵等寬禁帶半導(dǎo)體在快充電源轉(zhuǎn)換中也起著重要作用。在電池方面,更高能量密度的固態(tài)鋰離子電池將成為支持終端 GenAI 處理的關(guān)鍵。這些電池可以提供更長的續(xù)航時間,確保終端設(shè)備在 GenAI 處理過程中不會很快耗盡電量。在 AI 模型方面,終端設(shè)備需要參數(shù)規(guī)模更小的定制化 AI 模型。這些輕量化的大語言模型適用于特定任務(wù)和行業(yè),可以降低計算需求,使其適合部署在資源有限的終端設(shè)備上。綜上所述,GenAI 和 LLM 的迅猛發(fā)展帶來了前所未有的算力需求,對數(shù)據(jù)中心的電力供應(yīng)造成了巨大壓力。將 GenAI 處理向終端設(shè)備轉(zhuǎn)移是一種應(yīng)對策略,但需要在半導(dǎo)體、電池和 AI 模型等領(lǐng)域進(jìn)行創(chuàng)新,以滿足終端設(shè)備對高效能、低功耗的需求。這一轉(zhuǎn)變將對 AI 行業(yè)的未來發(fā)展產(chǎn)生深遠(yuǎn)影響。