這一輪由AI技術(shù)演變帶來(lái)的算力爆發(fā),中國(guó)算力是否夠用?答案是否定的,算力尤其是智能算力,已經(jīng)成為制約中國(guó)人工智能發(fā)展的最關(guān)鍵因素。
近年來(lái),一方面國(guó)家大力布局智能算力產(chǎn)業(yè),一方面算力供給“鴻溝”卻在不斷擴(kuò)大。這一現(xiàn)象的主因是AI加快了中國(guó)數(shù)字化轉(zhuǎn)型,AI應(yīng)用版圖隨之?dāng)U大,算力需求自然“水漲船高”。
另一個(gè)原因是美國(guó)禁售最強(qiáng)GPU進(jìn)行的算力封鎖。目前從國(guó)產(chǎn)大模型與ChatGPT的差距看,遏制手段已經(jīng)生效:OpenAI之所以難以被超越,在于其擁有一個(gè)巨大的算力底座,在大模型(AI算法)的訓(xùn)練和推理中,首先擁有了效率優(yōu)勢(shì)。
算力基礎(chǔ)決定上層應(yīng)用。事實(shí)上,流向AI產(chǎn)業(yè)鏈的“每一滴水”, 最終都流向了算力。
為了避免算力產(chǎn)業(yè)在關(guān)鍵時(shí)刻被拉開(kāi)差距,當(dāng)下國(guó)家正在加快一體化的新型算力網(wǎng)絡(luò)體系建設(shè),國(guó)內(nèi)云廠商也紛紛參與其中。阿里云、騰訊云、天翼云還發(fā)布了讓“算力更普惠”的智算平臺(tái),硬件廠商則乘勢(shì)加快了AI服務(wù)器、AI芯片、存儲(chǔ)的國(guó)產(chǎn)替代進(jìn)程。
算力突圍戰(zhàn),再次打響。
01、奇點(diǎn)之路,算力為基
在2023財(cái)年Q1財(cái)報(bào)會(huì)上,扎克伯格稱(chēng)“生成式AI將觸及Meta所有產(chǎn)品”,這已是全球第四家科技大廠做如此表態(tài)。
此前阿里曾表示“所有產(chǎn)品都將接入大模型”,百度強(qiáng)調(diào)“所有業(yè)務(wù)全面集成文心一言”;更早一些,微軟“計(jì)劃將ChatGPT等OpenAI的AI工具整合入全線(xiàn)產(chǎn)品”。
這說(shuō)明,真正的AI時(shí)代,新的應(yīng)用都會(huì)基于大模型來(lái)開(kāi)發(fā),就像十幾年前的移動(dòng)互聯(lián)網(wǎng),各種基于安卓、iOS的應(yīng)用大量涌現(xiàn)一樣。
這令人工智能的奇點(diǎn),第一次以可以預(yù)見(jiàn)的方式展現(xiàn)在人們面前:AI滲透到千行百業(yè),達(dá)到“應(yīng)用奇點(diǎn)”,最終迎來(lái)強(qiáng)AI的“技術(shù)奇點(diǎn)”。而算力,無(wú)疑是這條“奇點(diǎn)之路”的路基。
這也是大模型在各種應(yīng)用領(lǐng)域加速落地,獲取更多訓(xùn)練參數(shù)和數(shù)據(jù)的長(zhǎng)期意義:AI目前還在線(xiàn)上,但遲早會(huì)與物理世界連接。可以想象一下,如果一個(gè)基于GPT-10的ChatGPT與波士頓動(dòng)力或特斯拉的人型機(jī)器人結(jié)合,會(huì)帶來(lái)什么?
此邏輯并非假想。長(zhǎng)期以來(lái),如何令A(yù)I掌握常識(shí)并融會(huì)貫通地運(yùn)用這些常識(shí)、形成推理能力,都是巨大的難題。但這次以ChatGPT為代表的大語(yǔ)言模型,突然就邁過(guò)這道“門(mén)檻”,成為“史上第一個(gè)真正意義上的通用人工智能”。
當(dāng)然這背后的原因有很多,如自監(jiān)督學(xué)習(xí)、Fine-tuning策略等,但一個(gè)重要的底層變化就是“涌現(xiàn)”(Emergent)現(xiàn)象。
大語(yǔ)言模型的涌現(xiàn)現(xiàn)象,在一定規(guī)模后迅速涌現(xiàn)出新能力;圖片來(lái)源:谷歌、斯坦福、DeepMind:大型語(yǔ)言模型的涌現(xiàn)能力
就是說(shuō)業(yè)界從未想象到的能力,例如基礎(chǔ)社會(huì)知識(shí)、上下文學(xué)習(xí)(ICL)、推理(CoT)等等,在訓(xùn)練參數(shù)和數(shù)據(jù)量超過(guò)一定數(shù)值后,這些能力就突然出現(xiàn)了。
而人形機(jī)器人最主要的技術(shù)要點(diǎn)有兩個(gè),一個(gè)是機(jī)器人的本體,一個(gè)是機(jī)器人的大腦。前者的難點(diǎn)在于更高功率密度的驅(qū)動(dòng)器,后者的難度就在于通用人工智能。
其實(shí),早在去年8月谷歌就將大模型嵌入了機(jī)器人的大腦。今年伴隨著多模態(tài)大模型的快速迭代,阿里、騰訊、微軟、OpenAI等多家中美大廠,都加大了該領(lǐng)域的探索。
譬如在4月底,阿里云將千問(wèn)大模型接入工業(yè)機(jī)器人可在釘釘遠(yuǎn)程指揮,騰訊Robotics X實(shí)驗(yàn)室也公布了機(jī)器人靈巧手TRX-Hand和機(jī)械臂TRX-Arm。
值得注意的是,騰訊機(jī)械手臂擁有三個(gè)手指、7個(gè)自由度,這與谷歌去年底推出的RT-1 機(jī)器人自由度一致。但相比特斯拉Optimus使用5個(gè)手指,擁有11個(gè)自由度還是有所不足。
這倒不是說(shuō)騰訊的技術(shù)能力不如特斯拉。機(jī)器人本身是一項(xiàng)綜合性的技術(shù),不僅對(duì)硬件有著極高要求,軟件算法也是機(jī)器人的核心要件,但更先進(jìn)的算法需要更強(qiáng)的算力支撐。
英偉達(dá)A100芯片的數(shù)量不足,可能已經(jīng)影響到中國(guó)企業(yè)開(kāi)展更先進(jìn)算法的訓(xùn)練和推理。
據(jù)《財(cái)經(jīng)十一人》報(bào)道,目前中國(guó)企業(yè)GPU芯片持有量超過(guò)1萬(wàn)枚的不超過(guò)5家,擁有1萬(wàn)枚A100的至多只有1家。且由于美國(guó)去年8月開(kāi)始算力封鎖,這些存貨的剩余使用壽命約為4-6年。
相比之下,特斯拉依靠領(lǐng)先的算力平臺(tái)DOJO(使用了1.4萬(wàn)個(gè)英偉達(dá)的GPU,含2022年最新升級(jí)后公布的7360塊A100),實(shí)際上構(gòu)建了一個(gè)其他競(jìng)爭(zhēng)對(duì)手難以企及的算力制高點(diǎn)。
在企業(yè)層面,另一個(gè)算力制高點(diǎn)是微軟。其在2020年就與OpenAI合作,建成了一臺(tái)號(hào)稱(chēng)世界前五,擁有超過(guò)28.5萬(wàn)個(gè)CPU核心、1萬(wàn)個(gè)GPU的E級(jí)超算(每秒百億億次數(shù)學(xué)運(yùn)算)。
去年11月份,微軟又宣布與英偉達(dá)合作開(kāi)發(fā)新型 AI 云端超算,據(jù)說(shuō)將用到“數(shù)以萬(wàn)計(jì)”的H100和 A100。在2023財(cái)年Q3財(cái)報(bào)會(huì)上微軟也表示,將繼續(xù)投資于云基礎(chǔ)設(shè)施,特別是與AI相關(guān)的支出。
02、六年發(fā)展,差距猶存
5月4日,李彥宏在百度內(nèi)部再次提起“與OpenAI差距”的問(wèn)題,他稱(chēng)媒體報(bào)道的“大約是兩個(gè)月”有點(diǎn)斷章取義,因?yàn)楹竺婢o接一句是:“這兩個(gè)月的差距我們要用多長(zhǎng)時(shí)間才能趕上?也許很快,也許永遠(yuǎn)也趕不上!
李彥宏“永遠(yuǎn)也趕不上”的考量,自然包括算力上的差距,至少目前看是如此。據(jù)外媒報(bào)道,OpenAI已經(jīng)使用了約2.5萬(wàn)個(gè)英偉達(dá)的GPU。
所以,算力也決定AI技術(shù)王權(quán)的更迭。
馬斯克也不滿(mǎn)足。上個(gè)月有消息稱(chēng)其搶購(gòu)了一萬(wàn)枚A100,主攻大模型,再關(guān)聯(lián)到特斯拉的智能汽車(chē)及寄予厚望的人型機(jī)器人,其對(duì)算力的需求近乎沒(méi)有止境。
業(yè)內(nèi)人士認(rèn)為,隨著AI技術(shù)的爆發(fā)和成熟,機(jī)器人發(fā)展將逐漸進(jìn)入顛覆式階段。但大模型不可能裝進(jìn)單體機(jī)器人大腦,它必須變成“云”大腦,通過(guò)在云、邊、端分布式算法、算力和大數(shù)據(jù),形成一個(gè)智能化的核心載體,這使機(jī)器人對(duì)算力更加依賴(lài)。
智能汽車(chē),一樣可以理解為汽車(chē)機(jī)器人,從智能座艙到自動(dòng)駕駛都是“吃算力”的大戶(hù)。
同時(shí)放眼宏觀,這兩個(gè)行業(yè)在“中國(guó)智造”的總體規(guī)劃中,所占份量也自不待言。
僅人型機(jī)器人,據(jù)Stratistics Market Research Consulting預(yù)測(cè),2035年全球市場(chǎng)規(guī)模將達(dá)到1520億美元;另?yè)?jù)SNE Research日前發(fā)布的報(bào)告,2023年全球電動(dòng)汽車(chē)市場(chǎng)規(guī)模預(yù)計(jì)將增至1210億美元。
也就是說(shuō),十余年后的人型機(jī)器人的市場(chǎng)規(guī)模,可能媲美今天的電動(dòng)汽車(chē)。
為此2021年12月,工信部等多部門(mén)就印發(fā)了《“十四五”機(jī)器人產(chǎn)業(yè)發(fā)展規(guī)劃》;今年1月,工信部等十七個(gè)部門(mén)又發(fā)布了《“機(jī)器人+”應(yīng)用行動(dòng)實(shí)施方案》;3月初,工信部相關(guān)負(fù)責(zé)人表示,將加快布局人形機(jī)器人、元宇宙、量子科技等前沿領(lǐng)域!
從中長(zhǎng)期看,在國(guó)家政策扶持下,國(guó)產(chǎn)機(jī)器人乃至數(shù)字化產(chǎn)業(yè)各細(xì)分領(lǐng)域,都有望具備國(guó)際競(jìng)爭(zhēng)力。但短期來(lái)看,這些領(lǐng)域所必須的智能算力,依然是掣肘因素。
算力分為三類(lèi),即通用算力、智能算力、超算算力。一般產(chǎn)業(yè)數(shù)字化的場(chǎng)景通用算力就可滿(mǎn)足,天體物理、航空航天等復(fù)雜運(yùn)算則需要超算算力,AI應(yīng)用及模型的訓(xùn)練和推理,對(duì)應(yīng)的是智算算力。
智算,又稱(chēng)異構(gòu)計(jì)算,相對(duì)于只用CPU的通用計(jì)算,在服務(wù)器里CPU+GPU就是異構(gòu)計(jì)算,當(dāng)然也可以根據(jù)應(yīng)用范圍采用不同的組合方式,如CPU + TPU、CPU+FPGA等。
從中國(guó)算力發(fā)展史看,最早可以追溯到中國(guó)首臺(tái)超算“銀河一號(hào)”誕生的1983年;2009—2011年,阿里、騰訊、華為先后入局云計(jì)算,是中國(guó)企業(yè)探索算力的起點(diǎn)。
2017年,國(guó)家發(fā)布了《新一代人工智能發(fā)展規(guī)劃》,這一年是AI商業(yè)化應(yīng)用的元年,也是中國(guó)智能算力發(fā)展的元年。
從彼時(shí)起,通用算力占比開(kāi)始下降,智能算力占比開(kāi)始逐漸增長(zhǎng)。
中國(guó)信通院數(shù)據(jù)顯示,2016年智能算力在中國(guó)算力中的占比僅為 3%,到2021 年占比已經(jīng)超過(guò)通用算力,達(dá)到 51%。
另?yè)?jù)IDC、清華全球產(chǎn)業(yè)院于2022年3月聯(lián)合發(fā)布的報(bào)告,過(guò)去5年中國(guó)AI計(jì)算首次超越美國(guó)成為全球第一,AI服務(wù)器支出規(guī)模同比增長(zhǎng)44.5%。
但必須指出的是,“智能算力占比超過(guò)通用算力”,“AI計(jì)算首次超越美國(guó)”的結(jié)論,都是基于AI服務(wù)器出貨量測(cè)算,并不是實(shí)際在用的數(shù)據(jù)。
在用數(shù)據(jù)如何呢?中國(guó)信通院的公開(kāi)數(shù)據(jù)表明:截至2022年底,全國(guó)在用數(shù)據(jù)中心機(jī)架總規(guī)模超過(guò)650萬(wàn)標(biāo)準(zhǔn)機(jī)架,算力總規(guī)模達(dá)到180EFLOPS,近五年年均增速超過(guò)了25%,位居全球第二,存力總規(guī)模超過(guò)1000 EB。當(dāng)前的算力規(guī)模中,有超過(guò)20%的算力是智能算力。
《中國(guó)算力指數(shù)發(fā)展白皮書(shū)(2022)》也顯示,中、美在全球算力規(guī)模中的份額分別為33%、34%,其中通用算力份額分別為26%、37%,智能算力分別為28%、45%,超級(jí)算力分別為18%、48%。
經(jīng)過(guò)六年的發(fā)展,中、美總算力規(guī)模近乎持平,通用算力差距也在不斷縮小,但智能算力、超級(jí)算力差距依然很大。
03、破籠解鎖,關(guān)鍵挑戰(zhàn)
智能算力不足,已經(jīng)嚴(yán)重制約了我國(guó)在AI領(lǐng)域的創(chuàng)新能力,成為算力增長(zhǎng)下的“隱傷”。
這一點(diǎn)也一直被業(yè)內(nèi)人士所憂(yōu)慮。如王恩東院士在2021年接受采訪(fǎng)時(shí)就曾提到:“雖然目前無(wú)法具體統(tǒng)計(jì)AI算力缺口數(shù)據(jù),但中國(guó)正在加速數(shù)字化轉(zhuǎn)型”。
言猶在耳,這一輪大模型引發(fā)的算力需求井噴,令“隱傷”再次放大。
其實(shí)國(guó)家對(duì)算力發(fā)展一向重視。2020 年 4 月,國(guó)家發(fā)改委明確新基建的范圍包含以智能計(jì)算中心為代表的算力基礎(chǔ)設(shè)施,算力供給基建化自此成為趨勢(shì)。
2021 年 5 月,《全國(guó)一體化大數(shù)據(jù)中心協(xié)同創(chuàng)新體系算力樞紐實(shí)施方案》頒布,提出布局全國(guó)算力網(wǎng)絡(luò)樞紐 節(jié)點(diǎn);2022 年 2 月 ,國(guó)家發(fā)改委等部門(mén)同意在京津冀、長(zhǎng)三角等 8 地啟動(dòng)國(guó)家算力樞紐節(jié)點(diǎn)建設(shè),“東數(shù)西算”工程全面啟動(dòng)。
據(jù)至頂智庫(kù)統(tǒng)計(jì),截至2023年2月,全國(guó)投入運(yùn)營(yíng)、在建的人工智能計(jì)算中心達(dá)23個(gè),其中上海成為首家智算超算雙中心。從合作方來(lái)看,華為、騰訊、百度等大廠都在積極參與。
智能算力規(guī)模也成倍增長(zhǎng)。
中國(guó)信通院數(shù)據(jù)顯示,2016-2021年6年間,AI服務(wù)器累計(jì)出貨量超過(guò)50萬(wàn)臺(tái),其中2021年就達(dá)到23萬(wàn)臺(tái);另?yè)?jù)TrendForce數(shù)據(jù),2022年全球AI服務(wù)器采購(gòu)量中,Google、AWS、Meta、Microsoft合計(jì)占比66.2%,字節(jié)、騰訊、阿里、百度的采購(gòu)占比分別為 6%、2.3%、1.5%、1.5%。
AI芯片目前以GPU為主。IDC數(shù)據(jù)顯示,國(guó)內(nèi)GPU服務(wù)器在2021年占國(guó)內(nèi)服務(wù)器市場(chǎng)規(guī)模的比例超過(guò)88.4%,英偉達(dá)的產(chǎn)品占比超80%。
問(wèn)題來(lái)了,AI服務(wù)器通常需要4枚-8枚GPU,僅以2021年的出貨量按最低配置計(jì)算,需要至少近65萬(wàn)枚英偉達(dá)GPU。但在美國(guó)2022年8月開(kāi)始的算力封鎖下,之后的訂單從何而來(lái)?至少也是縮水版。
這也是中國(guó)“破籠解鎖”,做強(qiáng)做大算力產(chǎn)業(yè)的關(guān)鍵挑戰(zhàn)。
一位國(guó)內(nèi)云計(jì)算從業(yè)人士表示,“在封鎖背景下國(guó)產(chǎn)替代勢(shì)在必行,但過(guò)程注定艱難”,“尤其是制程工藝的限制,美國(guó)去年限制是互聯(lián)帶寬超過(guò)600G,算力超過(guò)600T的產(chǎn)品,不能使用臺(tái)積電的先進(jìn)代工工藝”。
該人士解釋到:“就是國(guó)內(nèi)產(chǎn)品不能超過(guò)A100的規(guī)格,否則不能使用7nm或者5nm的生產(chǎn)工藝”,“目前國(guó)內(nèi)有7nm產(chǎn)品的只有中芯國(guó)際,但從成熟度和產(chǎn)品產(chǎn)能上都和臺(tái)積電有差距”。
不過(guò)這位人士認(rèn)為,即使有差距,國(guó)內(nèi)公司也會(huì)陸續(xù)通過(guò)中芯國(guó)際的生產(chǎn)工藝去生產(chǎn)相關(guān)芯片,并通過(guò)chiplet等先進(jìn)的封裝工藝將多個(gè)7nm芯片高速互聯(lián),實(shí)現(xiàn)算力的提升。
實(shí)際上,高性能計(jì)算芯片也不止GPU這個(gè)處理架構(gòu)。如像寒武紀(jì)的ASIC和GPU是同樣的應(yīng)用場(chǎng)景,只是技術(shù)架構(gòu)不一樣。而算力芯片,不光只有GPU,也包含ASIC、FPGA芯片。
因此業(yè)界認(rèn)為,美國(guó)封鎖其實(shí)有利于國(guó)內(nèi)廠商,如海光信息、寒武紀(jì)等獲得更多市場(chǎng)份額,從而加速?lài)?guó)產(chǎn)替代進(jìn)程。另外,隨著大模型部署成熟,對(duì)性能要求稍低的推理芯片的占比將日益提升,也有益于國(guó)產(chǎn)AI芯片占比提升。
同時(shí)英偉達(dá)中國(guó)市場(chǎng)特供產(chǎn)品A800、H800,雖然性能有所縮水,但在一定程度上緩解了眼下算力供給的壓力,給自主替代留下了緩沖時(shí)間。
資料來(lái)源:公開(kāi)信息
當(dāng)下,H800正在被阿里、騰訊、百度等大廠云計(jì)算部門(mén)使用。如騰訊云發(fā)布的面向大模型訓(xùn)練的新一代HCC高性能計(jì)算集群,就全面搭載了 H800,互聯(lián)帶寬達(dá)到了目前業(yè)界最高的3.2T。
從長(zhǎng)遠(yuǎn)來(lái)看,據(jù)國(guó)家信息中心,未來(lái) 80%的場(chǎng)景都將基于人工智能,算力主要由智算中心提供。所以,堅(jiān)持算力國(guó)產(chǎn)化,才能最終破局。
為此,今年3月科技部頒布了“公共算力平臺(tái)的建設(shè)指引”,要求在公共算力平臺(tái)中,自主研發(fā)芯片所提供的算力標(biāo)稱(chēng)值占比不低于 60%,國(guó)產(chǎn)開(kāi)發(fā)框架使用率不低于 60%。
從AI服務(wù)器產(chǎn)業(yè)鏈看,浪潮、聯(lián)想、新華三等國(guó)內(nèi)廠商的產(chǎn)品已經(jīng)占到全球市場(chǎng)30%以上的份額;支撐服務(wù)器的基礎(chǔ)軟件環(huán)節(jié),像阿里、騰訊、百度的操作系統(tǒng),也都是基于開(kāi)源自主研發(fā);數(shù)據(jù)庫(kù)方面,集中式數(shù)據(jù)庫(kù)國(guó)外品牌占據(jù)了市場(chǎng)份額90%以上,但分布式數(shù)據(jù)庫(kù)國(guó)內(nèi)外已經(jīng)基本相當(dāng)。
所以,制約中國(guó)算力發(fā)展的主要瓶頸,還是以CPUGPU為代表的芯片短板,英特爾、英偉達(dá)在國(guó)內(nèi)還占據(jù)著較高的市場(chǎng)份額,ChatGPT大模型+CPUGPU芯片的技術(shù)壟斷新聯(lián)盟也初步形成。
因此,如果說(shuō)“智算中心被納入新基建”是新計(jì)算時(shí)代的算力突圍,如今兩年過(guò)去了,這場(chǎng)突圍戰(zhàn)再次打響,或從未結(jié)束。這是一場(chǎng)硬仗。