11月30日,由中國通信學(xué)會主辦、中國移動研究院承辦的2024中國信息通信大會“算力網(wǎng)絡(luò)算網(wǎng)一體創(chuàng)新發(fā)展論壇 ”在成都舉行。在這個重要的論壇上,中國移動研究院副院長段曉東聯(lián)手華為、瀚博、澎峰、海光、天數(shù)智芯等7家產(chǎn)業(yè)合作伙伴,鄭重發(fā)布了智算“芯合”算力原生基礎(chǔ)軟件棧2.0。
芯片是智算生態(tài)的基石,基礎(chǔ)軟件棧是其核心。然而,隨著近年來多樣化異構(gòu)智算芯片的不斷涌現(xiàn),產(chǎn)業(yè)界形成了多套“AI框架+工具鏈+硬件”的軟硬一體豎井生態(tài)。由于上層應(yīng)用與底層芯片的深度綁定,形成了應(yīng)用無法靈活遷移的狀況,智算產(chǎn)業(yè)面臨的主要挑戰(zhàn)是基礎(chǔ)軟件棧多而不優(yōu),生態(tài)互不兼容,制約了異構(gòu)智能算力整體效能的釋放。
為屏蔽異構(gòu)硬件差異、融通智算豎井生態(tài),中國移動充分發(fā)揮移動信息現(xiàn)代產(chǎn)業(yè)鏈“鏈長”職責(zé),以智算基礎(chǔ)軟件棧為攻關(guān)要點,于2022年創(chuàng)新提出算力原生CAMA原創(chuàng)技術(shù),發(fā)布業(yè)內(nèi)首個《面向智算的算力原生白皮書》,并于2023年研發(fā)并發(fā)布“芯合”算力原生基礎(chǔ)軟件棧1.0。
此次發(fā)布會上,中國移動研究院副院長段曉東重磅發(fā)布了以下三大升級內(nèi)容。首先是能力升級,全面重構(gòu)算力抽象模型,插件化靈活接入英偉達、華為、海光等6家AI芯片,拓展ONNX、SYCL等更多編程范式,支持泛AI應(yīng)用的跨芯遷移。其次是性能升級,新增對標CUDA的DNN、BLAS等高性能計算庫,提供圖算融合編譯優(yōu)化能力,實現(xiàn)性能大幅提升,當(dāng)前應(yīng)用跨架構(gòu)遷移損耗已降低至10%以內(nèi)。最后是效率升級,構(gòu)建面向智算應(yīng)用的“跨架構(gòu)軟件工廠”,提供統(tǒng)一開發(fā)、調(diào)試、優(yōu)化、部署、遷移全生命周期服務(wù)能力,縮短應(yīng)用開發(fā)、上線時間,提升整體研發(fā)效率。
“芯合”算力原生基礎(chǔ)軟件棧2.0已實現(xiàn)泛AI應(yīng)用在英偉達、Intel、華為、瀚博、天數(shù)智芯、海光6家智算芯片間的一鍵式跨芯流轉(zhuǎn)遷移。源源轉(zhuǎn)換效率>95%,遷移性能損耗<10%,遷移時間<20s,已具備規(guī)模商用條件,未來將在提升智能算力網(wǎng)絡(luò)自主可控水平方面發(fā)揮重要作用。
展望未來,中國移動將繼續(xù)秉持開放合作的態(tài)度,與產(chǎn)業(yè)各界合作伙伴一起攻關(guān),進一步完善“芯合”算力原生平臺功能,支撐更多業(yè)務(wù)場景、融通更多異構(gòu)芯片,推動商用落地,真正打造以基礎(chǔ)軟件棧引領(lǐng)智算生態(tài)建設(shè)的全“芯”發(fā)展范式,全面支撐我國算力強國戰(zhàn)略落地。
在面對瞬息萬變的市場變革時,中國移動愿意扮演推動者和領(lǐng)導(dǎo)者的角色,帶領(lǐng)國內(nèi)外伙伴共同推動智算產(chǎn)業(yè)的健康繁榮發(fā)展。相信在不久的將來,我們將會看到一個以合作為基礎(chǔ),以創(chuàng)新為動力,以智算生態(tài)建設(shè)為支撐的新型計算力大國。