6月18日,“多樣性算力產(chǎn)業(yè)峰會(huì)2024”在北京召開。中國(guó)工程院鄭緯民院士、中國(guó)移動(dòng)研究院副院長(zhǎng)段曉東、北京市科學(xué)技術(shù)委員會(huì)、中關(guān)村管委會(huì)信息處主任韓健,聯(lián)合19家產(chǎn)業(yè)合作伙伴啟動(dòng)“北京全向智感OISA協(xié)同創(chuàng)新平臺(tái)”,共建國(guó)內(nèi)GPU開放互聯(lián)生態(tài),并發(fā)布全球首個(gè)GPU卡間互聯(lián)開放協(xié)議OISA和交換芯片原型。
中國(guó)移動(dòng)研究院副院長(zhǎng)段曉東對(duì)OISA進(jìn)行了介紹。OISA(Omni-directional Intelligent Sensing Express Architecture,全向智感互聯(lián))是中國(guó)移動(dòng)原創(chuàng)提出的GPU卡間互聯(lián)協(xié)議體系。當(dāng)前,隨著大模型向萬億參數(shù)演進(jìn),模型性能和泛化能力進(jìn)一步增強(qiáng),推動(dòng)底層智算基礎(chǔ)設(shè)施向“超節(jié)點(diǎn)”形態(tài)升級(jí),這對(duì)大規(guī)模GPU卡間互聯(lián)的兼容性、傳輸效率、時(shí)延等關(guān)鍵指標(biāo)提出了高要求。
當(dāng)前,國(guó)內(nèi)GPU芯片均采用私有化的互聯(lián)方案,在互聯(lián)規(guī)模、拓?fù)洹、時(shí)延等方面,距離國(guó)際先進(jìn)方案有較大差距,且未有超節(jié)點(diǎn)產(chǎn)品發(fā)布。目前產(chǎn)業(yè)正在積極探索開放技術(shù)路線,共同制定GPU卡間互聯(lián)標(biāo)準(zhǔn)。
OISA最早由中國(guó)移動(dòng)提出,旨在聯(lián)合產(chǎn)業(yè)解決GPU卡間開放互聯(lián)問題。OISA主要包括四大設(shè)計(jì)理念,包括“大規(guī)模GPU對(duì)等互”“極致報(bào)文格式”“數(shù)據(jù)層流控和重傳”以及“高效物理傳輸”,核心思想是為GPU卡間互聯(lián)提供開放的高帶寬、低時(shí)延解決方案。本次峰會(huì)發(fā)布“OISA G1協(xié)議”并推出“OISA交換芯片原型”。OISA G1的設(shè)計(jì)規(guī)格支持128張GPU通過8個(gè)Switch芯片互聯(lián),任意卡間點(diǎn)對(duì)點(diǎn)帶寬達(dá)到800GB/s,每個(gè)Switch芯片支持128個(gè)端口,芯片總速率達(dá)到51.2T。
解決GPU卡間互聯(lián)問題不僅需要單點(diǎn)技術(shù)的突破,更需要GPU芯片、Switch芯片、服務(wù)器整機(jī)廠家以及超級(jí)用戶的聯(lián)合攻關(guān)。接下來,中國(guó)移動(dòng)將聯(lián)合北京市科委、中關(guān)村管委會(huì),依托“北京全向智感OISA協(xié)同創(chuàng)新平臺(tái)”,聯(lián)合更廣泛的智算產(chǎn)業(yè)鏈企業(yè)進(jìn)一步細(xì)化協(xié)議、完善設(shè)計(jì),并開展協(xié)議驗(yàn)證和適配工作。未來,OISA將通過IP開放的形式鼓勵(lì)GPU芯片集成高速互聯(lián)接口,提升研發(fā)效率,幫助國(guó)產(chǎn)GPU芯片快速邁向下一代智算設(shè)施的能力建設(shè)。
中國(guó)移動(dòng)將全面擁抱“AI+”時(shí)代,通過開放OISA協(xié)議凝聚產(chǎn)業(yè)共識(shí),共同牽引AI產(chǎn)業(yè)全面升級(jí)。擘畫開放互聯(lián)輝煌明天,釋放智算潛能嶄新時(shí)代。