中國移動今年將商用三個自主可控萬卡集群,總規(guī)模近6萬張GPU卡

C114訊  4月28日消息 今天上午,以“算力網絡點亮AI新時代”為主題的中國移動算力網絡大會在蘇州開幕。

中國移動副總經理高同慶在會上作了題為《打造大國算網重器,開啟AI+時代新篇》的主旨演講!

高同慶指出,中國移動將持續(xù)優(yōu)化算力網絡資源總體布局,面向AI+升級,今年將商用哈爾濱、呼和浩特、貴陽三個自主可控萬卡集群,總規(guī)模近6萬張GPU卡,充分滿足大模型集中訓練需求;隨著大模型訓練逐漸轉向大規(guī)模行業(yè)應用,泛在的推理需求持續(xù)涌現(xiàn),中國移動將按需在1500個邊緣節(jié)點部署推理算力,形成“中心大集群、邊緣廣分布、中訓邊推、訓推一體”的智算網絡。

同時,中國移動將持續(xù)完善技術體系,推進全棧技術創(chuàng)新。

一是突破堵點,加快邁向超萬卡集群。面向機間互聯(lián),原創(chuàng)提出全調度以太技術體系(GSE),構建無阻塞、高帶寬、超低時延的新型智算中心網絡,對標國際主流的IB和UEC方案,形成中國自主的技術體系,今年將開展GSE中試,加速GSE關鍵技術和產業(yè)成熟;面向卡間互聯(lián),打造標準開放總線級互聯(lián)架構,提升GPU卡間高帶寬、低時延通信能力,實現(xiàn)互聯(lián)拓撲和協(xié)議的全棧級優(yōu)化,為標準開放的新型智算互聯(lián)貢獻中國方案。

二是多元異構,構建融合開放的大算力生態(tài)。持續(xù)推進一云多芯的多樣算力,打破AI芯片生態(tài)豎井,今年將升級“芯合”算力原生平臺,支持智算應用在更多GPU芯片的快速遷移,同時還支持面向大模型的分布式異構混訓,打破當前大模型僅能在單廠家單型號集群訓練的局限。中國移動將進一步實現(xiàn)云底座關鍵技術突破,升級“大云天元”操作系統(tǒng),商用推廣云原生數(shù)據(jù)庫、新一代SDN網絡,也會推出新一代磐石DPU,打造一機多芯的磐石服務器,全面使能多樣化智能算力。

三是訓推一體,打造開箱即用AI服務。自研智算平臺,打造模型訓練“自動化生產線”,實現(xiàn)AI模型全生命周期服務,支持全棧、全自主可控、全地域的資源統(tǒng)一管理調度,提供一站式開發(fā)工具箱,支持萬卡并行訓練、千卡15天以上穩(wěn)定訓練、分鐘級斷點續(xù)訓,確保大模型訓得好、快、穩(wěn)。


微信掃描分享本文到朋友圈
掃碼關注5G通信官方公眾號,免費領取以下5G精品資料
  • 1、回復“YD5GAI”免費領取《中國移動:5G網絡AI應用典型場景技術解決方案白皮書
  • 2、回復“5G6G”免費領取《5G_6G毫米波測試技術白皮書-2022_03-21
  • 3、回復“YD6G”免費領取《中國移動:6G至簡無線接入網白皮書
  • 4、回復“LTBPS”免費領取《《中國聯(lián)通5G終端白皮書》
  • 5、回復“ZGDX”免費領取《中國電信5GNTN技術白皮書
  • 6、回復“TXSB”免費領取《通信設備安裝工程施工工藝圖解
  • 7、回復“YDSL”免費領取《中國移動算力并網白皮書
  • 8、回復“5GX3”免費領取《R1623501-g605G的系統(tǒng)架構1
  • 本周熱點本月熱點

     

      最熱通信招聘

      最新招聘信息