中國電信基于800G WDM現(xiàn)網(wǎng)完成業(yè)界首例千卡分布式無損智算網(wǎng)驗證

近日,由中國電信集團公司統(tǒng)一組織,中國電信研究院、中國電信北京公司、天翼云公司共同參與,在中國電信現(xiàn)網(wǎng)基于800G C+L技術,為1024卡規(guī)模的分布式集群提供大容量帶寬,實現(xiàn)120公里千億參數(shù)大模型分布式訓練,性能達到集中訓練的95%以上,重點驗證了大帶寬、高可靠和高效率的光傳輸網(wǎng)絡可為智算互聯(lián)構建堅實底座。

當前,隨著智算卡數(shù)達到千卡、甚至萬卡,所需帶寬往往高達百T比特級、甚至超P比特級。因此,光傳輸系統(tǒng)的大帶寬、高可靠與高效率的特點是保證分布式訓練高算效的關鍵。針對數(shù)據(jù)傳輸?shù)拇髱拞栴},采用高階調制格式的單波長800G技術以提高頻譜效率,配合當前的業(yè)界熱點的C+L波段技術實現(xiàn)超大傳輸帶寬,在中國電信武清與潤澤機房之間采用華為公司傳輸設備,通過多次環(huán)回構建了大帶寬互聯(lián)的智算驗證網(wǎng),距離達到120km;針對數(shù)據(jù)傳輸?shù)母呖煽繂栴},完成了鏈路誤碼、波長故障、光纖故障等異常測試試驗,結果表明,一個800G業(yè)務波中斷會導致超40%的算效降低,而百毫秒級以上光纖故障會導致算效大幅下降甚至訓練中斷,采用WSON重路由恢復技術,此次在兩點間將重路由恢復時間控制在50ms以內(nèi),可保證分布式智算業(yè)務的高可靠互聯(lián),最大程度釋放算效;針對傳輸鏈路的高效率問題,中國電信提出分鐘級波長動態(tài)拆建解決方案來實現(xiàn)算與網(wǎng)的協(xié)同分時復用,有效提升網(wǎng)絡資源利用率。此次驗證為跨地域、跨層級、跨主體高可靠的算力協(xié)同調度奠定基礎,標志著中國電信“云網(wǎng)融合”工作再上新臺階。

未來,中國電信將不斷創(chuàng)新,繼續(xù)踐行“以網(wǎng)強算”的技術路線,通過大帶寬、高可靠和高效率的光傳輸網(wǎng)絡建設打造智算互聯(lián)光層底座,加快推進云網(wǎng)融合一體化數(shù)字基礎設施建設,走出一條具備中國電信特色的新型智算基礎設施發(fā)展道路,賦能千行百業(yè)智能化升級。


微信掃描分享本文到朋友圈
掃碼關注5G通信官方公眾號,免費領取以下5G精品資料
  • 1、回復“YD5GAI”免費領取《中國移動:5G網(wǎng)絡AI應用典型場景技術解決方案白皮書
  • 2、回復“5G6G”免費領取《5G_6G毫米波測試技術白皮書-2022_03-21
  • 3、回復“YD6G”免費領取《中國移動:6G至簡無線接入網(wǎng)白皮書
  • 4、回復“LTBPS”免費領取《《中國聯(lián)通5G終端白皮書》
  • 5、回復“ZGDX”免費領取《中國電信5GNTN技術白皮書
  • 6、回復“TXSB”免費領取《通信設備安裝工程施工工藝圖解
  • 7、回復“YDSL”免費領取《中國移動算力并網(wǎng)白皮書
  • 8、回復“5GX3”免費領取《R1623501-g605G的系統(tǒng)架構1
  • 本周熱點本月熱點

     

      最熱通信招聘

      最新招聘信息