近日,中國移動(dòng)在“2024中國算力大會(huì)”正式發(fā)布了廣域高吞吐100Gbps網(wǎng)卡 ― HP-WAN NIC,實(shí)現(xiàn)海量數(shù)據(jù)廣域高效傳輸,這是中國移動(dòng)打造算網(wǎng)一體原創(chuàng)技術(shù)策源地的又一重大突破。為此,C114采訪了中國移動(dòng)研究院段曉東副院長,詳細(xì)介紹了中國移動(dòng)廣域高吞吐創(chuàng)新成果的設(shè)計(jì)理念和創(chuàng)新歷程,并對(duì)未來算力網(wǎng)絡(luò)產(chǎn)業(yè)發(fā)展提出建議。
中國移動(dòng)研究院副院長段曉東
Q1:您好,我們了解到當(dāng)前國家正在大力推進(jìn)“東數(shù)西算”等重大戰(zhàn)略工程,請(qǐng)問廣域高吞吐是服務(wù)于這些重大戰(zhàn)略需求嗎?這些技術(shù)在其中如何發(fā)揮作用?
段曉東:正如您所說,當(dāng)前數(shù)據(jù)已成為國家的戰(zhàn)略性資源,算力成為數(shù)字經(jīng)濟(jì)時(shí)代的核心生產(chǎn)力,國家相繼出臺(tái)了“數(shù)字中國”、“東數(shù)西算”等重大戰(zhàn)略,大力發(fā)展新質(zhì)生產(chǎn)力,促進(jìn)我國經(jīng)濟(jì)社會(huì)高質(zhì)量發(fā)展。
中國移動(dòng)積極響應(yīng)國家號(hào)召,提出“算力網(wǎng)絡(luò)”全新發(fā)展理念,并圍繞基礎(chǔ)設(shè)施構(gòu)建、算網(wǎng)應(yīng)用賦能、技術(shù)創(chuàng)新引領(lǐng)三條主線開展攻關(guān)。今天發(fā)布的廣域高吞吐100Gbps網(wǎng)卡(HP-WAN NIC)正是中國移動(dòng)立足于國家重大戰(zhàn)略,推進(jìn)算力網(wǎng)絡(luò)系統(tǒng)性建設(shè)過程中取得的重要成果,可以滿足科學(xué)計(jì)算、東數(shù)西存、東數(shù)西訓(xùn)等算力網(wǎng)絡(luò)典型應(yīng)用場(chǎng)景的海量數(shù)據(jù)廣域網(wǎng)高效傳輸需求。
Q2:本次發(fā)布的廣域高吞吐創(chuàng)新成果有哪些亮點(diǎn)和“黑科技”?
段曉東:這次發(fā)布的廣域高吞吐100Gbps高性能網(wǎng)卡可以在16000公里超長距、0.1%高丟包率的廣域網(wǎng)環(huán)境下,達(dá)到90Gbps以上的數(shù)據(jù)傳輸性能,較當(dāng)前業(yè)界最高水平提升了30%,創(chuàng)造了新的世界紀(jì)錄,意味著中國任意兩地只要部署了這款網(wǎng)卡并開通網(wǎng)絡(luò)服務(wù),就可以實(shí)現(xiàn)超高速、高品質(zhì)的海量數(shù)據(jù)傳輸。
這項(xiàng)成果的創(chuàng)新源頭來自于中國移動(dòng)原創(chuàng)提出的廣域高吞吐協(xié)議棧,通過四項(xiàng)核心技術(shù)實(shí)現(xiàn)“高通量”、“高可靠”、“低算耗”和“易部署”等特性,突破傳統(tǒng)數(shù)據(jù)傳輸方案在廣域網(wǎng)面臨的性能瓶頸,實(shí)現(xiàn)“分鐘級(jí)”部署開通和“分鐘級(jí)”TB數(shù)據(jù)傳輸。
一是增強(qiáng)RDMA協(xié)議(URDMA),使得吞吐性能不受服務(wù)器性能影響,大幅降低算力消耗;二是基于參考速率的擁塞控制算法(RRCC),有效增強(qiáng)了抗丟包能力,使得弱網(wǎng)環(huán)境下仍能進(jìn)行高速率傳輸;三是計(jì)時(shí)計(jì)數(shù)雙維度選擇性重傳機(jī)制(TC-SACK),使得數(shù)據(jù)傳輸性能不受傳輸距離限制,超長距離下有效吞吐不衰減;四是快速丟包恢復(fù)機(jī)制(P-FEC),提升傳輸可靠性的同時(shí)降低了長距傳輸尾時(shí)延,顯著擴(kuò)展了網(wǎng)卡的環(huán)境適配性。此外,網(wǎng)卡可靈活部署,不需要現(xiàn)網(wǎng)升級(jí),不需要新增網(wǎng)元,可以在包括國產(chǎn)服務(wù)器在內(nèi)多種服務(wù)器、多種操作系統(tǒng)上便捷部署。
Q3:請(qǐng)問廣域高吞吐這項(xiàng)創(chuàng)新成果將如何應(yīng)用?會(huì)對(duì)產(chǎn)業(yè)產(chǎn)生怎樣的影響?
段曉東:2020年起,中國移動(dòng)就開展了廣域高吞吐相關(guān)技術(shù)創(chuàng)新研究,并結(jié)合真實(shí)業(yè)務(wù)進(jìn)行了場(chǎng)景驗(yàn)證。2023年10月,我們聯(lián)合相關(guān)天文機(jī)構(gòu),在業(yè)界首次實(shí)現(xiàn)了貴州到北京2200公里大規(guī)模天文數(shù)據(jù)穩(wěn)定傳輸,創(chuàng)新成果榮獲2024年信息社會(huì)世界峰會(huì) (WSIS) 最高項(xiàng)目獎(jiǎng)。今年5月,中國移動(dòng)正式成立“算網(wǎng)一體”中試戰(zhàn)隊(duì),結(jié)合基因測(cè)序、云間數(shù)據(jù)同步、異地辦公、影視制作等更加豐富的業(yè)務(wù)進(jìn)行現(xiàn)網(wǎng)試點(diǎn)驗(yàn)證。其中,哈爾濱到貴州5000公里云間數(shù)據(jù)同步的測(cè)試案例可以在100Gbps物理帶寬實(shí)現(xiàn)70Gbps有效吞吐,較傳統(tǒng)方案提升5倍。
可以看到,廣域高吞吐創(chuàng)新成果能夠服務(wù)和支撐多元化的算力網(wǎng)絡(luò)應(yīng)用場(chǎng)景,當(dāng)前已成為產(chǎn)業(yè)剛需。本次廣域高吞吐創(chuàng)新成果的發(fā)布是中國移動(dòng)推進(jìn)廣域高吞吐技術(shù)落地應(yīng)用的又一個(gè)重要里程碑,將為產(chǎn)業(yè)界面向數(shù)據(jù)遷移備份、大數(shù)據(jù)協(xié)同計(jì)算、智算中心互聯(lián)等場(chǎng)景廣域網(wǎng)數(shù)據(jù)高效傳輸需求提供端到端高效解決方案,切實(shí)助力“東數(shù)西算”等戰(zhàn)略工程實(shí)施。
Q4:面向未來,中國移動(dòng)在算力網(wǎng)絡(luò)工程和技術(shù)研究方面如何謀篇布局,還有哪些創(chuàng)新的思路?
段曉東:未來,算力需求指數(shù)級(jí)增長,對(duì) AI基礎(chǔ)設(shè)施帶來極大挑戰(zhàn)。一方面,受限于機(jī)房空間、電力、散熱等問題,智算中心單點(diǎn)算力規(guī)模難以為繼;另一方面,受限于網(wǎng)絡(luò)通信性能,大規(guī)模分布式GPU集群的計(jì)算效率難以線性增長。為破解智算基礎(chǔ)設(shè)施供給難題,中國移動(dòng)將以網(wǎng)絡(luò)為基礎(chǔ)融合計(jì)算架構(gòu)和范式,面向互聯(lián)網(wǎng)協(xié)議棧在網(wǎng)絡(luò)層引入計(jì)算因子,原創(chuàng)算力路由、在網(wǎng)計(jì)算技術(shù);在傳輸層增強(qiáng)擁塞控制,策源廣域高吞吐技術(shù);在應(yīng)用層構(gòu)建一體化編排調(diào)度,提出算網(wǎng)數(shù)字孿生技術(shù)。我們將深入研究算網(wǎng)一體架構(gòu)和關(guān)鍵技術(shù),構(gòu)建具備網(wǎng)內(nèi)計(jì)算功能可重構(gòu)、算網(wǎng)融合統(tǒng)一計(jì)算范式、網(wǎng)絡(luò)模態(tài)自適應(yīng)等多維屬性的算網(wǎng)一體廣域智算互聯(lián)技術(shù)體系,賦能無處不在的網(wǎng)絡(luò)資源,彌補(bǔ)小規(guī)模智能計(jì)算的差距,提升整網(wǎng)智算利用率。
Q5:中國移動(dòng)在廣域高吞吐等算力網(wǎng)絡(luò)核心技術(shù)方向取得了引領(lǐng)性成果,請(qǐng)您基于現(xiàn)有經(jīng)驗(yàn)以及創(chuàng)新實(shí)踐,對(duì)于未來幾年行業(yè)發(fā)展提出建議?
段曉東:算力網(wǎng)絡(luò)既是一個(gè)宏大的基礎(chǔ)設(shè)施,也是一個(gè)復(fù)雜的科學(xué)命題,更是信息通信領(lǐng)域全面融合創(chuàng)新的系統(tǒng)工程。中國移動(dòng)愿意攜手產(chǎn)學(xué)研各界伙伴合力推進(jìn)包括廣域高吞吐在內(nèi)的算力網(wǎng)絡(luò)技術(shù)創(chuàng)新和產(chǎn)業(yè)應(yīng)用。在此提出三點(diǎn)建議:
一是加強(qiáng)原創(chuàng)技術(shù)攻關(guān)。積極融入國家科創(chuàng)大局,充分利用國家算力網(wǎng)絡(luò)策源地、聯(lián)合體、國家重點(diǎn)研發(fā)計(jì)劃等資源,加強(qiáng)基礎(chǔ)根技術(shù)創(chuàng)新和核心技術(shù)攻關(guān),提升原創(chuàng)技術(shù)需求牽引、源頭供給、資源配置、轉(zhuǎn)化應(yīng)用能力,實(shí)現(xiàn)算力網(wǎng)絡(luò)技術(shù)自主可控的同時(shí),努力在國際上輸出中國技術(shù)方案。
二是合力構(gòu)建統(tǒng)一標(biāo)準(zhǔn)體系。當(dāng)前算力網(wǎng)絡(luò)領(lǐng)域多個(gè)技術(shù)方向均存在多種技術(shù)路線共存的局面,需協(xié)同產(chǎn)學(xué)研各方,加強(qiáng)國際交流,共同探討算力網(wǎng)絡(luò)標(biāo)準(zhǔn)化方案,構(gòu)建統(tǒng)一的國內(nèi)外標(biāo)準(zhǔn)體系。中國移動(dòng)在算力路由、全調(diào)度以太等方向正積極推動(dòng)標(biāo)準(zhǔn)體系構(gòu)建,同時(shí),在IETF也啟動(dòng)了廣域高吞吐(HP-WAN)技術(shù)的標(biāo)準(zhǔn)化探索,歡迎業(yè)界更多伙伴關(guān)注并合力貢獻(xiàn)。
三是推進(jìn)構(gòu)建健康產(chǎn)業(yè)生態(tài)。發(fā)揮我國算網(wǎng)設(shè)施和市場(chǎng)需求優(yōu)勢(shì),匯聚技術(shù)、產(chǎn)業(yè)、資源、用戶四類要素,加速產(chǎn)業(yè)協(xié)同創(chuàng)新,構(gòu)建全產(chǎn)業(yè)創(chuàng)新鏈,突破算力網(wǎng)絡(luò)“卡脖子”技術(shù),實(shí)現(xiàn)供應(yīng)鏈安全可控。構(gòu)建包括數(shù)據(jù)快遞、任務(wù)式服務(wù)等新業(yè)態(tài),為產(chǎn)業(yè)升級(jí)和融合發(fā)展提供新動(dòng)能。