伴隨著通信網(wǎng)絡(luò)向云原生架構(gòu)的持續(xù)演進(jìn),SBC的虛擬化已經(jīng)成為業(yè)界共識(shí)。SBC虛擬化具有以下特點(diǎn):
適應(yīng)通信網(wǎng)絡(luò)發(fā)展的“新常態(tài)”。近年來,運(yùn)營(yíng)商面臨著語(yǔ)音業(yè)務(wù)資費(fèi)持續(xù)下降,營(yíng)業(yè)收入不斷萎縮的困境,為了降低建設(shè)和運(yùn)維成本,支持業(yè)務(wù)按需快速部署,迫切需要實(shí)現(xiàn)資源集中和共享,虛擬化作為電信網(wǎng)絡(luò)的主流演進(jìn)策略,越來越受到業(yè)界的高度重視。
具有統(tǒng)一/通用硬件、分布式軟件和按需分配資源等優(yōu)點(diǎn)。虛擬化網(wǎng)元可運(yùn)行在通用硬件平臺(tái)上,實(shí)現(xiàn)傳統(tǒng)電信功能的軟硬件解耦;可支持硬件資源共享,CT/IT硬件實(shí)現(xiàn)最大程度統(tǒng)一; 媒體面可根據(jù)業(yè)務(wù)發(fā)展靈活申請(qǐng)資源,有效提高網(wǎng)絡(luò)資源利用率。
綜合成本低于物理SBC。虛擬化SBC硬件的采購(gòu)成本和使用成本(功耗)約為傳統(tǒng)SBC硬件的1.2倍,但支持彈性伸縮特性,據(jù)統(tǒng)計(jì)數(shù)據(jù)顯示,其24小時(shí)內(nèi)的平均資源利用率約為63.3%,因此綜合成本僅為后者的75%-80%。
但是,現(xiàn)有基于CPU的虛擬化SBC的TC能力有限,無法滿足大規(guī)模接入用戶的需求,這一缺陷嚴(yán)重制約了虛擬化SBC的應(yīng)用。為了解決這個(gè)問題,中興通訊順應(yīng)虛擬化技術(shù)發(fā)展趨勢(shì),創(chuàng)造性地采用異構(gòu)加速方法,引入基于CPU和GPU的虛擬化SBC(以下簡(jiǎn)稱為vSBC)架構(gòu),充分發(fā)揮GPU硬件的能力,有效克服TC能力不足的“瓶頸”,從而為虛擬化SBC的普及奠定了基礎(chǔ)。
GPU加速方法介紹
典型的SBC網(wǎng)元集成了信令處理、媒體處理和TC轉(zhuǎn)碼三種實(shí)體單元,具體地說,它包括了用戶接入、呼叫處理、eSRVCC切換、緊急呼叫、網(wǎng)間互通和WebRTC等十多種媒體處理和相應(yīng)的信令控制功能。
在這些功能中,TC轉(zhuǎn)碼是最主要的資源消耗“大戶”,大約會(huì)占用一半以上的系統(tǒng)資源,因此硬件加速技術(shù)必不可少。但是面對(duì)種類如此繁多的需求,僅僅依靠CPU是難以滿足的,必須通過CPU和GPU的聯(lián)動(dòng)才有可能較好地支持。
一般來說,虛擬化網(wǎng)絡(luò)的CPU是珍貴資源,因此將TC等計(jì)算邏輯較復(fù)雜、算法變更頻繁的業(yè)務(wù)分配給GPU/FPGA等加速硬件是最佳選擇,而對(duì)于轉(zhuǎn)發(fā)等低功耗、高轉(zhuǎn)發(fā)、低時(shí)延、計(jì)算邏輯簡(jiǎn)單、算法變更較小的業(yè)務(wù),目前暫不需要采用硬件加速。
中興通訊vSBC的系統(tǒng)架構(gòu)如圖1所示。
圖1 基于GPU的硬件加速系統(tǒng)架構(gòu)
中興通訊vSBC采用Nvidia公司的通用GPU系列卡,具有通用硬件、通用API、可共享等特點(diǎn),各廠商可通過開放接口共享使用。
該GPU系列卡采用PCIe G3硬件接口和CUDA API通用軟件接口,具有核數(shù)多(大于3000核)、主頻高、邏輯計(jì)算單元少等特點(diǎn),可支持虛擬化和多廠家多應(yīng)用共享。其最大功耗僅為 250W,尺寸為 PCIe 全高全長(zhǎng),采用風(fēng)扇散熱方式,適合TC等需要大規(guī)模并行計(jì)算的應(yīng)用,還可用于MEC、視頻、大數(shù)據(jù)、加密、壓縮和AI等場(chǎng)景。
在硬件方面,該GPU系列卡可以插入通用架式服務(wù)器;在軟件方面,該GPU系列卡可以支持OpenStack P、Q版本、Linux和KVM等OS環(huán)境。
中興通訊vSBC在數(shù)量、功耗、空間和成本方面具有絕對(duì)優(yōu)勢(shì)。通過采用基于GPU的TC硬件加速,中興通訊vSBC的綜合成本比僅采用基于CPU的虛擬化SBC降低50%以上,同時(shí)服務(wù)器數(shù)量得以減少,采購(gòu)復(fù)雜度可明顯降低。
按照通用的VoLTE話務(wù)模型(400萬(wàn)用戶典型配置),這兩種方法(分別簡(jiǎn)稱為GPU和CPU)所需的TC資源和整機(jī)資源(采用架式服務(wù)器)的數(shù)量對(duì)比如圖2所示。
圖2 GPU和CPU兩種方法所需的資源對(duì)比
中興通訊vSBC對(duì)資源池的建設(shè)和管理基本上是“零”要求,而且還可以根據(jù)需要增加GPU卡資源或建設(shè)加速資源池。
中興通訊vSBC新增了加速器及虛擬加速器資源模塊,當(dāng)發(fā)現(xiàn)含有加速硬件的主機(jī)/刀片時(shí),NFVI將相應(yīng)能力上報(bào)給VIM,由VIM對(duì)所有主機(jī)/刀片進(jìn)行管理(包括資源配置、資源分配、資源釋放、信息管理、性能管理等),以實(shí)現(xiàn)加速資源的虛擬化。
相應(yīng)的資源池部署方式分為兩種:一種是加速硬件和通用硬件分離,另一種是加速硬件和通用硬件合一,分別適用于不同應(yīng)用場(chǎng)景,如圖3所示。
圖3 兩種資源池部署方式
由于信令處理和媒體處理對(duì)時(shí)延的敏感度不同,兩者一般部署在不同的資源池。
兩種加速方法對(duì)比
綜上所述,和傳統(tǒng)的基于CPU加速方法相比,基于GPU的異構(gòu)加速方法同樣是成熟的通用方案,兩種方法的轉(zhuǎn)發(fā)加速方式相同,靈活性和運(yùn)維方面的差別也不大,關(guān)鍵的不同之處在于后者的服務(wù)器數(shù)量和總成本只有前者的一半左右,不但網(wǎng)絡(luò)性能得以提升,還有著較好的經(jīng)濟(jì)性,同時(shí)也明顯降低了采購(gòu)復(fù)雜度。
為了能直觀地加以對(duì)比,下表簡(jiǎn)單羅列了兩種方法的主要異同點(diǎn)。
類別
CPU方法
CPU+GPU方法
轉(zhuǎn)發(fā)加速
DPDK
DPDK
TC加速
無
GPU加速(TC服務(wù)器數(shù)量為CPU方法的1/7)
性價(jià)比
良好
優(yōu)秀(服務(wù)器數(shù)量、空間、成本為CPU方法的1/2,功耗為65%)
資源池
通用
通用(GPU通用硬件+通用API+共享+虛擬化)
網(wǎng)絡(luò)運(yùn)維
運(yùn)維成本中等,擴(kuò)縮容簡(jiǎn)單; 硬件統(tǒng)一/通用/集中,資源共享和按需申請(qǐng)
除左列的優(yōu)勢(shì)外,還有集成度更高,功耗/體積僅為CPU方法的1/2,部署更容易等
通用性
通用
通用(GPU可用于TC、加/解密、解壓縮、轉(zhuǎn)碼、數(shù)據(jù)分析、AI等)
靈活性
好
很好(PCIe接口,即插即用;CUDA API, 軟硬件解耦;多應(yīng)用/廠家共享,可由第三方提供)
適配性
N/A
1、全長(zhǎng)全高PCIe插槽
2、電源功率800W以上,高功率風(fēng)扇
成熟度
成熟
成熟
結(jié)語(yǔ)
到目前為止,中興通訊是業(yè)界唯一一家支持基于GPU的硬件加速的廠商,在該領(lǐng)域中擁有無可爭(zhēng)議的領(lǐng)先地位。
通過這一創(chuàng)新性方法,中興通訊vSBC的TC性能得到顯著的提升,可以更好地滿足VoLTE和將來5G語(yǔ)音的虛擬化需求,幫助運(yùn)營(yíng)商向用戶提供更高性能的優(yōu)質(zhì)服務(wù)。
作者:洪鈞 4/5G語(yǔ)音解決方案架構(gòu)師 來源:C114通信網(wǎng)