摘要 首先闡述了基于端到端的承載網(wǎng)絡(luò)性能測(cè)評(píng)的重要性和緊迫性,接著介紹了端到QoS測(cè)評(píng)的新方法,然后著重說明了端到端QoS測(cè)評(píng)新方法可解決運(yùn)營質(zhì)量管理中存在的諸方面問題,最后展望了網(wǎng)絡(luò)質(zhì)量管理的未來。
1、網(wǎng)絡(luò)承載性能亟待測(cè)評(píng)
隨著IP網(wǎng)絡(luò)的發(fā)展,最初以承載為主要功能的IP網(wǎng)絡(luò)正漸漸地轉(zhuǎn)變?yōu)橐栽鲋禈I(yè)務(wù)運(yùn)營為主要功能的網(wǎng)絡(luò)。業(yè)務(wù)的發(fā)展不斷給網(wǎng)絡(luò)提出更多的挑戰(zhàn),業(yè)務(wù)流量的增加導(dǎo)致網(wǎng)絡(luò)負(fù)荷加重,網(wǎng)絡(luò)反應(yīng)慢、鏈路帶寬不足、擴(kuò)容投資不斷增長(zhǎng),網(wǎng)絡(luò)規(guī)劃和網(wǎng)絡(luò)質(zhì)量管理缺乏可靠的依據(jù)和手段,測(cè)評(píng)現(xiàn)有網(wǎng)絡(luò)性能對(duì)新業(yè)務(wù)的支撐情況也屬空白?偠灾,基于服務(wù)質(zhì)量(QoS)的增值業(yè)務(wù)的運(yùn)營難于開展,IP網(wǎng)絡(luò)承載性能狀況和對(duì)實(shí)時(shí)業(yè)務(wù)的支撐情況迫切需要在不影響業(yè)務(wù)運(yùn)營的情況下進(jìn)行測(cè)評(píng)、分析和管理。
業(yè)務(wù)對(duì)網(wǎng)絡(luò)性能的要求直接來源于業(yè)務(wù)對(duì)端到端客戶感知(主觀質(zhì)量)的滿意程度的需求。尤其對(duì)于目前在網(wǎng)絡(luò)中涌現(xiàn)出的越來越多的實(shí)時(shí)業(yè)務(wù),如VoIP、IPTV、VOD等業(yè)務(wù)對(duì)端到端的可用帶寬、時(shí)延、抖動(dòng)和丟包十分敏感,這些性能參數(shù)嚴(yán)重影響著此類業(yè)務(wù)的開展和運(yùn)營維護(hù)。這些指標(biāo)的組合整體反映了承載網(wǎng)絡(luò)所能提供的QoS,因此準(zhǔn)確把握這些網(wǎng)絡(luò)QoS指標(biāo)是對(duì)網(wǎng)絡(luò)承載性能進(jìn)行測(cè)評(píng)的基礎(chǔ)。
QoS是指網(wǎng)絡(luò)中多個(gè)環(huán)節(jié)共同提供的性能,包括路由隊(duì)列管理、應(yīng)用層QoS保障、IP層QoS措施和鏈路層QoS保障。每一個(gè)環(huán)節(jié)的QoS所起的作用不同,對(duì)網(wǎng)絡(luò)QoS的影響也不同。
●路由隊(duì)列管理包括RED(Random Early Detection)、ECN(Explicit Congestion Notificaiton)、FIFO(First-In First-Out)、Drop tail等隊(duì)列管理方法。這些方法直接作用在路由器上,對(duì)路由器的隊(duì)列緩沖區(qū)進(jìn)行排隊(duì)管理。這些方法通過對(duì)數(shù)據(jù)的轉(zhuǎn)發(fā)優(yōu)先級(jí)、丟棄優(yōu)先級(jí)、丟棄概率和丟棄門限進(jìn)行限定,對(duì)數(shù)據(jù)包的到達(dá)、排隊(duì)等待、轉(zhuǎn)發(fā)行為進(jìn)行限制和處理,為數(shù)據(jù)包不同優(yōu)先級(jí)、不同服務(wù)等級(jí)提供不同的行為規(guī)則。
●應(yīng)用層QoS保障的實(shí)施依賴于應(yīng)用本身的控制策略和措施。例如語音播放軟件的緩存機(jī)制、視頻誤碼掩飾機(jī)制都是基于應(yīng)用層的QoS保障。
●IP層QoS機(jī)制是利用IP數(shù)據(jù)包頭信息進(jìn)行包的路由選擇和轉(zhuǎn)發(fā),包括利用ToS(Type of Service)字段信息確定服務(wù)類型和優(yōu)先級(jí),以及利用綜合服務(wù)、區(qū)分服務(wù)建立流轉(zhuǎn)發(fā)行為規(guī)則保證QoS。
●鏈路層QoS的保障是通過在鏈路層建立虛鏈路(如ATM中的虛通道)或定制鏈路層數(shù)據(jù)的轉(zhuǎn)發(fā)行為(如MPLS的包轉(zhuǎn)發(fā)控制)來實(shí)現(xiàn)質(zhì)量分級(jí)。
但是,目前QoS管理無法在現(xiàn)有的IP網(wǎng)絡(luò)中保障業(yè)務(wù)的質(zhì)量。這是因?yàn)槟壳熬W(wǎng)絡(luò)的QoS保障措施絕大多數(shù)是盡力型的而不是保證型的,而且?guī)缀跛蠶oS保障機(jī)制都是基于逐跳的行為控制的,而不是面向端到端的保障;另外,不同業(yè)務(wù)有不同的QoS要求,網(wǎng)絡(luò)提供服務(wù)質(zhì)量的等級(jí)和業(yè)務(wù)的要求不是一一映射的關(guān)系,甚至是無法映射的。所以,業(yè)務(wù)的QoS保障成了目前服務(wù)提供商要解決的重要問題。然而,解決這一問題卻是一個(gè)工程技術(shù)界的難題,這將是一個(gè)漫長(zhǎng)的過程。不過,對(duì)現(xiàn)有網(wǎng)絡(luò)的性能進(jìn)行評(píng)估和質(zhì)量分級(jí)管理是網(wǎng)絡(luò)運(yùn)營迫在眉睫的事情。
2、端到端QoS測(cè)評(píng)的新方法
網(wǎng)絡(luò)QoS的評(píng)價(jià)指標(biāo)主要包括可用帶寬、單雙向時(shí)延、單雙向時(shí)延抖動(dòng)和單雙向丟包。可用帶寬直接影響網(wǎng)絡(luò)業(yè)務(wù)的質(zhì)量、網(wǎng)絡(luò)對(duì)即將開展業(yè)務(wù)的支撐能力以及網(wǎng)絡(luò)的擴(kuò)容規(guī)劃和設(shè)計(jì)。單向時(shí)延、單向時(shí)延抖動(dòng)和單向丟包之所以不可缺少是由于業(yè)務(wù)服務(wù)器和客戶終端內(nèi)容交互的非對(duì)稱造成的。IPTV、VOD等業(yè)務(wù)的質(zhì)量好壞直接受媒體服務(wù)器到用戶終端之間單向鏈路性能質(zhì)量的影響,而與另外一個(gè)方向的鏈路性能關(guān)系不大。所以單向端到端鏈路的性能質(zhì)量指標(biāo)要比雙向性能指標(biāo)更能準(zhǔn)確地反映網(wǎng)絡(luò)對(duì)業(yè)務(wù)的支撐能力和業(yè)務(wù)的真實(shí)服務(wù)質(zhì)量。目前測(cè)評(píng)網(wǎng)絡(luò)性能質(zhì)量的方法有很多種,不同方法存在不同的準(zhǔn)確性和可靠性。傳統(tǒng)的網(wǎng)絡(luò)性能測(cè)試方法包括網(wǎng)管測(cè)量方法、儀表測(cè)試方法以及手工簡(jiǎn)單測(cè)評(píng)。這幾類方法都存在一定的局限性,主要表現(xiàn)在一些性能指標(biāo)無法獲取以及獲得這些指標(biāo)需要依賴于路由器的配合,甚至影響正常業(yè)務(wù)的運(yùn)營。下面將對(duì)傳統(tǒng)的方法和基于端到端網(wǎng)絡(luò)服務(wù)質(zhì)量測(cè)試的方法進(jìn)行分析和對(duì)比。
網(wǎng)管測(cè)量方法是通過對(duì)網(wǎng)元設(shè)備統(tǒng)計(jì)信息的采集獲得相應(yīng)的QoS指標(biāo),如流量統(tǒng)計(jì)和丟包率。這兩個(gè)指標(biāo)是網(wǎng)元設(shè)備的統(tǒng)計(jì)信息而不是端到端的性能信息,所以網(wǎng)管測(cè)量所得到的信息是單點(diǎn)設(shè)備的信息而不是業(yè)務(wù)所經(jīng)鏈路整體的性能信息。單向時(shí)延、時(shí)延抖動(dòng)以及單向丟包是網(wǎng)管系統(tǒng)無法得到的,因此網(wǎng)管系統(tǒng)基本上是無法進(jìn)行網(wǎng)絡(luò)端到端質(zhì)量測(cè)評(píng)的。
儀表測(cè)試方法雖然可以測(cè)量網(wǎng)絡(luò)的最大可用帶寬、時(shí)延和丟包,但是最大可用帶寬的測(cè)量采用傳統(tǒng)的“調(diào)波法”,這種方法利用儀表發(fā)生模擬數(shù)據(jù)包的方式,持續(xù)向鏈路中發(fā)送數(shù)據(jù),直至鏈路完全被模擬數(shù)據(jù)占滿,從而得到鏈路的最大可用帶寬。顯然,它是不能在正常運(yùn)營的業(yè)務(wù)網(wǎng)絡(luò)中進(jìn)行測(cè)量的。單向時(shí)延和丟包的測(cè)量需要多臺(tái)儀表配合測(cè)量,而且不能得到真正準(zhǔn)確的時(shí)延,這是因?yàn)槎嗯_(tái)儀表之間時(shí)間同步和時(shí)鐘頻偏的問題無法真正得到解決。
其他手工方法,如用ping命令或tracert命令會(huì)受到防火墻和路由設(shè)置的限制而無法解決指標(biāo)測(cè)量問題。即使沒有這些限制,這些命令結(jié)果反映的雙向時(shí)延也不能說明問題的本質(zhì),因?yàn)橹挥猩舷滦袃蓚(gè)方向分別單獨(dú)測(cè)量的結(jié)果才能表明問題的真實(shí)情況。
要不影響正常業(yè)務(wù)運(yùn)營的情況,測(cè)評(píng)網(wǎng)絡(luò)的性能質(zhì)量狀態(tài)必須有更先進(jìn)的技術(shù)和新的測(cè)量方法以達(dá)到對(duì)網(wǎng)絡(luò)狀態(tài)的真實(shí)反映。目前,在眾多企業(yè)和高校的技術(shù)人員的不斷努力下,終于找到一種有效解決這一問題的方法——基于端到端的網(wǎng)絡(luò)性能質(zhì)量測(cè)試方法,它利用新穎的技術(shù)和高效的算法達(dá)到快速、準(zhǔn)確地測(cè)試和測(cè)量的目的。
這種基于端到端測(cè)試的指標(biāo)是端到端之間的指標(biāo)而不是單個(gè)設(shè)備、某一段甚至某一跳之間鏈路的指標(biāo)。端到端的含義包括業(yè)務(wù)的起始點(diǎn)和業(yè)務(wù)的終止點(diǎn)整條路徑,是業(yè)務(wù)傳輸?shù)娜凯h(huán)節(jié)。
端到端的單向時(shí)延是從一個(gè)測(cè)量點(diǎn)(一個(gè)具體的IP地址)到另外一個(gè)測(cè)量點(diǎn)的數(shù)據(jù)報(bào)文傳遞所用的時(shí)間,這個(gè)時(shí)間是轉(zhuǎn)發(fā)時(shí)延、排隊(duì)時(shí)延和傳輸時(shí)延的總和。要實(shí)現(xiàn)對(duì)其準(zhǔn)確測(cè)量必須要解決幾個(gè)問題,其中時(shí)鐘同步是一個(gè)基本問題,另外一個(gè)重要的問題就是時(shí)鐘頻偏和時(shí)鐘跳變的問題。也就是說,不僅需要解決時(shí)鐘基準(zhǔn)問題,還要解決時(shí)鐘漂移問題。目前,此領(lǐng)域最新的單向時(shí)延測(cè)量的算法利用智能判斷和模糊邏輯分析的方法可以較好地解決這一問題,使單向時(shí)延的測(cè)量成為可能。
端到端的可用帶寬也是分兩個(gè)方向分別來看的,目前大部分骨干以下的鏈路上下行兩個(gè)方向可用帶寬明顯不對(duì)稱,一般是下行大于上行,而在骨干以上及出口鏈路上兩個(gè)方向數(shù)據(jù)鏈路的可用帶寬比較接近。因此,區(qū)別不同方向的鏈路帶寬是必要的。如何得到不同方向的鏈路在不同的時(shí)段還有多少剩余的帶寬可供使用、是否擁塞、鏈路帶寬是否可以滿足當(dāng)前業(yè)務(wù)和將來新業(yè)務(wù)的開展?要解決這些問題,就必須提供在不影響現(xiàn)有網(wǎng)絡(luò)業(yè)務(wù)正常運(yùn)行的前提下可以測(cè)量可用帶寬的技術(shù)。傳統(tǒng)的“調(diào)波法”和網(wǎng)管的流量統(tǒng)計(jì)法存在影響業(yè)務(wù)、單點(diǎn)統(tǒng)計(jì)、統(tǒng)計(jì)粒度不夠精細(xì)等缺點(diǎn)使它們無法滿足現(xiàn)有網(wǎng)絡(luò)性能測(cè)試的要求。目前基于端到端的剩余帶寬測(cè)量方法采用了一種“微流量”測(cè)試的新方法,它通過向網(wǎng)絡(luò)中發(fā)送的數(shù)據(jù)流量(數(shù)據(jù)流量=鏈路帶寬×0.3%)即可完成對(duì)鏈路可用帶寬的測(cè)量。
基于以上兩種新技術(shù)就可以很容易得到諸多新指標(biāo),如擁塞概率、網(wǎng)絡(luò)健康度等性能的評(píng)價(jià)指標(biāo),結(jié)合其他丟包率和時(shí)延抖動(dòng)的分析即可構(gòu)成相對(duì)完備的網(wǎng)絡(luò)QoS評(píng)價(jià)體系。
3、利用新方法解決運(yùn)營質(zhì)量管理中存在的問題
當(dāng)前運(yùn)營商在網(wǎng)絡(luò)運(yùn)營中存在的諸多運(yùn)維問題需要運(yùn)用準(zhǔn)確、高效的分析手段和解決方案來提高運(yùn)營質(zhì)量、客戶滿意度和ARPU值。從網(wǎng)絡(luò)功能的分類角度來看,這些問題主要集中在以下幾個(gè)方面:
●核心鏈路的性能監(jiān)測(cè)和維護(hù);
●接入鏈路用戶投訴;
●大客戶鏈路的服務(wù)等級(jí)保障和維護(hù);
●業(yè)務(wù)專網(wǎng)的運(yùn)營維護(hù);
●支撐系統(tǒng)的維護(hù)管理。
不同的網(wǎng)絡(luò)面臨著不同的問題,從另外一個(gè)角度來看,這些問題又分為一些基本網(wǎng)絡(luò)維護(hù)、客戶QoS、新業(yè)務(wù)開展以及網(wǎng)絡(luò)健康度和規(guī)劃等問題。
3.1 基本網(wǎng)絡(luò)維護(hù)問題
網(wǎng)絡(luò)的基本維護(hù)問題包括長(zhǎng)期監(jiān)視網(wǎng)絡(luò)可用帶寬、及時(shí)發(fā)現(xiàn)鏈路帶寬變化、定期監(jiān)控不同方向鏈路時(shí)延和丟包情況以及擁塞情況。
這一問題可以通過端到端性能的測(cè)評(píng)定時(shí)提供測(cè)量結(jié)果和性能報(bào)告以及網(wǎng)絡(luò)現(xiàn)狀的監(jiān)測(cè)和狀態(tài)的預(yù)警,發(fā)現(xiàn)網(wǎng)絡(luò)的瓶頸點(diǎn)和擁塞點(diǎn)。
3.2 客戶QoS問題
客戶QoS是目前分級(jí)服務(wù)的主要內(nèi)容,對(duì)于不同等級(jí)的客戶提供不同的鏈路帶寬、服務(wù)等級(jí)和QoS。那么,如何保證服務(wù)質(zhì)量的承諾和迅速提供QoS的監(jiān)控手段呢?
端到端性能測(cè)試可以測(cè)量客戶鏈路的可用帶寬,確保鏈路的可用性;測(cè)試鏈路的單向丟包和單向時(shí)延,確定鏈路對(duì)業(yè)務(wù)的支持情況;測(cè)量應(yīng)用業(yè)務(wù)節(jié)點(diǎn)的響應(yīng)時(shí)延,界定鏈路性能和服務(wù)器性能的故障和問題;通過擁塞定位和擁塞分析確定鏈路的薄弱環(huán)節(jié),提供客戶鏈路質(zhì)量的保障手段。
3.3 新業(yè)務(wù)開展問題
對(duì)于新業(yè)務(wù)的開通,端到端網(wǎng)絡(luò)性能測(cè)試系統(tǒng)可以很輕松地對(duì)現(xiàn)有網(wǎng)絡(luò)的狀態(tài)進(jìn)行測(cè)試和評(píng)估。首先,可以測(cè)試新業(yè)務(wù)部署點(diǎn)到不同訪問點(diǎn)單向鏈路的帶寬,確定現(xiàn)有網(wǎng)絡(luò)可用帶寬是否可以滿足新業(yè)務(wù)的需求;其次,測(cè)量單向時(shí)延、單向時(shí)延抖動(dòng)和單向丟包,確定鏈路的性能是否滿足實(shí)時(shí)業(yè)務(wù)在時(shí)延方面的需求;最后,通過鏈路擁塞分析預(yù)測(cè)鏈路的瓶頸環(huán)節(jié),全面確保新業(yè)務(wù)的運(yùn)營開通。
3.4 網(wǎng)絡(luò)健康度和規(guī)劃問題
健康度是根據(jù)網(wǎng)絡(luò)多維性能的測(cè)評(píng)結(jié)果對(duì)網(wǎng)絡(luò)性能質(zhì)量的整體評(píng)價(jià),包括時(shí)延、丟包以及帶寬占有率多個(gè)性能指標(biāo)緯度,如圖1所示,不同的指標(biāo)緯度構(gòu)成不同的質(zhì)量區(qū)域,不同的區(qū)域反映了不同的健康狀態(tài)。
圖1 多緯度網(wǎng)絡(luò)健康度評(píng)價(jià)坐標(biāo)系
3.5 性能測(cè)試系統(tǒng)部署問題
為了實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)性能質(zhì)量的評(píng)估,基于端到端的網(wǎng)絡(luò)性能測(cè)試系統(tǒng)至少要具備兩種不同的形態(tài)以滿足不同需求。首先,針對(duì)需要解決業(yè)務(wù)開通測(cè)試和暫時(shí)性鏈路故障定位分析的情況,在骨干或核心網(wǎng)中部署單臺(tái)測(cè)試設(shè)備作為測(cè)量的一端,另一端用普通的PC遠(yuǎn)程下載Agent即可實(shí)現(xiàn)端到端的測(cè)試;其次,對(duì)于需要長(zhǎng)期監(jiān)測(cè)的大客戶鏈路或業(yè)務(wù)專網(wǎng),需要具備分布式測(cè)試和集中管理的能力,定時(shí)提供網(wǎng)絡(luò)健康狀況的報(bào)告。圖2描述了分布式監(jiān)測(cè)集中管理的QoS監(jiān)測(cè)系統(tǒng),這個(gè)系統(tǒng)中包括前端設(shè)備(IPQoS-Agent)和中心控制管理單元(IPQoS-CCMU)。前端設(shè)備負(fù)責(zé)在多個(gè)對(duì)等體之間對(duì)鏈路性能進(jìn)行測(cè)量以及對(duì)業(yè)務(wù)平臺(tái)服務(wù)響應(yīng)進(jìn)行測(cè)量,并將測(cè)試后的性能數(shù)據(jù)傳送給中心控制管理單元。而CCMU在存儲(chǔ)管理測(cè)試結(jié)果的同時(shí),還負(fù)責(zé)對(duì)前端設(shè)備的控制和策略的調(diào)度。
圖2 QoS測(cè)試系統(tǒng)部署方案
4、網(wǎng)絡(luò)質(zhì)量管理的未來
網(wǎng)絡(luò)的運(yùn)營模式由粗放式帶寬租賃經(jīng)營到精細(xì)化分級(jí)質(zhì)量運(yùn)營過程的轉(zhuǎn)變以及增值業(yè)務(wù)對(duì)網(wǎng)絡(luò)質(zhì)量的不斷挑戰(zhàn),使網(wǎng)絡(luò)質(zhì)量的可度量化、可管理性、可運(yùn)營性成為將來網(wǎng)絡(luò)運(yùn)營維護(hù)管理的重中之重。因此,網(wǎng)絡(luò)性能質(zhì)量測(cè)評(píng)手段是這一切的基礎(chǔ),在這一基礎(chǔ)之上建立網(wǎng)絡(luò)質(zhì)量測(cè)評(píng)體系是網(wǎng)絡(luò)高效運(yùn)營的關(guān)鍵。
----《電信技術(shù)》
作者:盧艷軍