分析您的廣域網(wǎng)

——什么時候、怎樣分析和分析內(nèi)容


  雖然廣域網(wǎng)的性能監(jiān)測工具已經(jīng)有接近10 年的應(yīng)用,但在美國也只有少于四分之一的廣域網(wǎng)鏈路被監(jiān)測——用企業(yè)自己的設(shè)備進(jìn)行監(jiān)測或者由企業(yè)的網(wǎng)絡(luò)服務(wù)提供者進(jìn)行監(jiān)測。在美國之外,這個比率可能更低。

  對網(wǎng)絡(luò)鏈路進(jìn)行監(jiān)測的所有好處能夠在價值上超過對鏈路的部署和監(jiān)控嗎?監(jiān)測您的廣域網(wǎng)鏈路的主要好處是什么?監(jiān)測廣域網(wǎng)鏈路您需要監(jiān)測什么呢?

  本技術(shù)白皮書將幫助您考慮線路監(jiān)測的價值,幫助您考慮宕機的費用,理解服務(wù)響應(yīng)慢和應(yīng)用性能差的原因,幫助您更有效地管理您的網(wǎng)絡(luò)帶寬。

什么時候監(jiān)測廣域網(wǎng)鏈路是有意義的?

  為什么某些廣域網(wǎng)鏈路需要監(jiān)測而某些鏈路卻不需要監(jiān)測呢?在某些案例中,監(jiān)測鏈路的花費并沒有帶來充分的益處來證明監(jiān)測是值得的。某些廣域網(wǎng)技術(shù)——例如幀中繼、PPP 和ATM——是成熟的技術(shù),網(wǎng)絡(luò)經(jīng)理“讓其無監(jiān)測地運行”。這些沒有被監(jiān)測的鏈路,性能和可用性保證或多或少地轉(zhuǎn)移到服務(wù)提供者,而客戶對鏈路性能的能見度卻非常的少。一些網(wǎng)絡(luò)經(jīng)理感到大多數(shù)沒有被監(jiān)測的鏈路出現(xiàn)問題和失效的情況不多,通常在充分?jǐn)?shù)量的時間內(nèi)還是保持不監(jiān)測,因為部署“昂貴的”監(jiān)測方案并不能證明增加收益。第2 個原因是一些網(wǎng)絡(luò)管理員茫然不知監(jiān)測廣域網(wǎng)鏈路的益處何在。網(wǎng)絡(luò)經(jīng)理知道市場上有很多工具可以給出有關(guān)他們的廣域網(wǎng)性能的數(shù)據(jù),但是關(guān)于這些數(shù)據(jù)如何幫助自己的工作,網(wǎng)絡(luò)經(jīng)理還是不確定。從另一個方面說,是簡單的成本效益(分析的)因素。有些案例,部署監(jiān)測需要的時間和費用,并沒有帶來足夠的收益和好處。有些案例,監(jiān)測帶來的好處并不足以證明部署監(jiān)測方案的花銷是值得的。



“關(guān)鍵使命”鏈路

  對一條給定的廣域網(wǎng)鏈路,根據(jù)應(yīng)用類型和用戶利用率不同,主動監(jiān)測的必要性和程度也不同。如果一條廣域網(wǎng)鏈路用來提供一般的企業(yè)網(wǎng)用戶接入Internet,進(jìn)行頁面瀏覽網(wǎng)際沖浪,對鏈路性能小心翼翼地監(jiān)測可能不值得花費。通信量來自一個分部的簽約用戶,需要訪問用戶記錄來完成一次POS交易是關(guān)鍵使命的事物處理,需要進(jìn)行連續(xù)的監(jiān)測,確保事物處理的完美無缺。本質(zhì)上說,認(rèn)為對交易有明顯影響的“關(guān)鍵使命” 廣域網(wǎng)鏈路,需要被監(jiān)測。

關(guān)鍵使命廣域網(wǎng)鏈路通常分為以下幾種類別:

  那些絕對需要保持客戶滿意的鏈路。這些鏈路通常攜帶用戶需要實時處理的數(shù)據(jù)。例如POS 交易用戶記錄接入、信用卡處理事務(wù)、客戶呼叫中心的IP 電話呼叫和其他的關(guān)鍵使命的客戶服務(wù)應(yīng)用。

  那些支持個人重要實時應(yīng)用的鏈路。這些鏈路通常是指支持終端用戶以及關(guān)鍵使命的內(nèi)部操作。例如電子商務(wù)應(yīng)用、Web 共享件應(yīng)用、實時庫存量數(shù)據(jù)接入、視頻會議、電子郵件和其他實時性的操作應(yīng)用。

  那些支持緊急商務(wù)工具的鏈路。這些鏈路支持關(guān)鍵的后臺辦公室應(yīng)用,特別的是在數(shù)據(jù)中心。例如數(shù)據(jù)交換工具、遠(yuǎn)程鏡像站點數(shù)據(jù)備份交換、遠(yuǎn)程服務(wù)器軟件更新和其他后臺辦公室應(yīng)用。

計算鏈路監(jiān)測的價值

  監(jiān)測一條廣域網(wǎng)鏈路的價值取決于其所承載業(yè)務(wù)的關(guān)鍵性、現(xiàn)有的網(wǎng)絡(luò)效率以及公司的組織結(jié)構(gòu)。一種評價價值的方法就是應(yīng)用一個簡單的數(shù)學(xué)公式來評估監(jiān)測鏈路所用的成本。通過這種方法,您簡單地計算后再進(jìn)行合計,所有的價值成本來源于所選的被監(jiān)測鏈路。把這個值與部署監(jiān)測方案的成本進(jìn)行比較,從而決定是否值得監(jiān)測。


表格1 、數(shù)學(xué)表格量化監(jiān)測廣域網(wǎng)鏈路的價值


  通過表格1 的公式可以利用一個非常主觀的方法計算出一個數(shù)字化的收益價值。為了說明這一點,讓我們舉個例子。假定有一條給定的鏈路現(xiàn)在通過一個廣域網(wǎng)探針進(jìn)行監(jiān)測,依據(jù)過去的經(jīng)驗,網(wǎng)絡(luò)經(jīng)理觀察到相對一條完全相同但沒有被監(jiān)測的鏈路來說,被實時監(jiān)測的鏈路每年可以減少2 小時的MTTR。單獨針對這個成本值,假設(shè)關(guān)鍵使命任務(wù)鏈路的價值是 $100/分鐘,改善MTTR 的價值是 $12,000/每年($100/分鐘×120 分鐘MTTR 改進(jìn)/每年)。監(jiān)測該鏈路的好處還可以帶來其他的收益,例如節(jié)約故障查找的勞動時間和改進(jìn)網(wǎng)絡(luò)效率。顯而易見,MTTR 改善帶來收益的大小,與每條失效鏈路在其公司的價值息息相關(guān)。但是,基本價值單元和計算公式都是一樣的。

計算總體宕機開銷

  評估部署鏈路監(jiān)測方案的價值,取決于網(wǎng)絡(luò)工程師是否僅僅需要簡單的頭痛醫(yī)頭、腳痛醫(yī)腳的鏈路監(jiān)測方案。決定監(jiān)測一個分布式廣域網(wǎng)監(jiān)測系統(tǒng)的整個價值需要一個不同的方法,簡單地把所有被監(jiān)測鏈路的價值合計起來是不合適的。評估分布式廣域網(wǎng)系統(tǒng),您也許想從跟宕機有關(guān)的最高級花費開始。福祿克網(wǎng)絡(luò)評估了一個典型的年收入1 億美金的企業(yè),宕機所帶來的開銷是十分重要的。(見圖2)


圖2 、一個年收入1 億美金的企業(yè)所估計的宕機開銷(摘自“企業(yè)宕機開銷2004 :成本分析”——Infonetics Research )


  注意宕機的每個來源,廣域網(wǎng)鏈路可能是一個主要的來源。不同公司宕機的來源顯著地不同,因此在決定是否部署一個分布式的廣域網(wǎng)監(jiān)測方案對您是否合適之前,應(yīng)該做一個關(guān)于您的企業(yè)的單獨分析。在對典型的企業(yè)進(jìn)行分析的基礎(chǔ)上,不管用什么方法,廣域網(wǎng)都可能是宕機花費的顯著來源。

在您的廣域網(wǎng)鏈路里,您應(yīng)該監(jiān)測什么?

  讓我們假定至少少數(shù)廣域網(wǎng)鏈路被確定是關(guān)鍵使命鏈路而且是值得監(jiān)測的。下一個邏輯問題就是,最需要監(jiān)測的是什么?很多的廠家都熱心地把“網(wǎng)絡(luò)可視方案”賣給IT 組織,網(wǎng)絡(luò)經(jīng)理很少抱怨缺少能提供網(wǎng)絡(luò)性能數(shù)據(jù)的工具。終端用戶通過這些廠家提供的工具,收到了大量的有關(guān)自己網(wǎng)絡(luò)運行狀況的數(shù)據(jù)。但是,大部分網(wǎng)管人員承認(rèn)當(dāng)網(wǎng)絡(luò)故障發(fā)生或者用戶抱怨網(wǎng)絡(luò)應(yīng)用性能差的時候,這些海量的數(shù)據(jù)并沒有能夠表現(xiàn)出很好的應(yīng)用。

  網(wǎng)絡(luò)工程師很快指出大部分的網(wǎng)絡(luò)分析工具缺少清晰的、方便的、快速的、精確的網(wǎng)絡(luò)消息,來幫助解決和隔離他們遇到的各種問題。不同的廠家通常有不同的解決方案,通常擅長解決不同的“典型問題”。大多數(shù)情況下,為了能夠百分之百的監(jiān)測網(wǎng)絡(luò)行為,需要多個廠家的解決方案配合,但是,網(wǎng)絡(luò)工程師沒有時間或者預(yù)算來購買、學(xué)習(xí)、維護不同廠家的解決方案。

  因此,對企業(yè)網(wǎng)絡(luò)專家來說,監(jiān)測最重要的本質(zhì)是什么?福祿克網(wǎng)絡(luò)最近對網(wǎng)絡(luò)工程師和管理員進(jìn)行了一個有關(guān)他們對廣域網(wǎng)鏈路的關(guān)心點和問題點的調(diào)查。這次國際性的調(diào)查顯示了大多數(shù)的終端用戶不僅有非常相似的廣域網(wǎng)鏈路關(guān)心點,而且在不同的調(diào)查地區(qū),用戶的基本關(guān)心點都是一致的。

  調(diào)查結(jié)果并不讓人感到吃驚,網(wǎng)絡(luò)工程師需要基本的鏈路能見度,需要具有前瞻性地管理廣域網(wǎng)鏈路的帶寬性能,同時需要解決廣域網(wǎng)鏈路造成的服務(wù)響應(yīng)過慢,了解服務(wù)中斷的原因。因此,當(dāng)管理廣域網(wǎng)鏈路的時候,監(jiān)測相關(guān)的廣域網(wǎng)鏈路以獲得最好的帶寬管理和定位服務(wù)中斷源是最值得關(guān)注的事情。

  最初的時候,大家都比較關(guān)心帶寬管理和基本可視性等,不同的人可能面對不同的事情。為了更好的明確和理解這些概念,福祿克網(wǎng)絡(luò)選擇了與被調(diào)查者進(jìn)行面談。奇怪的是,面談結(jié)果表明客戶的關(guān)心點是非常一致的,對最關(guān)心的6 個問題(見圖3)有相同的理解。


圖3 :對網(wǎng)絡(luò)經(jīng)理進(jìn)行調(diào)查的結(jié)果顯示的廣域網(wǎng)鏈路關(guān)心點


帶寬管理

  帶寬管理是指確保帶寬是可用的,不論是對客戶、服務(wù)器、應(yīng)用還是其他網(wǎng)絡(luò)設(shè)備,也無論企業(yè)網(wǎng)管經(jīng)理是如何定義的。對少數(shù)用戶來說,帶寬管理意味著通過流量整形、警管或者帶寬壓縮來減少網(wǎng)絡(luò)擁塞。對其他一些用戶,帶寬管理意味著區(qū)分流量優(yōu)先級別類型,比如IP 電話,從而確保話音呼叫能夠穿過數(shù)據(jù)網(wǎng)絡(luò)的同時確保其話音質(zhì)量。對大多數(shù)調(diào)查者來說,帶寬管理僅僅意味著監(jiān)測用戶和電路的帶寬消耗,從而讓網(wǎng)絡(luò)經(jīng)理有適當(dāng)?shù)、實時的信息來采取行動,確保廣域網(wǎng)鏈路的吞吐量并遠(yuǎn)離故障。舉例來說,網(wǎng)絡(luò)經(jīng)理需要能夠識別帶寬瓶頸原因的信息,從而采取糾正的行為。大多數(shù)時間,這些行為并不包括設(shè)置或者改變服務(wù)水平政策、購買更多的帶寬或者采用壓縮技術(shù)。典型的矯正行為包括簡單的網(wǎng)絡(luò)“tweaks”(調(diào)整),例如對于一個沒有授權(quán)的應(yīng)用例如KAZAA(一個點對點文件共享工具)關(guān)閉一個通道、端口,或者改變到遠(yuǎn)端工作站、服務(wù)器做軟件更新的固定時間。其他帶寬管理的主要需求是在一個有限的帶寬環(huán)境里,當(dāng)新的應(yīng)用部署、新的服務(wù)部署移動、增加和不斷改變時,連續(xù)地觀察網(wǎng)絡(luò)的運行狀況,保證網(wǎng)絡(luò)高效地運行。

  網(wǎng)絡(luò)經(jīng)理指出對關(guān)鍵鏈路進(jìn)行監(jiān)測統(tǒng)計是監(jiān)測方案的一個關(guān)鍵。統(tǒng)計鏈路利用率、吞吐量速率、每一個分離虛電路的錯誤、在不同時間的規(guī)律對于性能驗證都是非常有用的。(見圖4)監(jiān)測鏈路利用率是確定廣域網(wǎng)是否成為一個瓶頸的一個快速途徑。如果利用率太高,那么需要對廣域網(wǎng)做一個更深入檢查來定位根本原因。如果利用率在設(shè)計的范圍內(nèi),就有了廣域網(wǎng)運行適當(dāng)?shù)母鶕?jù)。


圖5 :監(jiān)測最多的幾種應(yīng)用以更好地管理帶寬


  了解廣域網(wǎng)鏈路的應(yīng)用對帶寬管理也是非常重要的。能夠顯現(xiàn)真正的帶寬需求、瓶頸來源、發(fā)覺未經(jīng)授權(quán)的應(yīng)用。這種分析對確定流量是非常重要的。(見圖5)


圖6 :通過監(jiān)測響應(yīng)時間來尋找服務(wù)下降的原因


服務(wù)和應(yīng)用性能緩慢

  服務(wù)或者應(yīng)用性能緩慢可能是由一系列不同的原因造成的,包括應(yīng)用本身、用戶服務(wù)器主機、應(yīng)用服務(wù)器主機和路由器、交換機等網(wǎng)絡(luò)要素。網(wǎng)絡(luò)經(jīng)理需要基本的可視性來查看各種主要的性能抑制來源,從而執(zhí)行矯正問題的有效方法。主要的網(wǎng)絡(luò)和服務(wù)器瓶頸測量標(biāo)準(zhǔn)包括:

  連接時間-在客戶和服務(wù)器之間,開始傳送數(shù)據(jù)之前,建立一個TCP 會話連接的全部時間

  服務(wù)器延遲-服務(wù)器開始響應(yīng)一個請求的所花的全部時間

  數(shù)據(jù)傳輸延遲-服務(wù)器對一個請求從開始響應(yīng)到數(shù)據(jù)傳輸完成的全部時間

  重傳延遲-因為重傳的原因,網(wǎng)絡(luò)往返時間(RTT)所增加的延遲

  網(wǎng)絡(luò)往返時間RTT-一個數(shù)據(jù)包穿過網(wǎng)絡(luò)所花的全部時間

  這些統(tǒng)計標(biāo)準(zhǔn)的可見性能夠區(qū)分速度減慢的來源,是有效執(zhí)行糾錯方案的基礎(chǔ)。在沒有性能監(jiān)測手段的時候,網(wǎng)絡(luò)管理經(jīng)理很可能推斷帶寬不足是問題根源。企業(yè)于是嘗試補救,要么購買一條更多帶寬的鏈路,要么購買一條更高CIR(用戶約定速率)的PVC(永久虛連接)。在許多的情況下,這是金錢的浪費,因為服務(wù)減慢的原因可能在網(wǎng)絡(luò)的其他地方。(見圖6)


圖6:檢測響應(yīng)時間來篩選造成性能下降的源


基本可視性

  基本的鏈路可視性允許您快速地著眼于一條特定電路,確認(rèn)該鏈路的性能。網(wǎng)絡(luò)經(jīng)理需要對此有概要性的了解,做為消除廣域網(wǎng)鏈路問題的資料來源或者幫助將來定位問題的區(qū)域。通過對首頁的圖表信息的快速查看,能夠?qū)V域網(wǎng)鏈路的特征有一個快速的、實時的理解,知道鏈路正在做什么。(見圖7 和8)廣域網(wǎng)電路監(jiān)測的關(guān)鍵圖表信息包括:

  電路連接-認(rèn)證電路類型(如FR、PPP、ATM 等),虛電路的數(shù)目和它們兩端的路由器

  利用率-快速測定當(dāng)前是否存在帶寬瓶頸。包括對整個電路利用率的查看,也包括對消耗帶寬最多的

  主機、應(yīng)用、虛電路的查看。

  設(shè)備-使用該電路的所有設(shè)備的顯示,包括路由器、服務(wù)器、主機、探針

  問題-通過流量探針的監(jiān)測,生成的告警日志


圖7:快速查看所有關(guān)鍵廣域網(wǎng)性能區(qū)域



圖8:通過了解有什么設(shè)備存在與網(wǎng)絡(luò)之上可以更好地管理鏈路


正常運行時間/服務(wù)中斷

  問題告警是任何監(jiān)測系統(tǒng)的一個基礎(chǔ)部分。前瞻性監(jiān)測能夠發(fā)送基于標(biāo)準(zhǔn)的失敗事件、用戶定義的極限違背事件的告警。但不會產(chǎn)生糾正的動作,直到網(wǎng)絡(luò)經(jīng)理意識到這個問題(見圖9)。


圖9:問題日志具有前瞻性地警告網(wǎng)絡(luò)管理人員廣域網(wǎng)問題


服務(wù)提供監(jiān)測

  不管安裝人員、技術(shù)人員和工程師如何努力,在提供服務(wù)的時候總有錯誤發(fā)生。因此,要謹(jǐn)慎地驗證實際交付的鏈路吞吐量是您期望的。SLA 確保您基本的QOS(服務(wù)水平質(zhì)量)通過廣域網(wǎng)是可用的。監(jiān)測對驗證SLA 一致性是必須的。當(dāng)廣域網(wǎng)瞬間的擁塞導(dǎo)致流量下降的時候,您的鏈路吞吐量會受到影響。在時間上了解和驗證鏈路PVC 吞吐量特征,對識別問題是由于暫時的過載、系統(tǒng)錯誤、還是由于簡單的錯誤配置引起的非常重要。(見圖10)


圖10:驗證您的服務(wù)提供商所承諾的線路容量


物理層問題

  與謹(jǐn)慎地驗證服務(wù)提供者的供給能力一樣,對物理層問題的監(jiān)測也是非常重要的。對物理層性能的反復(fù)核對能夠消除在企業(yè)網(wǎng)和服務(wù)提供者之間的“相互推諉”,而且有助于快速隔離和消除與廣域網(wǎng)相關(guān)的物理層問題。當(dāng)物理層問題出現(xiàn)在一條關(guān)鍵使命鏈路上的時候,MTTR 對用戶的影響極為重大。(見圖11)


圖11:監(jiān)測物理層減少 MTTR 和“相互推諉”


結(jié)論

  監(jiān)測關(guān)鍵使命廣域網(wǎng)鏈路證明了針對任何企業(yè)監(jiān)測都會帶來成本收益,雖然成本效益價值必須根據(jù)不同公司的不同規(guī)則進(jìn)行評估。為了達(dá)到廣域網(wǎng)鏈路的效率最大化,關(guān)鍵使命鏈路的最大無故障運行時間,必須執(zhí)行對廣域網(wǎng)鏈路的實時、積極地監(jiān)測。網(wǎng)絡(luò)經(jīng)理在做出糾正動作之前,必須通過監(jiān)測廣域網(wǎng)鏈路關(guān)鍵性能的規(guī)律,徹底地了解鏈路的使用情況。監(jiān)測能力的缺乏將會導(dǎo)致廣域網(wǎng)鏈路不能很好地優(yōu)化、運行和維護。
作者:美國福祿克網(wǎng)絡(luò)公司   來源:C114(CHINA通信網(wǎng))

微信掃描分享本文到朋友圈
掃碼關(guān)注5G通信官方公眾號,免費領(lǐng)取以下5G精品資料
  • 1、回復(fù)“YD5GAI”免費領(lǐng)取《中國移動:5G網(wǎng)絡(luò)AI應(yīng)用典型場景技術(shù)解決方案白皮書
  • 2、回復(fù)“5G6G”免費領(lǐng)取《5G_6G毫米波測試技術(shù)白皮書-2022_03-21
  • 3、回復(fù)“YD6G”免費領(lǐng)取《中國移動:6G至簡無線接入網(wǎng)白皮書
  • 4、回復(fù)“LTBPS”免費領(lǐng)取《《中國聯(lián)通5G終端白皮書》
  • 5、回復(fù)“ZGDX”免費領(lǐng)取《中國電信5GNTN技術(shù)白皮書
  • 6、回復(fù)“TXSB”免費領(lǐng)取《通信設(shè)備安裝工程施工工藝圖解
  • 7、回復(fù)“YDSL”免費領(lǐng)取《中國移動算力并網(wǎng)白皮書
  • 8、回復(fù)“5GX3”免費領(lǐng)取《R1623501-g605G的系統(tǒng)架構(gòu)1
  • 本周熱點本月熱點

     

      最熱通信招聘

      最新招聘信息