摘要 從網(wǎng)元管理、拓?fù)涔芾、故障管理、資源管理、性能管理、網(wǎng)流采集分析、網(wǎng)絡(luò)業(yè)務(wù)管理7個方面對數(shù)據(jù)通信網(wǎng)絡(luò)的運(yùn)行、維護(hù)、管理作了簡要論述。
關(guān)鍵詞 數(shù)據(jù)通信 DMS VPN Manager 網(wǎng)絡(luò)管理 運(yùn)維
隨著IP技術(shù)的進(jìn)步,數(shù)據(jù)通信網(wǎng)絡(luò)得到迅速發(fā)展。在NGN/3G時代,IP承載網(wǎng)的地位非常重要,因此怎樣有效管理數(shù)據(jù)通信網(wǎng)絡(luò)是運(yùn)維工作中必須研究的一個重要課題。
鐵通數(shù)據(jù)通信網(wǎng)絡(luò)采用了NE80、S8016、MA5200、S8505等設(shè)備,除了傳統(tǒng)登錄設(shè)備的維護(hù)方式外,必須借助有效的工具來提升運(yùn)維效率。
本文從網(wǎng)元管理、拓?fù)涔芾、故障管理、資源管理、性能管理、網(wǎng)流采集分析、網(wǎng)絡(luò)業(yè)務(wù)管理7個方面對數(shù)據(jù)通信網(wǎng)絡(luò)的運(yùn)維管理作一簡介。
1、網(wǎng)元管理
網(wǎng)元是電信管理網(wǎng)(TMN)體系結(jié)構(gòu)中的基本管理元素,在數(shù)據(jù)通信網(wǎng)絡(luò)中一般指路由器、交換機(jī)等設(shè)備。
網(wǎng)元網(wǎng)管是最“簡單”的網(wǎng)管,提供遠(yuǎn)程設(shè)備管理的基本功能。維護(hù)人員通過它可以查看設(shè)備面板、端口狀態(tài)以及一些協(xié)議數(shù)據(jù),并可以進(jìn)行VLan配置、接口shutdown、undo shutdown等基本操作。部分網(wǎng)元網(wǎng)管軟件還提供短周期的性能監(jiān)視功能,可以對設(shè)備、接口等進(jìn)行監(jiān)控,監(jiān)控結(jié)果采用直方圖、折線圖等形式輸出。使維護(hù)人員可以了解IP、TCP、UDP、ICMP等報(bào)文的情況,并可以掌握接口帶寬利用率、接收包錯誤率等信息。
需要注意的是,此類性能監(jiān)控雖可以實(shí)時輸出,但是其總體監(jiān)控周期比較短,不能適應(yīng)大規(guī)模網(wǎng)絡(luò)性能管理的要求。
2、拓?fù)涔芾?/p>
隨著網(wǎng)絡(luò)規(guī)模的發(fā)展,網(wǎng)絡(luò)結(jié)構(gòu)日益復(fù)雜,維護(hù)人員需要一個拓?fù)涔芾硐到y(tǒng),用以準(zhǔn)確掌握網(wǎng)絡(luò)拓?fù)淝闆r。
拓?fù)涔芾碛糜跇?gòu)造并管理整個網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu),維護(hù)人員通過瀏覽網(wǎng)絡(luò)拓?fù)湟晥D,實(shí)時了解整個網(wǎng)絡(luò)的運(yùn)行情況。
在小型的網(wǎng)絡(luò)中構(gòu)建一個拓?fù)鋱D形就可以瀏覽網(wǎng)絡(luò)的全貌,但在網(wǎng)絡(luò)設(shè)備大量增加之后網(wǎng)絡(luò)結(jié)構(gòu)異常復(fù)雜,使用一張拓?fù)鋱D查看網(wǎng)絡(luò)已經(jīng)不具有現(xiàn)實(shí)意義。此時就需要劃分多個區(qū)域進(jìn)行拓?fù)涔芾,比如按照不同地區(qū)將設(shè)備劃分到不同子圖中。
華為公司的數(shù)據(jù)管理系統(tǒng)(DMS)不僅提供了按照地域劃分網(wǎng)絡(luò)的物理視圖,還提供了按照IP網(wǎng)段劃分網(wǎng)絡(luò)的IP視圖。物理視圖和IP視圖是兩個相對獨(dú)立的拓?fù)湟晥D,給管理網(wǎng)絡(luò)提供了不同的視角。
根據(jù)不同的管理需求,利用拓?fù)湟晥D縮放、拓?fù)湟晥D自動布局、拓?fù)溥^濾等功能,可使網(wǎng)絡(luò)維護(hù)化繁為簡。
3、故障管理
對網(wǎng)絡(luò)緊急故障的處理是網(wǎng)絡(luò)運(yùn)維人員的一個重要工作,而及時發(fā)現(xiàn)故障是保證該工作有效開展的前提。應(yīng)用DMS可以有效感知故障。并協(xié)助進(jìn)行故障定位。
DMS故障管理包括告警管理和SysLog管理兩部分。
3.1 告警管理
普通的告警管理是網(wǎng)管接收到設(shè)備發(fā)來的Trap報(bào)文產(chǎn)生告警,但是在網(wǎng)絡(luò)有丟包或者設(shè)備上行接口down的情況下,網(wǎng)管服務(wù)器有可能接收不到Trap報(bào)文。如果出現(xiàn)這種情況就會導(dǎo)致維護(hù)人員因不能及時收到告警而延誤了恢復(fù)故障的最佳時間。
DMS針對此情況,將拓?fù)涔δ芘c告警功能結(jié)合,并提供了snmp輪巡和ping輪巡的工作方式,在收不到Trap報(bào)文時也能保證及時發(fā)現(xiàn)故障源。
告警管理主要功能包括:對告警信息和運(yùn)行信息進(jìn)行實(shí)時監(jiān)控、查詢設(shè)備的歷史告警信息和運(yùn)行信息、查詢和配置設(shè)備的告警信息等。
3.2 SysLog管理
SysLog管理提供了通過網(wǎng)管來查看SysLog信息的途徑,簡單、便捷。它可以長時間保存設(shè)備日志信息,避免因?yàn)樵O(shè)備緩沖區(qū)不夠大而導(dǎo)致重要日志信息遺失。
4、資源管理
在大規(guī)模IP網(wǎng)絡(luò)中,組網(wǎng)結(jié)構(gòu)復(fù)雜、設(shè)備數(shù)量繁多。網(wǎng)絡(luò)運(yùn)維人員需要掌握網(wǎng)絡(luò)中的設(shè)備(如網(wǎng)絡(luò)中設(shè)備、單板、子卡、端口、接口、鏈路等)資源的基本情況,以及網(wǎng)絡(luò)中的異常資源信息。網(wǎng)管系統(tǒng)的資源管理功能可以幫助完成該工作,并可將網(wǎng)絡(luò)中的資源數(shù)據(jù)直接導(dǎo)出為html、txt、csv格式的文檔,便于維護(hù)管理網(wǎng)絡(luò)資源。
5、網(wǎng)絡(luò)性能管理
若要更好地管理和改善網(wǎng)絡(luò)的運(yùn)行,網(wǎng)絡(luò)運(yùn)維人員還需掌握網(wǎng)絡(luò)的流量以及其他一些性能指標(biāo),并能對該指標(biāo)進(jìn)行長時間監(jiān)控分析,做到提前預(yù)防,防患未然。專業(yè)的網(wǎng)絡(luò)性能管理工具可以協(xié)助做到這點(diǎn)。
DMS-IP網(wǎng)絡(luò)性能管理器和TrafficView是網(wǎng)絡(luò)運(yùn)維人員常用的工具,其中TrafficView相對簡單,這里不作介紹。
DMS-IP網(wǎng)絡(luò)性能管理器可對大規(guī)模IP網(wǎng)絡(luò)性能進(jìn)行監(jiān)控。其主要實(shí)現(xiàn)對設(shè)備、單板的CPU占用率、內(nèi)存占用率性能指標(biāo)的采集,對鏈路、接口的流入/流出流量、流入/流出帶寬利用率性能指標(biāo)的采集,對設(shè)備間的時延、抖動、丟包率性能指標(biāo)的采集。其相關(guān)采集信息可通過報(bào)表系統(tǒng)進(jìn)行輸出。
運(yùn)維人員可以在網(wǎng)絡(luò)上部署多個網(wǎng)狀、星狀甚至點(diǎn)到點(diǎn)的測試點(diǎn)(網(wǎng)絡(luò)性能采集、測試的基準(zhǔn)點(diǎn),一般是一臺設(shè)備)用來進(jìn)行性能數(shù)據(jù)的采集分析,如圖1所示。
圖1 網(wǎng)絡(luò)性能管理器示意圖
通過IP網(wǎng)絡(luò)性能管理,運(yùn)維人員能夠通過查看性能數(shù)據(jù)、圖像等,了解網(wǎng)絡(luò)的運(yùn)營情況。此外還可以設(shè)置性能數(shù)據(jù)的閾值,當(dāng)性能數(shù)據(jù)越限時,可以提醒維護(hù)人員查看網(wǎng)絡(luò)狀況、及時進(jìn)行調(diào)整。以避免問題的發(fā)生。
6、網(wǎng)絡(luò)流量采集分析工具
在網(wǎng)絡(luò)運(yùn)維中,有時候需要了解哪些用戶訪問外部網(wǎng)絡(luò)比較頻繁、哪些網(wǎng)段之間互訪頻繁、哪些網(wǎng)站向外部提供了大量的數(shù)據(jù)服務(wù),以及某種類型流量異常等信息,可使用網(wǎng)流采集、分析工具實(shí)現(xiàn)該功能。
所謂網(wǎng)流(NetStream),是一個特定的源設(shè)備到一個特定的目的設(shè)備的單向包序列,它是由若干關(guān)鍵字標(biāo)識的一系列IP數(shù)據(jù)包組成的。關(guān)鍵字包括了源地址、目標(biāo)地址、源端口、目的端口、協(xié)議類型等。這些關(guān)鍵字是對網(wǎng)絡(luò)流量分析的依據(jù)。如振蕩播病毒的NetStream流數(shù)據(jù)典型特征為:目的端口445,協(xié)議類型TCP,字節(jié)數(shù)48。
通過對網(wǎng)流的采集和分析,可以為運(yùn)維中的流量工程分析、網(wǎng)絡(luò)設(shè)計(jì)優(yōu)化、網(wǎng)絡(luò)安全監(jiān)控等方面提供支撐。
7、網(wǎng)絡(luò)業(yè)務(wù)管理
IP網(wǎng)絡(luò)技術(shù)發(fā)展日新月異。MPLS VPN技術(shù)日益成為時代的新寵,這也對運(yùn)維工作提出更高的要求。
MPLS VPN的網(wǎng)絡(luò)維護(hù)涉及到客戶管理、VPN業(yè)務(wù)管理、網(wǎng)絡(luò)管理等工作。傳統(tǒng)人工管理容易造成配置出錯,一旦出現(xiàn)配置錯誤也很難察覺,并且難于進(jìn)行業(yè)務(wù)監(jiān)控和故障定位。不能有效地管理VPN客戶,管理效率低,不能滿足日益增長的業(yè)務(wù)需求。
華為VPN Manager業(yè)務(wù)管理系統(tǒng)可以實(shí)現(xiàn)從MPLS VPN業(yè)務(wù)規(guī)劃到業(yè)務(wù)部署、業(yè)務(wù)審計(jì)、業(yè)務(wù)保障,以及業(yè)務(wù)拆除的全流程工作,有效降低MPLS VPN業(yè)務(wù)管理的復(fù)雜度,使運(yùn)維效率得到質(zhì)的提升。
8、總結(jié)
總而言之,數(shù)據(jù)通信網(wǎng)絡(luò)運(yùn)維工作并不需要非常高深的理論知識背景,只要采用合適的方法、有效的網(wǎng)絡(luò)管理工具,都可以及時掌握網(wǎng)絡(luò)資源、網(wǎng)絡(luò)異常、網(wǎng)絡(luò)性能、網(wǎng)流情況,以及業(yè)務(wù)部署等實(shí)用信息,通過這些信息可以大大提升網(wǎng)絡(luò)管理的效率。
作者:李昕 來源:中國聯(lián)通網(wǎng)站