北方交通大學(xué) 賀峻峰
IP數(shù)據(jù)網(wǎng)不同于分組交換、DDN、幀中繼、ATM等基礎(chǔ)網(wǎng)絡(luò),它是一個開放的系統(tǒng),因此,IP數(shù)據(jù)網(wǎng)的管理有其特殊的復(fù)雜性。從技術(shù)角度出發(fā),IP網(wǎng)管系統(tǒng)就是要具備足夠的監(jiān)控手段,對網(wǎng)上事件做出快速反應(yīng),提供故障隔離措施,并依賴有效的操作控制手段,盡快解決故障,保證網(wǎng)絡(luò)的正常運行,實現(xiàn)集中操作和維護(hù)管理。IP網(wǎng)管系統(tǒng)要求對IP數(shù)據(jù)網(wǎng)上的故障、性能、配置、環(huán)境等信息進(jìn)行全面的掌握,對網(wǎng)絡(luò)整體和局部的流量、流向,網(wǎng)元設(shè)備的負(fù)荷情況等,提供實時統(tǒng)計的數(shù)據(jù),以此作為網(wǎng)絡(luò)優(yōu)化和網(wǎng)絡(luò)擴(kuò)容的參考。IP網(wǎng)管系統(tǒng)要求故障和告警處理實現(xiàn)自動化,并逐步建立和完善故障處理的知識庫,同時,IP網(wǎng)管系統(tǒng)要求提供基于定制的特殊服務(wù),以對該IP數(shù)據(jù)網(wǎng)進(jìn)行更加有效的管理。對于各種新業(yè)務(wù),如VoIP、VPN等,提供相應(yīng)的基于業(yè)務(wù)的管理手段和工具,實現(xiàn)面向用戶層的QoS管理,為用戶提供SLA(服務(wù)等級協(xié)議)管理等,也是IP網(wǎng)管系統(tǒng)發(fā)展的一個重要趨勢。
一、IP數(shù)據(jù)網(wǎng)網(wǎng)絡(luò)管理的現(xiàn)狀
考察當(dāng)前的各種IP數(shù)據(jù)網(wǎng)網(wǎng)管系統(tǒng),我們發(fā)現(xiàn)有以下局限,嚴(yán)重束縛了網(wǎng)管系統(tǒng)的效能:
" 采用輪詢?nèi)蝿?wù)繁重、時間長的集中輪詢方式,降低了網(wǎng)絡(luò)效能;
" 不同廠商的多個功能各異的網(wǎng)管軟件在同一個網(wǎng)絡(luò)上運行,彼此之間耦合性差,造成輪詢重復(fù),浪費系統(tǒng)資源,降低了網(wǎng)絡(luò)性能;
" 現(xiàn)有網(wǎng)管軟件的運行分析功能單一,不能對長期數(shù)據(jù)進(jìn)行統(tǒng)計分析并給出決策支持,缺乏智能化;
" 缺乏對各種服務(wù)業(yè)務(wù)的有效管理,當(dāng)前企業(yè)用戶對基于應(yīng)用服務(wù)的SLA管理提出了較高的要求;
" 網(wǎng)管系統(tǒng)的開發(fā)性和可擴(kuò)展性應(yīng)基于Web的網(wǎng)絡(luò)管理,網(wǎng)絡(luò)設(shè)備和接口的標(biāo)準(zhǔn)化應(yīng)提供對corba的支持等。
鑒于上述不足,新的綜合網(wǎng)管系統(tǒng)的開發(fā)應(yīng)在上述幾個方面進(jìn)行重點研究與突破,使網(wǎng)管系統(tǒng)能跟上IP網(wǎng)絡(luò)的快速發(fā)展,真正發(fā)揮管理的功能,并能指導(dǎo)網(wǎng)絡(luò)的規(guī)劃與發(fā)展。
二、IP數(shù)據(jù)網(wǎng)綜合網(wǎng)管系統(tǒng)的基本框架和分類介紹
與傳統(tǒng)的IP網(wǎng)管系統(tǒng)一樣,綜合網(wǎng)管系統(tǒng)主要由五大部分組成:配置管理、性能管理、故障管理、業(yè)務(wù)管理和安全管理。
1.配置管理
配置管理功能主要負(fù)責(zé)全面動態(tài)地管理全網(wǎng)所有網(wǎng)元設(shè)備的配置數(shù)據(jù)、設(shè)備保障、狀態(tài)檢查和安裝功能,能夠以圖形、文字等形式分層顯示配置相關(guān)的各類信息,并且具有編輯(增加、刪除、更改)、分類統(tǒng)計和打印輸出這些數(shù)據(jù)的功能。
設(shè)備配置數(shù)據(jù)包括系統(tǒng)內(nèi)各網(wǎng)元生成的設(shè)備配置參數(shù),也包括根據(jù)設(shè)計文件及管理資料人工生成的參數(shù)兩部分內(nèi)容。對配置數(shù)據(jù)的管理包括配置文件的生產(chǎn)和獲取,配置文件的維護(hù)和編輯,制定配置計劃,進(jìn)行配置校驗和配置結(jié)果模擬并使配置生效等。用于配置管理的軟件主要有針對Cisco設(shè)備的Cisco Netsys Baseliner、CWSI、ACL Manager(其中后兩者包括在CiscoWorks2000網(wǎng)管工具集當(dāng)中);HP OpenView網(wǎng)管平臺也提供了相應(yīng)的功能模塊支持配置管理,OpenView的NNM(Network Node Manager)可以自動發(fā)現(xiàn)網(wǎng)絡(luò)節(jié)點,生產(chǎn)網(wǎng)絡(luò)拓?fù)鋱D,并對各種網(wǎng)絡(luò)事件進(jìn)行處理。
綜合網(wǎng)管系統(tǒng)的配置管理系統(tǒng)由四個部分組成:網(wǎng)元管理平臺、基本配置管理、高級配置管理、用戶公共接口。網(wǎng)元管理平臺一般是設(shè)備廠商提供的設(shè)備管理平臺,負(fù)責(zé)與設(shè)備直接通訊,基本配置和高級配置管理完成配置功能,用戶公共接口不僅提供用戶訪問管理功能的接口,同時還提供與其他管理功能的接口。
在配置管理中,通過網(wǎng)絡(luò)拓?fù)鋱D,網(wǎng)管人員可以對整個網(wǎng)絡(luò)結(jié)構(gòu)有形象地了解,設(shè)備配置信息和網(wǎng)絡(luò)流量報警也可在拓?fù)鋱D上直觀地顯示。為此,研發(fā)人員在汲取NNM在拓?fù)滹@示方面的優(yōu)點后,基于JAVA語言自行開發(fā)了CHINANET骨干網(wǎng)網(wǎng)絡(luò)拓?fù)滹@示功能模塊。除對網(wǎng)絡(luò)設(shè)備可進(jìn)行拓?fù)浒l(fā)現(xiàn)外,該模塊還可分層(骨干網(wǎng)分全國和八大區(qū)兩層)顯示網(wǎng)絡(luò)拓?fù),對網(wǎng)絡(luò)設(shè)備和鏈路配置信息進(jìn)行查詢,實現(xiàn)拓?fù)鋱D上的流量報警,并針對骨干網(wǎng)網(wǎng)管的特殊需求,實現(xiàn)了實時路由監(jiān)測和ISIS路由仿真功能,這對骨干網(wǎng)網(wǎng)絡(luò)優(yōu)化和發(fā)展建設(shè)具有指導(dǎo)作用。該功能模塊實現(xiàn)了Web化,在權(quán)限許可范圍內(nèi)通過瀏覽器訪問APPLET的方式即可進(jìn)行。
系統(tǒng)可以基于HP NNM提取的管理信息生產(chǎn)網(wǎng)絡(luò)拓?fù),也可通過SNMP協(xié)議直接從骨干網(wǎng)設(shè)備的Agent中取得所需的MIB信息并存入數(shù)據(jù)庫。后一種數(shù)據(jù)采集方式有利于采集數(shù)據(jù)的維護(hù),基于定制的新功能的開發(fā),并且免去了與NNM的數(shù)據(jù)接口。由于是“按需而取”,采集的數(shù)據(jù)量很小,不會造成網(wǎng)絡(luò)資源的浪費。
2.性能管理
性能管理主要負(fù)責(zé)全網(wǎng)性能監(jiān)視、性能控制和性能分析,完成鏈路性能測試以及各類性能信息的收集、統(tǒng)計、存儲,同時還負(fù)責(zé)性能信息數(shù)據(jù)庫的維護(hù),性能管理閾值的設(shè)置與閾值越過報告,產(chǎn)生按需的性能報告,系統(tǒng)基于性能報告和統(tǒng)計分析,通過運行管理功能和配置管理功能對網(wǎng)絡(luò)進(jìn)行調(diào)整,以達(dá)到改善網(wǎng)絡(luò)總體性能水平的目的。性能管理功能包括數(shù)據(jù)信息采集、性能信息的統(tǒng)計和存儲、性能管理閾值處理和性能報告生產(chǎn)等部分。研發(fā)人員采取的實現(xiàn)方案是:自主開發(fā)和與第三方軟件相結(jié)合,自主開發(fā)的軟件通過第三方接口來獲取信息,并對信息進(jìn)行再加工分析、提取、歸類、統(tǒng)計以及與其他管理模塊進(jìn)行信息交互,對網(wǎng)絡(luò)進(jìn)行實時動態(tài)監(jiān)控并獲取相應(yīng)性能參數(shù),及時地與其他模塊互動。
性能管理系統(tǒng)通過Cisco NetFlow軟件,采集路由器各端口基于QoS 級的數(shù)據(jù)流,捕獲每個網(wǎng)絡(luò)流量的分類和優(yōu)先權(quán),在服務(wù)質(zhì)量的基礎(chǔ)上區(qū)分?jǐn)?shù)據(jù)流并加以處理,生產(chǎn)相應(yīng)報表。NetFlow采集數(shù)據(jù)還可用于平衡網(wǎng)絡(luò)的負(fù)載,查找網(wǎng)絡(luò)的故障,優(yōu)化網(wǎng)絡(luò)的性能以及SLA吞吐量監(jiān)測和基于數(shù)據(jù)流的計費等方面。
系統(tǒng)用Cisco IPM(Internet Performance Managerment)軟件,通過發(fā)送echo、pathecho數(shù)據(jù)包測定網(wǎng)絡(luò)的響應(yīng)時間,進(jìn)而可以采集網(wǎng)絡(luò)時延、丟包率和抖動等網(wǎng)絡(luò)性能參數(shù),生產(chǎn)反映網(wǎng)絡(luò)服務(wù)質(zhì)量的報告,指導(dǎo)網(wǎng)管人員使用相應(yīng)的QoS策略,實現(xiàn)對企業(yè)用戶的SLA管理。
基于HP OpenView的NetMetrix、Network Hearth/Concord等軟件,系統(tǒng)可以發(fā)現(xiàn)并隔離網(wǎng)絡(luò)故障,反映網(wǎng)絡(luò)性能趨勢,監(jiān)測網(wǎng)絡(luò)資源和性能,測定流量峰值并產(chǎn)生相應(yīng)報表。
3.故障/告警管理
故障/告警管理實現(xiàn)對數(shù)據(jù)網(wǎng)內(nèi)所有網(wǎng)元設(shè)備的告警監(jiān)測和故障定位,配合運行管理功能進(jìn)行故障排除和系統(tǒng)設(shè)備復(fù)測,還能收集和處理各網(wǎng)絡(luò)單元(NE)的各種故障、告警及網(wǎng)絡(luò)狀態(tài)異常信息,并具有各種分類統(tǒng)計和指導(dǎo)分析的功能。
告警/故障管理主要包括以下內(nèi)容:告警數(shù)據(jù)的采集和存儲、定制告警分類和級別、告警數(shù)據(jù)過濾和相關(guān)性分析、告警的實時顯示和生成報表、告警/故障處理、告警/故障數(shù)據(jù)庫的維護(hù)以及與知識庫系統(tǒng)的接口等。故障/告警管理以工作流的方式,提供了網(wǎng)管的自動化功能,通過一系列的工具和接口,幫助系統(tǒng)人員完成日常維護(hù)和管理工作。本系統(tǒng)中常見的工作流為值班日志和故障工作流。
該系統(tǒng)作為網(wǎng)管系統(tǒng)功能中最重要的一部分,對故障和告警管理功能的要求非常細(xì)致,有多種第三方軟件提供故障管理功能,并且在實現(xiàn)功能上各有側(cè)重。為開發(fā)綜合的故障和告警管理系統(tǒng),研發(fā)人員的任務(wù)主要是對各種第三方軟件在功能實現(xiàn)、體系結(jié)構(gòu)、擴(kuò)展性和靈活性、再開發(fā)性和售后服務(wù)等方面經(jīng)過對比,采用自主開發(fā)和三方軟件相結(jié)合的解決方案,在選定的第三方軟件的故障管理平臺上,利用其采集的數(shù)據(jù)進(jìn)行綜合處理與再分析,并基于用戶提出的特殊需求開發(fā)定制的功能模塊。自主開發(fā)軟件的功能側(cè)重于與第三方軟件的無縫集成。
在CHINANET骨干網(wǎng)網(wǎng)管項目的告警/故障管理模塊中,研發(fā)人員選取Micromuse/Netcool作為主要的故障管理平臺,HP OpenView NNM 作為其補充,自主開發(fā)軟件完成可定制的管理界面的生成、基于工作流的故障發(fā)現(xiàn)、工作流程設(shè)計、與其他管理模塊間的接口與互動、在網(wǎng)絡(luò)拓?fù)鋱D上的鏈路故障/告警顯示以及故障/告警解決知識庫的維護(hù)等。
4.業(yè)務(wù)管理
該系統(tǒng)應(yīng)實現(xiàn)基于應(yīng)用/服務(wù)的網(wǎng)絡(luò)管理,向網(wǎng)管人員明確反映網(wǎng)絡(luò)的實時質(zhì)量狀況,為網(wǎng)絡(luò)規(guī)劃提供信息,并能提供有區(qū)別的服務(wù),針對用戶需求,特別是按照企業(yè)大用戶的需求,提供基于QoS的服務(wù)級別協(xié)議(SLA)、計費等功能。綜合網(wǎng)管系統(tǒng)對業(yè)務(wù)管理的功能劃分以及與其它管理模塊的集成進(jìn)行了大量的研究,提出的解決方案如下:
對于網(wǎng)絡(luò)的服務(wù)質(zhì)量,使用Cisco的IPM軟件,對骨干網(wǎng)中的Cisco設(shè)備收集相關(guān)數(shù)據(jù),經(jīng)分析處理可以獲得反映網(wǎng)絡(luò)QoS的時延、丟包率、網(wǎng)絡(luò)吞吐量等參數(shù),進(jìn)而生成QoS性能評價報告;
對于應(yīng)用的服務(wù)質(zhì)量,基于Netcool的ISM軟件,可以對多達(dá)18種應(yīng)用層協(xié)議(包括DHCP, DNS, FTP, HTTP, RADIUS, POP3, SMTP等)的服務(wù)質(zhì)量進(jìn)行監(jiān)視,并生成性能報告;相同的功能也可由自行開發(fā)的軟件,完全按照用戶的定制來實現(xiàn);
針對IP網(wǎng)的特殊應(yīng)用服務(wù)(如VPN、VoIP、線路租用等),使用直接針對該項業(yè)務(wù)的QoS監(jiān)測管理軟件,可以獲得更詳細(xì)的QoS數(shù)據(jù),有效地保證SLA管理水平。
5.安全管理
安全管理對全網(wǎng)安全起保證作用,主要功能包括:權(quán)限管理功能、數(shù)據(jù)安全管理以及安全檢測功能。作為網(wǎng)絡(luò)管理的基本功能之一,安全管理通過控制信息訪問點來保護(hù)網(wǎng)絡(luò)中的敏感信息。在設(shè)計過程中,應(yīng)充分考慮保護(hù)敏感信息和允許網(wǎng)管人員訪問適當(dāng)信息以進(jìn)行工作這兩方面的需要,合理設(shè)置安全措施來保證系統(tǒng)和數(shù)據(jù)的安全。此外,對某些關(guān)鍵設(shè)計信息,如用戶密碼等,還應(yīng)提供加密傳輸和存儲功能以加強(qiáng)保護(hù)。研發(fā)人員采取的解決方案是RADUIS+TACACS。
三、基于特殊定制的IP綜合網(wǎng)管系統(tǒng)及其舉例
對于一個應(yīng)用于特定場合的IP網(wǎng)管系統(tǒng),基于定制的功能開發(fā)能夠針對特定場合的特殊應(yīng)用,完成網(wǎng)管人員最關(guān)心和最急待解決的問題,是IP網(wǎng)管系統(tǒng)高效可靠、有針對性地管理網(wǎng)絡(luò)的關(guān)鍵。研發(fā)人員在網(wǎng)管軟件的開發(fā)過程中,深入了解了CHINANET骨干網(wǎng)網(wǎng)管的特殊性和特別需求,開發(fā)出一系列解決骨干網(wǎng)網(wǎng)管實際問題的應(yīng)用模塊和小工具,給網(wǎng)管人員帶來極大的方便。下面以ISIS路由仿真模塊的設(shè)計為例子作簡單介紹。
CHINANET骨干網(wǎng)內(nèi)部主要采用BGP和ISIS兩種路由協(xié)議,大區(qū)間用BGP協(xié)議,大區(qū)內(nèi)使用ISIS協(xié)議。骨干網(wǎng)網(wǎng)絡(luò)復(fù)雜,鏈路流量大,宏觀上缺乏一種工具,能夠通過簡單的模擬操作,指導(dǎo)對網(wǎng)絡(luò)和設(shè)備進(jìn)行有效配置,使整個網(wǎng)絡(luò)的流量流向更趨于合理,使網(wǎng)絡(luò)擁塞盡量減少。ISIS路由仿真模塊正是基于這樣的目的而開發(fā)的。
ISIS路由仿真模塊位于網(wǎng)絡(luò)拓?fù)滹@示部分,在網(wǎng)絡(luò)拓?fù)鋱D基礎(chǔ)上,選定源點,根據(jù)網(wǎng)絡(luò)中所有通過ISIS路由協(xié)議獲得路由的metric值,計算出一條最短路徑在拓?fù)鋱D上以不同顏色的線反映處理;當(dāng)網(wǎng)管人員出于減輕某段鏈路流量的考慮而改變一條或多條路由的metric值時,該模塊重新執(zhí)行最短路徑算法(Dijkstra算法),計算并畫出新的最短路徑。該模塊通過更改前后最短路徑的變化可以指導(dǎo)網(wǎng)管人員對網(wǎng)管設(shè)備(如路由器路由協(xié)議的優(yōu)先級別等)進(jìn)行相應(yīng)配置,從而達(dá)到提高網(wǎng)絡(luò)效能、負(fù)載均衡等目的。由于當(dāng)前所有的第三方軟件都沒有提供類似的路由仿真功能,因此研發(fā)人員開發(fā)的ISIS路由仿真模塊在傳統(tǒng)網(wǎng)管系統(tǒng)所要求的網(wǎng)絡(luò)拓?fù)浞謱语@示的基礎(chǔ)之上,為骨干網(wǎng)網(wǎng)管人員完成網(wǎng)絡(luò)優(yōu)化這一復(fù)雜任務(wù)提供了一種簡單有效的方法。
四、IP綜合網(wǎng)管系統(tǒng)的發(fā)展方向
現(xiàn)代計算機(jī)網(wǎng)絡(luò)已經(jīng)演化成多種體系結(jié)構(gòu)的網(wǎng)絡(luò)互聯(lián),這種異質(zhì)性對網(wǎng)管軟件提出了新的要求。如何解決實際網(wǎng)絡(luò)中地理的分散性、網(wǎng)絡(luò)體系結(jié)構(gòu)的復(fù)雜性、網(wǎng)絡(luò)設(shè)備的自治性、網(wǎng)絡(luò)狀態(tài)的多變性以及網(wǎng)絡(luò)通信量增長的爆炸性等問題,如何建立和維護(hù)一個網(wǎng)管體系分布化、網(wǎng)管系統(tǒng)綜合化、網(wǎng)管界面Web化、管理結(jié)構(gòu)標(biāo)準(zhǔn)化、網(wǎng)管系統(tǒng)智能化和面向服務(wù)的綜合網(wǎng)絡(luò)管理系統(tǒng),以便有效地維護(hù)和管理網(wǎng)絡(luò),并對網(wǎng)絡(luò)的發(fā)展和規(guī)劃給予建設(shè)性的指導(dǎo)等等,對每一個網(wǎng)管系統(tǒng)開發(fā)人員和網(wǎng)絡(luò)管理人員來說,都是值得思索的問題。
摘自 通信世界