網(wǎng)絡(luò)管理中的“一大隱患”
兩年前,北京網(wǎng)通的網(wǎng)絡(luò)管理員還能輕松維護(hù)網(wǎng)絡(luò),管理全網(wǎng)設(shè)備,為北京網(wǎng)通的業(yè)務(wù)系統(tǒng)提供高效的運(yùn)行平臺。但隨著業(yè)務(wù)的不斷增加,網(wǎng)絡(luò)規(guī)模日漸復(fù)雜,北京網(wǎng)通的網(wǎng)絡(luò)管理人員有一天突然發(fā)現(xiàn) “總是忙于救火,顧此失彼,不能及時處理并發(fā)的網(wǎng)絡(luò)故障。”這一現(xiàn)象嚴(yán)重影響了網(wǎng)絡(luò)環(huán)境的穩(wěn)定,會導(dǎo)致用戶終端異常,成為北京網(wǎng)通潛在的一大隱患。
考查一系列行業(yè)案例后,北京網(wǎng)通高層意識到了問題所在——傳統(tǒng)的手工運(yùn)維暴露了越來越多的問題,以自動化、流程化代替?zhèn)鹘y(tǒng)手工運(yùn)維勢不可擋。最終,北京網(wǎng)通選定在電信行業(yè)具有卓越聲譽(yù)的國產(chǎn)網(wǎng)管軟件廠商—游龍科技為合作伙伴,著手組建網(wǎng)管系統(tǒng)。經(jīng)過近一年的調(diào)研、溝通和交流,游龍科技針對北京網(wǎng)通的網(wǎng)管系統(tǒng)進(jìn)行了一系列的規(guī)劃和設(shè)計,并提供了完善健全的SiteView ECC系統(tǒng)管理解決方案。
分布式網(wǎng)管 “全力解憂”
談到網(wǎng)管系統(tǒng)一期工程,北京網(wǎng)通綜合信息中心網(wǎng)監(jiān)孫淼介紹說,“非常成功。主要包括主體監(jiān)測和二次開發(fā)兩個部分。”應(yīng)用SiteView ECC 的卓越性能監(jiān)測,北京網(wǎng)通逐步實施了分布式的監(jiān)測架構(gòu),全面、深入監(jiān)控北京網(wǎng)通網(wǎng)絡(luò)系統(tǒng);針對網(wǎng)絡(luò)管理需求,北京網(wǎng)通與游龍科技共同開發(fā)了IT資源管理和故障知識管理兩個子系統(tǒng),尋覓到個性化網(wǎng)管利器。
北京網(wǎng)通目前的網(wǎng)絡(luò)設(shè)備絕大多數(shù)是市場上的主流設(shè)備如CISCO、華為等大型交換機(jī)、路由器,此外還有大量的服務(wù)器及數(shù)目眾多的PC設(shè)備。游龍科技高級工程師王華說,“網(wǎng)絡(luò)環(huán)境雖很復(fù)雜,不過SiteView ECC足以應(yīng)對,分布式監(jiān)測架構(gòu)能滿足集中管理的需求!
北京網(wǎng)通部署了一個SC設(shè)備(一級),三個SE設(shè)備(二級),最后就是終端設(shè)備,此外還有一個DB與SC相接,如下圖所示。其中SC是中心控制平臺,通過其可以實現(xiàn)實時監(jiān)控、報表生成、報警發(fā)送等功能;在SE上安裝相關(guān)的監(jiān)測器,可以對終端實施相應(yīng)的監(jiān)測,并且進(jìn)行采集數(shù)據(jù)操作,然后通過Web service發(fā)送給DB;DB主要負(fù)責(zé)收集數(shù)據(jù),并進(jìn)行處理分析,當(dāng)SC對DB發(fā)出一個命令時,就反饋數(shù)據(jù)給SC,SC根據(jù)其判斷規(guī)則來判斷網(wǎng)絡(luò)系統(tǒng)是否處于正常運(yùn)行狀態(tài)。

“傾心護(hù)航”業(yè)務(wù)系統(tǒng)
一期網(wǎng)管系統(tǒng)目前主要監(jiān)測IP增值業(yè)務(wù)中最重要的三項,分別是:一、BBN,北京網(wǎng)通的門戶網(wǎng)站,用戶通過網(wǎng)站進(jìn)行業(yè)務(wù)申報、繳費(fèi)以及其它一些相關(guān)業(yè)務(wù),是網(wǎng)絡(luò)管理重點維護(hù)對象;二、流媒體,主要有在線視頻播放、互聯(lián)網(wǎng)直播、視頻會議等功能,是關(guān)鍵應(yīng)用系統(tǒng);三、AIOBS/CBS綜合計費(fèi)管理系統(tǒng),用戶可以采用現(xiàn)金、支票、銀行劃帳等多種繳費(fèi)方式繳費(fèi),是保障北京網(wǎng)通收益的關(guān)鍵。
對于BBN,主要監(jiān)測支撐北京寬帶網(wǎng)正常運(yùn)行的Web服務(wù)器的CPU、內(nèi)存、磁盤等的使用情況,并且可以發(fā)送數(shù)據(jù)包檢測URL,此外還對一些FTP服務(wù)器、DNS等進(jìn)行監(jiān)測。這些監(jiān)測實現(xiàn)了SiteView ECC對網(wǎng)站訪問情況的實時跟蹤檢測,如果不能正常訪問會及時以短信、聲音、顏色等形式報警,網(wǎng)絡(luò)工程師能及時明確故障信息,進(jìn)行快速處理。
對于流媒體服務(wù)的監(jiān)測,主要是通過監(jiān)測北京網(wǎng)通全網(wǎng)的網(wǎng)絡(luò)流量來實現(xiàn)。在線視頻播放、互聯(lián)網(wǎng)直播以及視頻會議都對帶寬提出了比較高的要求,因此網(wǎng)絡(luò)管理員必須明確網(wǎng)絡(luò)流量。SiteView ECC通過對一些網(wǎng)絡(luò)設(shè)備的接口流量進(jìn)行監(jiān)測控制,并根據(jù)要求進(jìn)行管理,能保證全網(wǎng)處于有效、平穩(wěn)的運(yùn)行狀態(tài),為用戶的業(yè)務(wù)需求提供了良好的應(yīng)用平臺。
對于計費(fèi)系統(tǒng),SiteView ECC主要監(jiān)測其統(tǒng)計數(shù)據(jù)的數(shù)據(jù)庫,通過監(jiān)測數(shù)據(jù)庫文件系統(tǒng)、表空間(Tablespace)使用情況、事物日志空間的使用情況、數(shù)據(jù)庫死鎖、數(shù)據(jù)庫進(jìn)程的監(jiān)控等一系列性能參數(shù),并通過軟件讓程序定時執(zhí)行一些重要的與關(guān)鍵應(yīng)用相關(guān)的SQL語句,如果查詢時間超過閥值或查詢結(jié)果不正確,表明數(shù)據(jù)庫出現(xiàn)問題。如此一來,能保障計費(fèi)系統(tǒng)的數(shù)據(jù)信息處于穩(wěn)定狀態(tài),保障了北京網(wǎng)通的網(wǎng)絡(luò)高效運(yùn)轉(zhuǎn)。
“精心管理”資產(chǎn)與知識
二次開發(fā)出的兩個子系統(tǒng)也有著重要的應(yīng)用。IT資源管理子系統(tǒng)能統(tǒng)計北京網(wǎng)通內(nèi)所有的網(wǎng)絡(luò)設(shè)備、服務(wù)器以及一些相關(guān)備件的設(shè)備信息,方便網(wǎng)絡(luò)管理員進(jìn)行維護(hù)管理,此外還提供信息檢索功能,通過手工錄入設(shè)備信息后,網(wǎng)絡(luò)管理員能輕松查詢到提供關(guān)鍵服務(wù)的設(shè)備信息,并進(jìn)行實時監(jiān)控管理。故障知識管理子系統(tǒng)能充當(dāng)起網(wǎng)管管理員的故障知識庫角色,通過其故障知識系統(tǒng)能了解各種故障的處理方法;通過其故障信息檢索功能能查詢網(wǎng)絡(luò)設(shè)備出現(xiàn)故障的時間及具體故障信息;通過自定義故障知識系統(tǒng)能將遇到的一些新的故障存貯到故障知識系統(tǒng)中,方便日后進(jìn)行查詢應(yīng)用。
----天極網(wǎng)