近期,為貫徹落實中國電信集團云網(wǎng)運營數(shù)字化轉(zhuǎn)型戰(zhàn)略,提升云網(wǎng)監(jiān)控排障能力,不斷積極探索提升網(wǎng)絡(luò)自智水平的方法,湖北電信聯(lián)合中信科移動針對網(wǎng)絡(luò)維護中故障定位效率低、設(shè)備隱患監(jiān)控識別難的痛點,推出基于AI引擎的智能運維解決方案,實現(xiàn)了故障根因精準定位、設(shè)備隱患提前識別,有效提升了網(wǎng)絡(luò)穩(wěn)定性。
告警自智—提升分析處理效率
為了降低維護人員日常告警的分析工作量,基于歷史告警,提取網(wǎng)絡(luò)拓撲、配置、日志、故障對象等信息的關(guān)聯(lián)特征,結(jié)合已有告警知識庫,利用AI算法對數(shù)據(jù)進行挖掘和訓(xùn)練,形成告警的根因-衍生關(guān)聯(lián)模型。在注入AI模型后,可以對網(wǎng)絡(luò)中產(chǎn)生的告警進行關(guān)聯(lián)識別和根因診斷,從而提升故障排查與處理效率。
在現(xiàn)網(wǎng)規(guī)模試點,告警關(guān)聯(lián)準確度超90%,根因告警分析用時縮短了5~8倍,顯著提升了故障排查與定位的效率。
圖1 告警自智診斷結(jié)果
設(shè)備隱患識別預(yù)測—主動運維,提升網(wǎng)絡(luò)質(zhì)量
為了將設(shè)備隱患扼殺在初期,將“健康體檢”理念引入到網(wǎng)絡(luò)運維,對無線網(wǎng)元的關(guān)鍵器件進行健康度評估。通過監(jiān)測關(guān)鍵指標的狀態(tài)和變化趨勢,結(jié)合AI訓(xùn)練模型,可對光模塊、時鐘源、BBU/RRU輸入電壓等指標實現(xiàn)健康度自動監(jiān)控,形成關(guān)鍵器件的健康評分并輸出檢查報告,對風(fēng)險器件提前預(yù)警,協(xié)助運維人員提前識別處理。經(jīng)現(xiàn)網(wǎng)規(guī)模試點,故障隱患識別準確率達到90%以上,并經(jīng)過上站核驗,評估和實際情況相符,為主動運維提供了重要依據(jù),提升了網(wǎng)絡(luò)質(zhì)量。
圖2 光模塊品質(zhì)監(jiān)控
通過規(guī)模試點,充分驗證了中信科移動基于AI引擎的智能運維解決方案,可有效實現(xiàn)告警根因快速精準定位、設(shè)備隱患提前識別,不僅可大幅提升運維效率,而且有效提升了網(wǎng)絡(luò)設(shè)備的穩(wěn)定性。
后續(xù),湖北電信將持續(xù)與中信科移動緊密協(xié)作,打通智能運維數(shù)據(jù)和上級采控平臺的對接通道,共同推進網(wǎng)絡(luò)自智能力更上一層樓,構(gòu)建更智能的5G網(wǎng)絡(luò)。