通過(guò)觀察LTE的的忙時(shí)指標(biāo),發(fā)現(xiàn)某運(yùn)營(yíng)商LTE這幾天尋呼擁塞率突然變高。尋呼擁塞率由0%上升到1.1%,如下圖所示。

2.1 TOP小區(qū)分析
通過(guò)提取網(wǎng)管U31的尋呼擁塞率指標(biāo)性能分析,發(fā)現(xiàn)尋呼擁塞率主要是由TOP小區(qū)引起的,BBU397591站點(diǎn)下掛的6個(gè)小區(qū)的尋呼擁塞率達(dá)到100%,導(dǎo)致整網(wǎng)尋呼擁塞率變高,如下圖所示,其他5個(gè)小區(qū)的指標(biāo)變化與圖片一樣。故問(wèn)題定位為T(mén)OP小區(qū)問(wèn)題,重點(diǎn)解決397591站點(diǎn)的尋呼擁塞率問(wèn)題。

2.2 指標(biāo)分析
按照每小時(shí)粒度提取指標(biāo)發(fā)現(xiàn),BBU397591站點(diǎn)下掛的6個(gè)小區(qū)從4月10號(hào)開(kāi)始指標(biāo)突然惡化,且無(wú)線連接成功率幾乎為0,尋呼記錄丟棄個(gè)數(shù)幾乎為尋呼記錄接收個(gè)數(shù),RRC連接建立成功次數(shù)幾乎為0,RRC連接失敗次數(shù)也為0,如下圖所示,其他5個(gè)小區(qū)的指標(biāo)變化與圖片一樣。6個(gè)小區(qū)均惡化表明為共性問(wèn)題,重點(diǎn)排查方向?yàn)椋赫军c(diǎn)故障告警和這幾天是否對(duì)這6個(gè)小區(qū)進(jìn)行參數(shù)修改。

2.3 站點(diǎn)故障排查
排查該站點(diǎn)的當(dāng)前告警,未發(fā)現(xiàn)任何告警,站點(diǎn)正常。查詢(xún)小區(qū)狀態(tài),小區(qū)也均正常。查詢(xún)?cè)撜军c(diǎn)的歷史告警,發(fā)現(xiàn)BPL板經(jīng)常重新初始化,初步判斷為硬件故障,通知督導(dǎo)安排施工隊(duì)處理。
2.4 參數(shù)核查
為進(jìn)一步排查是否因?yàn)閰?shù)問(wèn)題導(dǎo)致單板經(jīng)常重新初始化,根據(jù)電信參數(shù)對(duì)該站點(diǎn)進(jìn)行參數(shù)核查,參數(shù)均配置正常,同時(shí)也將該站點(diǎn)作為源對(duì)象與同一機(jī)房的其他BBU進(jìn)行參數(shù)對(duì)比,未發(fā)現(xiàn)參數(shù)異常。
2.5 操作記錄查詢(xún)
查詢(xún)?cè)撜镜淖罱鼛滋斓臍v史操作記錄均未發(fā)現(xiàn)異常操作,而且在指標(biāo)惡化的這幾天沒(méi)有執(zhí)行過(guò)參數(shù)修改。
2.6 指標(biāo)詳細(xì)分析
對(duì)指標(biāo)進(jìn)一步做詳細(xì)分析發(fā)現(xiàn):
1:同一時(shí)間點(diǎn)該BBU下掛的兩個(gè)物理站點(diǎn)的尋呼記錄接收個(gè)數(shù)有時(shí)不一致,如下圖所示。懷疑TAC配置成不一樣,因?yàn)槿绻鸗AC相同,這兩個(gè)物理站點(diǎn)的尋呼記錄接收個(gè)數(shù)應(yīng)該接近,F(xiàn)網(wǎng)核查6個(gè)小區(qū)的TAC,發(fā)現(xiàn)TAC是一致的。
2:懷疑是否因?yàn)閷ず舸螖?shù)激增導(dǎo)致尋呼擁塞,通過(guò)對(duì)比同一機(jī)房的尋呼次數(shù),發(fā)現(xiàn)數(shù)量級(jí)基本一致,而且均未超過(guò)尋呼信道容量,如下圖所示。

3:問(wèn)題BBU397591的RRC連接次數(shù)幾乎為零,尋呼記錄丟棄個(gè)數(shù)接近尋呼記錄接收個(gè)數(shù),但尋呼擁塞個(gè)數(shù)均為零。
查閱指標(biāo)計(jì)數(shù)器的定義,發(fā)現(xiàn)尋呼擁塞個(gè)數(shù)為0,即尋呼隊(duì)列并不滿,尋呼容量沒(méi)問(wèn)題;尋呼記錄丟棄個(gè)數(shù)接近尋呼記錄接收個(gè)數(shù),即eNodeB每次都錯(cuò)過(guò)尋呼時(shí)機(jī),并未發(fā)送出去。初步懷疑該問(wèn)題BBU出現(xiàn)掛死,即6個(gè)小區(qū)為睡眠小區(qū)。睡眠小區(qū)不會(huì)對(duì)指標(biāo)造成影響,平時(shí)很難發(fā)現(xiàn),但接入數(shù)為0,用戶數(shù)為0。
4:根據(jù)第3步分析,初步判斷該問(wèn)題BBU的6個(gè)小區(qū)可能為睡眠小區(qū),為進(jìn)一步確認(rèn),提取更詳細(xì)的指標(biāo),包含RRC/尋呼/PRB/MSG3/preamble,發(fā)現(xiàn)在問(wèn)題時(shí)段該BBU下掛的6個(gè)小區(qū)存在很多異常指標(biāo)。
1:《可使用的Preamble個(gè)數(shù)》幾乎為0。
2:《RRC連接建立成功次數(shù)》和《RRC連接失敗次數(shù)》幾乎為0。
3:《Msg3檢測(cè)成功次數(shù)》和《Msg3丟棄次數(shù)》幾乎為0。
4:《小區(qū)上行信道實(shí)際使用PRB個(gè)數(shù)》和《小區(qū)上行信道可用的PRB個(gè)數(shù)》均為0。
5:《小區(qū)下行信道實(shí)際使用PRB個(gè)數(shù)》和《小區(qū)下行信道可用的PRB個(gè)數(shù)》均為0。
據(jù)此可判定該BBU硬件故障,下掛的6個(gè)小區(qū)為睡眠小區(qū),睡眠小區(qū)的解決辦法就是復(fù)位RRU,復(fù)位單板(BPL板/CC板/FS板),復(fù)位整個(gè)網(wǎng)元,如果復(fù)位未解決問(wèn)題的話,建議單板重新插拔下或更換單板。
將RRU掉電復(fù)位,觀察該站點(diǎn)指標(biāo),發(fā)現(xiàn)指標(biāo)恢復(fù)正常。

1:《可使用的Preamble個(gè)數(shù)》恢復(fù)正常。
2:《RRC連接建立成功次數(shù)》和《RRC連接失敗次數(shù)》恢復(fù)正常。
3:《Msg3檢測(cè)成功次數(shù)》和《Msg3丟棄次數(shù)》恢復(fù)正常。
4:《小區(qū)上行信道實(shí)際使用PRB個(gè)數(shù)》和《小區(qū)上行信道可用的PRB個(gè)數(shù)》恢復(fù)正常。
5:《小區(qū)下行信道實(shí)際使用PRB個(gè)數(shù)》和《小區(qū)下行信道可用的PRB個(gè)數(shù)》恢復(fù)正常。
觀察整網(wǎng)忙時(shí)指標(biāo),發(fā)現(xiàn)指標(biāo)正常,如下圖所示。

該問(wèn)題站點(diǎn)為BBU經(jīng)常重新初始化,通過(guò)查看當(dāng)前告警,查看不到問(wèn)題,故建議查看當(dāng)前告警的同時(shí)也查看歷史告警,借助歷史告警排查問(wèn)題。
BPL板出現(xiàn)故障會(huì)影響掛的所有小區(qū),使小區(qū)有可能成為睡眠小區(qū)。睡眠小區(qū)不會(huì)對(duì)指標(biāo)造成影響,平時(shí)很難發(fā)現(xiàn),只有通過(guò)查看該小區(qū)的詳細(xì)指標(biāo)(RRC建立次數(shù)、Msg3檢測(cè)成功次數(shù)、可使用的Preamble個(gè)數(shù)、PRB個(gè)數(shù))來(lái)發(fā)現(xiàn)該問(wèn)題。睡眠小區(qū)的解決辦法就是復(fù)位RRU,復(fù)位單板(BPL板/CC板/FS板),復(fù)位整個(gè)網(wǎng)元。
掃碼關(guān)注5G通信官方公眾號(hào),免費(fèi)領(lǐng)取以下5G精品資料
1、回復(fù)“YD5GAI”免費(fèi)領(lǐng)取《中國(guó)移動(dòng):5G網(wǎng)絡(luò)AI應(yīng)用典型場(chǎng)景技術(shù)解決方案白皮書(shū)》
2、回復(fù)“5G6G”免費(fèi)領(lǐng)取《5G_6G毫米波測(cè)試技術(shù)白皮書(shū)-2022_03-21》
3、回復(fù)“YD6G”免費(fèi)領(lǐng)取《中國(guó)移動(dòng):6G至簡(jiǎn)無(wú)線接入網(wǎng)白皮書(shū)》
4、回復(fù)“LTBPS”免費(fèi)領(lǐng)取《《中國(guó)聯(lián)通5G終端白皮書(shū)》》
5、回復(fù)“ZGDX”免費(fèi)領(lǐng)取《中國(guó)電信5G NTN技術(shù)白皮書(shū)》
6、回復(fù)“TXSB”免費(fèi)領(lǐng)取《通信設(shè)備安裝工程施工工藝圖解》
7、回復(fù)“YDSL”免費(fèi)領(lǐng)取《中國(guó)移動(dòng)算力并網(wǎng)白皮書(shū)》
8、回復(fù)“5GX3”免費(fèi)領(lǐng)取《 R16 23501-g60 5G的系統(tǒng)架構(gòu)1》