故障現(xiàn)象
通過查看KPI指標(biāo),發(fā)現(xiàn)某局4月份切換出成功率異常偏低,如下表所示。

對小區(qū)級指標(biāo)進(jìn)行分析發(fā)現(xiàn),83%的切換失敗次數(shù)集中在100個(gè)小區(qū)左右,而全網(wǎng)小區(qū)約4500個(gè),問題小區(qū)相對比較集中,且切換失敗原因主要集中在“目標(biāo)側(cè)準(zhǔn)備失敗”上。
故障分析
1.由于近期2.1G宏站替換為1.8G的站點(diǎn)較多,懷疑替換過程中,鄰區(qū)關(guān)系添加錯(cuò)誤,或者存在配置錯(cuò)誤的冗余鄰區(qū)所致。對全網(wǎng)的鄰區(qū)定義進(jìn)行了檢查,發(fā)現(xiàn)確實(shí)存在部分定義錯(cuò)誤的鄰區(qū),但優(yōu)化后觀察指標(biāo),切換成功率依舊沒有明顯好轉(zhuǎn),仍然在93%左右。
2.篩選切換失敗次數(shù)較多的下沙警官學(xué)院(ID:311609,PCI:69)和下沙6號(hào)大街和11號(hào)大街交叉口(ID:312544,PCI:192)站點(diǎn),現(xiàn)場進(jìn)行測試,并讓核心網(wǎng)配合進(jìn)行信令跟蹤。
現(xiàn)場測試發(fā)現(xiàn),當(dāng)UE占用下沙6號(hào)大街和11號(hào)大街交叉口-1小區(qū)時(shí),MR上報(bào)了下沙警官學(xué)院-1小區(qū)的較強(qiáng)鄰區(qū),但沒有進(jìn)行切換,同時(shí)UE一直上報(bào)MR,最終發(fā)起RRC重建立請求并失敗,造成掉線,如下圖所示。
查看核心網(wǎng)跟蹤的IMSI信令,如下圖所示。核心網(wǎng)在收到Handover Required后,回復(fù)了一條Handover PreparationFailure消息,原因值為ho-failure-in-target-EPC-eNB-or-target-system:
經(jīng)核心網(wǎng)維護(hù)人員查看發(fā)現(xiàn),切換的目標(biāo)基站下沙警官學(xué)院(ID:311609)在EPC上的動(dòng)態(tài)數(shù)據(jù)庫里只關(guān)聯(lián)了一個(gè)PLMN:46011,而核心網(wǎng)收到的Handover Required消息中,在selected-TAI字段里,目標(biāo)小區(qū)關(guān)聯(lián)的PLMN是46003,造成核心網(wǎng)認(rèn)為找不到目標(biāo)小區(qū),如下圖所示。
3.由于該地區(qū)某局前期放了部分46003的號(hào)段,所以要求核心網(wǎng)和無線側(cè)都必須配置雙PLMN,即46011+46003。查看基站側(cè)的參數(shù)配置,下沙警官學(xué)院基站配置了雙PLMN,如下圖所示,但核心網(wǎng)側(cè)沒有生效。
4.進(jìn)一步核查核心網(wǎng)側(cè)PLMN沒有生效的原因。根據(jù)協(xié)議規(guī)定,核心網(wǎng)維護(hù)的基站的PLMN配置,是基站側(cè)上報(bào)的,而基站開通后通過S1口會(huì)上報(bào)一個(gè)S1 SETUP REQUEST消息,攜帶基站的PLMN配置,核心網(wǎng)也根據(jù)收到的該消息進(jìn)行維護(hù)。
為了驗(yàn)證基站上報(bào)S1 SETUP REQUEST消息時(shí),攜帶的PLMN是否正確,我們選取了潘水南苑(ID:311767)現(xiàn)場進(jìn)行抓包驗(yàn)證。
將該站點(diǎn)傳輸斷開,等待一段時(shí)間后重新連接,發(fā)現(xiàn)基站上報(bào)了S1 SETUP REQUEST消息,且在broadcastPLMNs字段里攜帶了46011和46003,說明基站上報(bào)的消息是正確的,如下圖所示。

而核心網(wǎng)維護(hù)的站點(diǎn)PLMN不全的原因,可能是由于前期站點(diǎn)調(diào)整PLMN配置時(shí)沒有復(fù)位,不會(huì)上報(bào)S1 SETUP REQUEST消息,造成核心網(wǎng)側(cè)沒有更新基站PLMN配置所致。
5.驗(yàn)證測試
為了驗(yàn)證復(fù)位是否能夠解決該問題,我們首先對下沙警官學(xué)院(ID:311609)進(jìn)行了網(wǎng)元復(fù)位,發(fā)現(xiàn)操作后確實(shí)切換出準(zhǔn)備失敗消失:
故障處理
由于核心網(wǎng)維護(hù)的相關(guān)數(shù)據(jù)庫是動(dòng)態(tài)的,只能查詢某個(gè)站點(diǎn)關(guān)聯(lián)的PLMN信息,不能對所有站的PLMN信息進(jìn)行導(dǎo)出查看,所以在5月9號(hào)凌晨對所有站點(diǎn)進(jìn)行了網(wǎng)元復(fù)位操作。復(fù)位操作后,查詢5月9號(hào)之后的KPI指標(biāo),發(fā)現(xiàn)切換成功率指標(biāo)明顯提升,如下表所示。
同時(shí)全網(wǎng)切換準(zhǔn)備失敗次數(shù)也明顯減少: