目錄
1 概述
2 掉話定位處理方法
2.1. 掉話率指標(biāo)分析流程
2.1.1. 全網(wǎng)話統(tǒng)指標(biāo)分析流程
2.1.2. Top小區(qū)掉話分析流程
2.2. 掉話問題分類處理
2.2.1. 無線類問題處理
2.2.2. 傳輸類問題處理
2.2.3. 擁塞類問題處理
2.2.4. 切換類故障處理
2.2.5. 核心網(wǎng)類故障處理
1 概述
本《LTE掉話優(yōu)化指導(dǎo)書》重點介紹了LTE系統(tǒng)內(nèi)掉話率指標(biāo)的優(yōu)化思路、分析方法、定位手段及典型案例;
本《指導(dǎo)書》結(jié)構(gòu)如下:
第一部分 主要從路測、標(biāo)準(zhǔn)接口、話統(tǒng)、CHR多角度出發(fā)給出了掉話的定義;
第二部分 給出了常見的掉話原因,掉話機(jī)制的介紹;
第三部分 介紹了掉話問題的隔離定位分析方法;
第四部分 分享了掉話優(yōu)化的典型案例;
第五部分 介紹了CHR數(shù)據(jù)的分析方法,影響掉話的定時器介紹及重建的機(jī)制介紹。
2 掉話定位處理方法
2.1. 掉話率指標(biāo)分析流程
一旦當(dāng)?shù)粼扠PI指標(biāo)下降或者出現(xiàn)劇烈波動的時候,首先要做的就是要把問題梳理清楚、既問題隔離;搞明白問題出自哪里、問題存在范圍,然后有的放矢的進(jìn)行有針對性的解決,掉話率指標(biāo)分析流程圖如下所示:
圖1 話統(tǒng)指標(biāo)分析流程圖
如上圖所示,針對掉話率KPI的分析思路,在獲取到掉話相關(guān)的Counter’指標(biāo)后,通常有需要從兩個方面入手:
1、是否是整網(wǎng)級別的掉話率指標(biāo)惡化:
2、是否是Top小區(qū)引起的指標(biāo)惡化;
2.1.1. 全網(wǎng)話統(tǒng)指標(biāo)分析流程
說明:
1、首先需要在話統(tǒng)側(cè)獲取全網(wǎng)的掉話率指標(biāo)以及趨勢,掉話率趨勢分析至少需要分析1~2周左右的數(shù)據(jù)。如果全網(wǎng)的掉話率指標(biāo)突然偏高(高于驗收值),一般下列因素會導(dǎo)致全網(wǎng)的掉話率突然增加,需要執(zhí)行以下的檢查:
a) 全網(wǎng)是否做過重大動作,如割切、搬遷等;
b) 是否存在核心網(wǎng)側(cè)的版本變更或參數(shù)更改;
c) 是否存在eRAN側(cè)參數(shù)的更改,如定時器的修改、算法開關(guān)的調(diào)整等;
d) 檢查系統(tǒng)是否做過版本升級、打補丁等動作;對于eNodeB,可通過WebLMT或者M(jìn)2000執(zhí)行MML命令“LST SOFTWARE”進(jìn)行查詢,查詢結(jié)果顯示形式如下:
圖2 eNodeB軟件版本查詢結(jié)果
e) 全網(wǎng)話務(wù)量趨勢分析:分析是否由于話務(wù)量突然增加影響到掉話率上升;話務(wù)量的分析通?赏ㄟ^e-RAB嘗試建立的次數(shù)及成功次數(shù)的分布來判斷;是否存在重大活動如重要節(jié)假日或放號等;
2、在排除上述影響因素之后,如果全網(wǎng)的掉話率指標(biāo)依舊一直偏高,需要通過分析異常釋放原因值Counter,分析一下異常釋放原因分布的比例,針對引起掉話問題分類原因進(jìn)行分析處理,如果:
a) L.E-RAB.AbnormRel.TNL原因較多:觀察S1口/X2口傳輸是否出現(xiàn)問題,排查傳輸引起的告警,如閃斷等;
b) L.E-RAB.AbnormRel.Radio/L.E-RAB.AbnormRel.HOFailure原因較多:觀察網(wǎng)規(guī)是否合理,如PCI規(guī)劃、鄰小區(qū)規(guī)劃情況;
c) L.E-RAB.AbnormRel.MME原因較多:需要協(xié)調(diào)核心網(wǎng)一起進(jìn)行排查,但是由于核心網(wǎng)引起原因值并不記錄在eRAN側(cè)的L.E-RAB.AbnormRel之內(nèi),所以該步驟可選;
3、在排除了以上原因之后,如果掉話率依舊沒有改善,建議反饋至問題定位的下一環(huán)節(jié)進(jìn)行處理。
2.1.2. Top小區(qū)掉話分析流程
針對非全網(wǎng)性故障導(dǎo)致的指標(biāo)波動或下降時,需要使用定位Top小區(qū)的思路對問題進(jìn)行定位分析,Top小區(qū)的選取需要遵循如下規(guī)則:
A) Top小區(qū)的掉話率指標(biāo)要低于全網(wǎng)平均掉話率指標(biāo);
B) 按照異常掉話絕對次數(shù)將小區(qū)進(jìn)行從大到小的降序排列;
在確定了Top小區(qū)后,需要按照如下流程進(jìn)行問題的分析
1、首先針對Top小區(qū)進(jìn)行如下幾個動作的核查:
a) Top小區(qū)是否做過重大動作,如割切、搬遷等;
b) 檢查eNodeB側(cè)是否存在該Top小區(qū)相關(guān)的告警信息;檢查該小區(qū)所屬eNodeB的告警,確認(rèn)該小區(qū)沒有出現(xiàn)故障等信息;常見的告警如RRU相關(guān)的告警、通道相關(guān)的告警、傳輸相關(guān)的告警、基帶板相關(guān)的告警等
c) Top小區(qū)所在核心網(wǎng)是否存在參數(shù)更改;
d) Top小區(qū)是否存在OM操作,如去激活小區(qū)、重啟單板等;
e) Top小區(qū)話務(wù)量趨勢分析:分析是否由于話務(wù)量突然增加影響到掉話率上升;話務(wù)量的分析通?赏ㄟ^e-RAB嘗試建立的次數(shù)及成功次數(shù)的分布來判斷;是否存在演唱會、大型體育賽事等;
f) 是否存在參數(shù)修改:需要檢查小區(qū)參數(shù)在掉話率異常期間是否存在修改,如定時器的修改、算法開關(guān)的調(diào)整等,與掉話率相關(guān)參數(shù)的幾個重要參數(shù)如下表所示(后續(xù)將隨版本更新);
2、然后,在排除上述影響因素之后,如果Top小區(qū)掉話率指標(biāo)依舊一直偏高,需要通過分析異常釋放原因值Counter,分析一下異常釋放原因分布的比例,針對引起掉話問題分類原因進(jìn)行分析處理,如果:
a) L.E-RAB.AbnormRel.TNL原因較多:觀察S1口/X2口傳輸是否出現(xiàn)問題,排查傳輸引起的告警,如閃斷等;
b) L.E-RAB.AbnormRel.MME原因較多:需要協(xié)調(diào)核心網(wǎng)一起進(jìn)行排查,但是由于核心網(wǎng)引起原因值并不記錄在eRAN側(cè)的L.E-RAB.AbnormRel之內(nèi),所以該步驟可選;
c) L.E-RAB.AbnormRel.HOFailure原因較多:需要對切換失敗較高的小區(qū)進(jìn)行特定兩小區(qū)測量Counter的分析,對失敗次數(shù)最多的鄰小區(qū)關(guān)系進(jìn)行梳理,核查其鄰小區(qū)配置的合理性;并通過內(nèi)部CHR數(shù)據(jù)確認(rèn)下是否存在Top用戶(詳見切換類掉話分析)
d) L.E-RAB.AbnormRel.Cong原因較多:需要進(jìn)行負(fù)載均衡或者擴(kuò)容;
e) L.E-RAB.AbnormRel.Radio原因較多:需要查看是否存在Top用戶、弱覆蓋、干擾或者終端異常等原因。需要通過CHR日志進(jìn)行弱覆蓋、Top用戶的確認(rèn)。常見CHR內(nèi)部Top原因與實際掉話原因?qū)?yīng)關(guān)系如下表所示:
注:其中RF問題包含了3.1章節(jié)中描述的鄰小區(qū)錯/漏配、弱覆蓋、上下行干擾。
3、分析優(yōu)化措施是否可以全網(wǎng)復(fù)制,如果可以的話安排全網(wǎng)經(jīng)驗復(fù)制,分析實施后的指標(biāo)是否滿足要求,如果滿足要求,那么結(jié)束掉話優(yōu)化;否則,重新進(jìn)行下一輪Top小區(qū)優(yōu)化;
4、在排除了以上原因之后,如果掉話率依舊沒有改善,建議反饋至問題定位的下一環(huán)節(jié)進(jìn)行處理。
2.2. 掉話問題分類處理
按照問題定位分析流程,先由話統(tǒng)數(shù)據(jù)入手,再通過CHR數(shù)據(jù)進(jìn)行深入定位。
2.2.1. 無線類問題處理
2.2.1.1. 問題現(xiàn)象
在eNodeB側(cè)話統(tǒng)Counter定義中,如果異常釋放打點在L.E-RAB.AbnormRel.Radio Counter下,則可以判定為該掉話是由于無線側(cè)空口問題導(dǎo)致的掉話。且是屬于非切換場景下引起的掉話。
2.2.1.2. 可能原因
針對原因值為Radio的掉話,主要是由于弱覆蓋,上行干擾、終端異常等原因?qū)е碌腞LC達(dá)到最大重傳次數(shù)、失步、信令流程交互失敗等
2.2.1.3. 處理步驟
確定該站點是否用戶多集中于弱覆蓋區(qū)域。通過獲取Top站點所在小區(qū)的小區(qū)全帶寬CQI的上報次數(shù)、PDSCH上各個MCS索引值的調(diào)度次數(shù)、PUSCH上各個MCS索引值的調(diào)度次數(shù)Counter指標(biāo),觀察CQI及MCS的分布情況,是否如果整體分布情況都處于低階,則需要通過路測進(jìn)行確認(rèn),并實施覆蓋調(diào)整。
……………………
……………………
LTE掉話優(yōu)化指導(dǎo)書(第三部分:定位處理方法).pdf