目錄
1 概述
2 優(yōu)化案例
2.1. 某局點升級后掉話率KPI分析
2.1.1. 問題描述
2.1.2. 問題分析
2.1.3. 分析結論
2.1.4. 解決措施
1 概述
本《LTE掉話優(yōu)化指導書》重點介紹了LTE系統(tǒng)內掉話率指標的優(yōu)化思路、分析方法、定位手段及典型案例;
本《指導書》結構如下:
第一部分 主要從路測、標準接口、話統(tǒng)、CHR多角度出發(fā)給出了掉話的定義;
第二部分 給出了常見的掉話原因,掉話機制的介紹;
第三部分 介紹了掉話問題的隔離定位分析方法;
第四部分 分享了掉話優(yōu)化的典型案例;
第五部分 介紹了CHR數據的分析方法,影響掉話的定時器介紹及重建的機制介紹。
2 優(yōu)化案例
2.1. 某局點升級后掉話率KPI分析
2.1.1. 問題描述
某局點在升級至eRAN2.1SPC420之后,掉話率突變,需要分析引起變化的原因。
2.1.2. 問題分析
2.1.2.1. 升級前后掉話率趨勢分析
全網升級至eRAN2.1SPC420后,平均掉話率約在0.6%,而相同區(qū)域升級前為2%
由于是按不同區(qū)域分段執(zhí)行,故在12月5號到12月10號期間掉話率指標有一個逐漸緩降的過程。在12月12號完成了全網所有站點的升級。 掉話率趨勢如下圖所示:
圖1 某局點掉話率趨勢
2.1.2.2. 掉話原因分布分析
從話統(tǒng)Counter記錄的掉話原因來看,由于無線側原因導致的掉話占絕大多數
該局點終端形態(tài)多以CPE為主,相對位置比較固定,故切換引起的掉話比例很少;
該局點的800M站點大多不連續(xù)覆蓋,也一定程度上導致了弱覆蓋等原因引起的掉話;
掉話原因分布如下:
圖2 某局點掉話原因分布
2.1.2.3. Top小區(qū)話統(tǒng)數據分析
Top小區(qū)定義:將掉話率高于10%的小區(qū)按eRAB異常釋放次數從大到小降序排列,然后取Top5小區(qū)進行統(tǒng)計,結果如下;
圖3 某局點Top小區(qū)掉話率統(tǒng)計
升級前:Top5站點貢獻0.31%的正常釋放,但貢獻了24.95%以上的異常釋放;
升級后:Top5站點貢獻不到0.16%的正常釋放,但貢獻了17.75%以上的異常釋放;
故同Top小區(qū)對掉話率的貢獻來看,其“害群之馬”的現象還是比較明顯。
2.1.2.4. Top小區(qū)CHR數據分析
2.1.2.4.1. 內部釋放原因值分析
Top小區(qū)內部異常釋放原因分布如下圖所示,排列前3的原因分別如下,主要都是空口流程的失敗導致:
UE_RLC_UNRESTORE_IND(eNB側下行RLC達到最大重傳次數導致的釋放)
WAIT_RRC_CONN_RECFG_RSP_TIMEOUT(等待RRC重配置失敗超時)
RRC_REEST_SRB1_FAIL(重建流程失敗導致的失。
圖4 某局點Top小區(qū)內部釋放原因值分布
2.1.2.4.2. TA分布分析
協議定義TA = 16*Ts=16*(0.5ms/15360)=0.52μs
故單個TA=156m;UE距離基站的距離 = 156*TA個數/2
如下面表格內統(tǒng)計所示,現場出現切換或者重同步上報的TA基本都集中在8.5km左右,可見異常釋放用戶距離基站都比較遠。
圖5 某局點Top小區(qū)TA分布
注:目前內部CHR只有對切換入和重同步會記錄TA,且最終異常釋放的話單才會統(tǒng)計輸出
2.1.2.5. Top小區(qū)問題示例
2.1.2.5.1. Case1 Top終端連續(xù)重建失敗導致掉話
如下圖所示,通過CHR數據統(tǒng)計,發(fā)現該站點主要的異常釋放原因是由于用戶在重建過程中重建的前3條信令流程交互失敗所致。
圖6 內部釋放原因值統(tǒng)計
如下圖所示,從發(fā)生該問題的時間點來看,時間點非常集中并且連續(xù),從11點51分開始直至18:49結束,且都發(fā)生在小區(qū)0。
圖7 異常釋放記錄
如下圖所示:從TMSI信息來看,主要是某個終端貢獻(TMSI C2 B0 B0 40),且重建的主要原因值為Reconfiguration Failure。
圖8 重建原因記錄
如下圖所示:從重配置消息的類型來看,可以排除是切換命令或測量控制,可能是CQI/Sounding/TM等的重配置;而且終端再收到RRC CONN REESTAB消息之后并沒有相應,故eNB在等待5s超時之后釋放。
圖9 最后10條信令記錄
2.1.2.5.2. Case2 Top用戶連續(xù)異常
該站點CHR數據統(tǒng)計來看,主要異常釋放原因是RLC達到最大重傳次數--DRB達到最大重傳次數(8次)。
圖10 內部釋放原因值統(tǒng)計
從發(fā)生該問題的時間點來看,時間點非常集中并且連續(xù),連續(xù)失敗從10點51分開始直至13:49結束,且都發(fā)生在小區(qū)2。
圖11 異常釋放記錄
從TMSI信息來看,主要是某個終端貢獻(TMSI C2 7F 20 56)
圖12 異常釋放TMSI信息
從DRB最后16個64ms的打印信息來看,異常的現象非常相似,都是在接入后不久就出現了異常(類似突然不發(fā)數),由于從接入到釋放間隔幾十秒到2分鐘不等,可排除使用腳本測試的可能性,且接入類型都是MO-DATA,更像是實際用戶在進行業(yè)務
圖13 DRB TTI信息統(tǒng)計
2.1.2.5.3. Case3上行鏈路質量差
如下圖所示,從最后4個512ms到最后16個64ms,eNB接收到的上行RSRP和SINR都比較差;上行RSRP已經達到-135dBm以下,Sounding及DMRS的SINR都在-3dB以下,懷疑是上行弱覆蓋導致的掉話
圖14 DRB TTI信息統(tǒng)計
如左圖所示,從最后4個512ms到最后16個64ms,eNB接收到的上行RSRP為-130dBm左右,但是上行Sounding及DMRS的SINR都在-3dB以下,懷疑是上行存在較小的干擾導致了在弱覆蓋導致的掉話。
圖15 DRB TTI信息統(tǒng)計
2.1.2.6. 實際用戶感知分析
2.1.2.6.1. 核心網主動釋放引起的掉話
由于在eRAN2.1SPC400版本之后eNB側將核心網主動發(fā)起的釋放不計入掉話,故對掉話率指標有一定的改善,但是與實際的用戶感知存在出入;
全網將核心網引起的釋放“L.E-RAB.AbnormRel.MME”統(tǒng)計入掉話的話,全網掉話率將會增加約0.45%; 統(tǒng)計結果如下:
圖16 包含核心網主動釋放的掉話率
2.1.2.6.2. N秒無數傳引起的釋放
由于在eRAN2.1SPC400版本之后eNB側將異常釋放之前L2 4秒無數傳的的釋放不計入掉話,故對掉話率指標有一定的改善,雖然不影響用戶感知,但是與實際的掉話可能存在出入;
德國D2全網將核心網引起的釋放“FOR_N_SECONDS_NO_DATA_TRANS_CAUSE”統(tǒng)計入掉話的話,全網掉話率將會增加約0.06%;
如下表統(tǒng)計結果所示為Top小區(qū)所在eNBCHR針對N秒無數傳的統(tǒng)計結果,在總的異常釋放次數所占的比例約為10%
圖17 N秒無數傳引起釋放所占比例
2.1.3. 分析結論
由于核心網異常及N秒無數傳兩個特性對掉話率指標的優(yōu)化占很大比例;
在異常掉話原因中,Top用戶的異常現象比較普遍;
弱覆蓋原因在站點距較遠的該局點來看,也是一大原因;
Top用戶中,終端兼容性問題對掉話也起了一定的貢獻;
升級后,如果將核心網引起的掉話及4s無數傳掉話統(tǒng)計入的話,真實掉話率約為1.1%,相對于升級前減少了約一半。
2.1.4. 解決措施
Top用戶在識別出來之后,由于安全因素,eRAN無法獲知Top用戶的IMSI,故如何進行優(yōu)化/回訪等措施尚不完備,需要知會客戶后通過核心網的協助進行回訪;
針對Top用戶中終端問題,由于無法獲得終端的詳細信息,故并不能通過鏡像環(huán)境驗證,該局點由于終端類型較少,目前主要是LG和CPE遇到的幾個已知問題;與升級前相似;
對于弱覆蓋問題,治本的方法是通過加站來縮小站間距,增強覆蓋,但是短平快的方法也可以通過更改最小接入電平的方法實現,但是副作用就是會導致處于弱覆蓋的用戶無法接入;