過程 | 規(guī)定動作 | 分析動作 | 說明 |
問題現(xiàn)象和范圍確認 | 切換KPI監(jiān)控及問題確認 | 1、話統(tǒng)分析,參照局點日常監(jiān)控KPI指標進行切換KPI指標監(jiān)控。
2、切換KPI不僅要關注全網(wǎng)指標還要關注TOP小區(qū)指標。 | 1、切換問題有如下幾種
1)、升級或其它不明原因?qū)е虑袚Q指標突然惡化;
2)、切換指標逐漸惡化,可能是業(yè)務量逐漸增加、或新用戶/新終端類型等不斷加入;
3)、切換指標一直就比較差,需要優(yōu)化性能;
|
問題范圍確定 | 1、確定是整網(wǎng)問題、還是TOP站點問題,還是特定載頻問題;MOCN場景下是否特定運營商、特定核心網(wǎng);
2、如果是TOP站點問題,進一步確定是否TOP小區(qū)問題,以及確定是單向切換問題還是雙向切換問題;
3、如果是TOP小區(qū)問題,進一步確定是否TOP兩兩小區(qū)問題;
4、如果是TOP小區(qū)問題,進一步確定是否TOP用戶; | 1、確定問題范圍可以用于提煉問題發(fā)生的場景,也可以用于評估問題的影響。
2、通過問題范圍細化還可以初步判斷是切換源側問題還是切換目標側問題。 |
切換KPI惡化/變化時間分析 | 分析切換KPI惡化/變化的時間點和趨勢,如果是突然惡化,分析惡化點網(wǎng)絡是否有什么動作;如果是逐漸惡化,分析是否業(yè)務量在逐漸增加,或有新用戶/新終端在不斷加入。 | 突然惡化的問題,分析網(wǎng)絡的動作除了排查RAN側的動作(如版本升級、參數(shù)修改、RF調(diào)整、告警)外,還要分析核心網(wǎng)的動作,對于配置了異系統(tǒng)互操作的網(wǎng)絡,還要分析3G2G網(wǎng)絡的動作。 |
問題分析 | 關聯(lián)指標分析 | 1、切換問題除了分析成功率,還要分析總次數(shù)和失敗次數(shù)的變化。
2、同時分析隨機接入、接入、掉話、重建等相關指標是否有數(shù)量及成功率的異動 | 關聯(lián)指標分析主要嘗試揭開問題的全貌,并找到一些線索和可疑點。 |
故障&告警&操作日志排查 | 1、采一批TOP站點的故障/告警/操作日志;
2、分析故障/告警/操作的時間點和KPI惡化的時間點的對應關系 | |
Releasenotes分析 | 如果是R版本或補丁版本升級導致的問題,對Releasenotes中合入的問題逐個進行排查,確認是否存在切換指標修改的相關問題(如果是V版本升級,因為版本間差異太多,該動作可以跳過) | 1、列出影響切換指標的問題修改,并確認是否版本間指標定義存在變化 |
參數(shù)核查 | 按照“參數(shù)核查通用指南”進行分析 | 如果是TOP小區(qū)/基站問題,把TOP站點和正常站點的參數(shù)進行對比 |
TOP小區(qū)分析 | 找出TOP小區(qū),分析問題的日志從這些TOP小區(qū)中采集;
鏡像重現(xiàn)也要使用這些TOP小區(qū)的配置文件。 | 因為TOP小區(qū)的問題現(xiàn)象會更明顯,那么觸發(fā)這些問題的因素或場景也會更明顯。 |
切換流程問題細化分析 | 參照“LTE切換問題定位專家指南”,確認切換流程是在哪一個步驟失敗的,縮小問題定位范圍。 | |
鏡像環(huán)境重現(xiàn) | 1、搭建鏡像環(huán)境進行問題重現(xiàn),通過問題分析中提煉出來的關鍵特征一定要鏡像到。
2、網(wǎng)絡KPI問題要包括接入、(站內(nèi)、站間S1、站間X2)切換、重建;
3、根據(jù)代碼走讀發(fā)現(xiàn)的疑點,構造場景進行復現(xiàn)。 | 1、關鍵特征一定要模擬到,可以通過代碼打樁等方式。
2、多用戶場景要考慮近、中、遠點。
3、鏡像環(huán)境要使用出問題站點的配置 |
代碼走讀 | 1、通過問題分析提煉出問題觸發(fā)場景后,針對性進行代碼走讀。 | 敢于懷疑一切。代碼走讀出來沒有異常,不一定沒有異常。 |
典型場景問題分析 | 個別站點異常 | 1、如果是軟件類問題,嘗試復位基站后問題通常能夠解決;
2、在常規(guī)套路定位不能解決后,嘗試復位、下電、換單板這三板斧。 | |