【資料名稱】:RNC緊急問題處理三板斧
【資料作者】:cc
【資料日期】:2011-11-1
【資料語言】:中文
【資料格式】:DOC
【資料目錄和簡介】:
問題通常表現(xiàn)為RRC建立成功率低,RAB建立成功率低或者掉話率偏高,嚴重影響現(xiàn)網(wǎng)下用戶的感受。
現(xiàn)場人員技能要求:
會通過M2000或者Nastar察看話統(tǒng)數(shù)據(jù),能熟悉一些常見的話統(tǒng)指標,分析RRC/RAB/CDR的異常。
會通過Insight Plus或者OMStar工具察看CHR日志,能夠分析基本的建立或掉話流程。
會通過LMT在現(xiàn)網(wǎng)上查詢一些信息。
4.1判斷故障是否在同一個FMR/DPU單板上,或者同一個DSP上
通過分析CHR日志,察看MACD/RLC相關的錯誤碼,如下所示:
或者查看故障所在的DSP ID,如下:
應急措施:
1)如果MACC/MACD/RLC的錯誤碼出現(xiàn)次數(shù)很多,且每次出現(xiàn)的CPU ID都是一樣,或者CPU ID都是在同一個FMR單板上,則復位DSP或者FMR/DPU單板。
2)如果絕大多數(shù)的故障所在的DSP ID是同一個,或者是在同一個單板上,則復位DSP或者FMR/DPU單板。
CPU ID可以通過專用的工具來轉換,如下:
V1(V17/V18/V110)版本可以通過如下工具來轉換CPU/DSP ID:
V2(V29/CV210)版本可以通過如下工具來轉換CPU/DSP ID:
3)如果是一個DSP引起,則復位DSP;復位后未解決,禁止DSP。
4)如果是一個FMR/DPU單板引起,則復位單板;復位后未解決,禁止單板。
4.2判斷故障是否在同一個SPU子系統(tǒng)上
分析話統(tǒng)或CHR日志,找出TOP N的小區(qū),觀察KPI惡化是否是TOP N小區(qū)貢獻的?
應急措施:
1)如果是由TOP N貢獻的,則在LMT上或者根據(jù)腳本查詢小區(qū)的SPU子系統(tǒng),判斷是否在一個框(不同SPU)或者一個SPU子系統(tǒng)上:
如果在同一個SPU的子系統(tǒng)上,則倒換SPU單板。
如果在同一個框下的不同SPU的子系統(tǒng)上,則倒換SCU單板。
如果分布在不同的框下,倒換NET單板,或者RSS框下的SCU單板。
2)如果不是TOP N小區(qū)貢獻:
如果嚴重影響用戶感受,則復位整個RNC。
否則:
跟蹤有效的CDT(含L2統(tǒng)計和L2數(shù)傳上報100s,或FP數(shù)據(jù))。
跟蹤有效的IOS數(shù)據(jù)。
收集話統(tǒng)數(shù)據(jù)和CHR日志。
收集上述LOG并反饋后方定位。
4.3判斷故障是否在同一個接口單板(IUB接口)上
分析話統(tǒng)或CHR日志,找出TOP N的小區(qū),觀察KPI惡化是否是TOP N小區(qū)貢獻的?
應急措施:
1)如果是由TOP N貢獻的,則在LMT上或者根據(jù)腳本查詢小區(qū)的IUB接口所在的接口單板,判斷故障是否出自同一個接口單板上。
2)如果來自同一個單板,可能的原因是接口單板或者與接口單板相連接的中間傳輸存在丟包,建議倒換接口單板。
5信息收集Check List
5.1緊急情況
在緊急情況,通常是在業(yè)務沒有恢復之前,需要現(xiàn)場根據(jù)實際情況獲取必要的LOG日志(日志大小必須要做要求,盡量。,發(fā)送給后方進行緊急定位。LOG日志必須要包含故障點,如CDT//IOS跟蹤中必須包含掉話點,CHR或者本文日志必須是出于故障期間的日志等。反饋給后方的日志中,不需要過多的,沒有經(jīng)過過濾的日志。而是經(jīng)過前方簡單的過濾,短小而且包含故障點的日志。這樣可以快速有效的傳遞給方,減少在網(wǎng)絡上發(fā)送或者接收的時間。所有的LOG日志必須采用壓縮模式(采用RAR或ZIP壓縮)傳送,減少文件的大小。
針對接入類緊急問題:
故障期間的CHR日志,注意故障框號和時間點。<必選>
故障期間的告警日志,注意時間點。<必選>
IFTS/CDT/IOS跟蹤(CDT/IFTS中必須包含L2用戶面統(tǒng)計和L2數(shù)據(jù)上報100s)。前方必須過濾一下發(fā)送給后方的日志中是否包含故障信息。<必選>
故障期間之前2個小時到故障期間的話統(tǒng)數(shù)據(jù)。<可選>
RNC的配置腳本。<可選>
故障期間的文本日志,注意故障框號和時間點。<可選>
針對KPI惡化類緊急問題:
故障期間之前2個小時到故障期間的話統(tǒng)數(shù)據(jù)。<必選>
故障期間的CHR日志,注意故障框號和時間點。<必選>
IFTS/CDT/IOS跟蹤(CDT/IFTS中必須包含L2用戶面統(tǒng)計和L2數(shù)據(jù)上報100s)。前方必須過濾一下發(fā)送給后方的日志中是否包含故障信息。<必選>
RNC的配置腳本。<必選>
故障期間的文本日志,注意故障框號和時間點。<可選>
5.2業(yè)務恢復之后
如果業(yè)務恢復之后,對于日志的大小不做要求。過大的日志,可以傳送到FTP上。日志包含如下:
需要在本地備份故障之前一天忙時的日志(1~2個小時),故障期間的所有日志,故障恢復之后的忙時部分日志(1~2個小時)。<必選>
需要在本地備份所有故障之前到問題解決之前的所有文本日志。<必選>
需要在本地備份所有故障之前到問題解決之前的所有話統(tǒng)日志(MeasResult目錄下的文件)。<必選>
故障期間所作的CDT/IFTS/IOS跟蹤(CDT/IFTS中必須包含L2用戶面統(tǒng)計和L2數(shù)據(jù)上報100s),以及其他的跟蹤。<必選>
COL LOG: TP=BAM; 保存BAM的日志,操作日志以及告警日志。<必選>
6常用跟蹤工具使用和日志獲取方法
6.1CDT/IFTS跟蹤方法
1)RNC的CDT分為CDT和IFTS兩種,分別跟蹤特定IMSI/TMSI的用戶和某些小區(qū)中的用戶。點擊跟蹤樹上的CDT跟蹤,彈出如下窗口。
跟蹤IMSI/TMSI的特定用戶
跟蹤某些小區(qū)的IFTS
跟蹤IFTS時子系統(tǒng)必須為跟蹤小區(qū)對應的子系統(tǒng),可以通過LST CELL獲取對應的SPU子系統(tǒng)號。RRC EST Cause填寫根據(jù)情況來定,如果是CS業(yè)務,可以選擇Originating Conversational Call / Terminating Conversational Call;如果是PS業(yè)務,則可以選擇Originating Interactive Call / Originating Background Call / Terminating Interactive Call / Terminating Background Call。Traffic Type可以不選擇。
2)跟蹤帶內部打印的CDT跟蹤
在LMT所在的機器上找到以下目錄:
D:\HW LMT\adaptor\clientadaptor\RNC\BSC6810V200R010C01B051\style\defaultstyle\locale\en_US\rnctest
其中藍色部分為RNC的版本,和語言種類,上述示例中為V210B051的英文版。
找到RncTestConfig.xml文件,使用UE或Notepad打開,找到以下部分:
<DESC descname="CDTMSGTYPE">
<
ARAS>
<
ARA name="UI_FAM_UT_STANDARD_MSG" value="1"/>
<
ARA name="UI_FAM_UT_INTRA_MSG" value="0"/>
<;PARA name="UI_FAM_UT_CTRL_TBL" value="0"/>
<;PARA name="UI_FAM_UT_STATE_TRANS" value="0"/>
<;PARA name="UI_FAM_UT_PRINT_INFO" value="0"/>
<;PARA name="UI_FAM_UT_FUNC_CALL" value="0"/>
<;PARA name="UI_FAM_UT_L2_DATA_FWD_MSG" value="0"/>
<;PARA name="UI_FAM_UT_L2_TXT_FWD_MSG" value="0"/>
<;PARA name="UI_FAM_UT_GTPU_DATA_FWD_MSG" value="1"/>
<;PARA name="UI_FAM_UT_REAL_TIME_INFO" value="0"/>
<;PARA name="UI_FAM_UT_FMR_SIG_DT_FWD_MSG" value="0"/>
<;PARA name="UI_FAM_UT_FMR_UP_DT_FWD_MSG" value="0"/>
<;PARA name="UI_FAM_UT_FMR_INBAND_DT_FWD_MSG" value="0"/>
<;PARA name="UI_FAM_UT_RADIO_PERF_INFO" value="1"/>
<;PARA name="UI_FAM_UT_CELL_INFO" value="1"/>
<;PARA name="UI_FAM_UT_ALPATH_PVC_INFO" value="0"/>
</PARAS>
</DESC>
將其中的0全都替換為1:
<DESC descname="CDTMSGTYPE">
<;PARAS>
<;PARA name="UI_FAM_UT_STANDARD_MSG" value="1"/>
<;PARA name="UI_FAM_UT_INTRA_MSG" value="1"/>
<;PARA name="UI_FAM_UT_CTRL_TBL" value="1"/>
<;PARA name="UI_FAM_UT_STATE_TRANS" value="1"/>
<;PARA name="UI_FAM_UT_PRINT_INFO" value="1"/>
<;PARA name="UI_FAM_UT_FUNC_CALL" value="1"/>
<;PARA name="UI_FAM_UT_L2_DATA_FWD_MSG" value="1"/>
<;PARA name="UI_FAM_UT_L2_TXT_FWD_MSG" value="1"/>
<;PARA name="UI_FAM_UT_GTPU_DATA_FWD_MSG" value="1"/>
<;PARA name="UI_FAM_UT_REAL_TIME_INFO" value="1"/>
<;PARA name="UI_FAM_UT_FMR_SIG_DT_FWD_MSG" value="1"/>
<;PARA name="UI_FAM_UT_FMR_UP_DT_FWD_MSG" value="1"/>
<;PARA name="UI_FAM_UT_FMR_INBAND_DT_FWD_MSG" value="1"/>
<;PARA name="UI_FAM_UT_RADIO_PERF_INFO" value="1"/>
<;PARA name="UI_FAM_UT_CELL_INFO" value="1"/>
<;PARA name="UI_FAM_UT_ALPATH_PVC_INFO" value="1"/>
</PARAS>
</DESC>
3)跟蹤帶L2統(tǒng)計的CDT跟蹤
選上Periodically Data Report,選擇2s
選上AI Collect Period,使用默認值2
L2 Data Report Time 填上100,
數(shù)傳類問題需要保證跟蹤開始100s內出現(xiàn)問題場景。
6.2IOS信令跟蹤方法
選擇跟蹤樹上的IOS,彈出如下對話框,Call count可以根據(jù)實際情況來定,建議填寫10;Cell ID填寫故障小區(qū)的ID,可以同時填寫多個小區(qū)ID。其余的參數(shù)默認設置。
6.3IU接口信令跟蹤方法
點擊故障樹上的IU接口跟蹤,彈出如下對話框。根據(jù)實際情況,選擇一個CN節(jié)點,如CS業(yè)務故障,填寫MSC的DPC,如果PS業(yè)務故障,填寫SGSN的DPC。Destination Point Code (DPC) 按照16進制填寫,具體數(shù)據(jù)可以通過LST N7DPC查詢。SCCP是否需要跟蹤根據(jù)實際情況來定,建議現(xiàn)場跟蹤。
6.4BAM日志獲取方法
BAM日志,通常包含BAM的LOG日志,操作日志和告警日志。可以采用如下命令獲。
COL LOG: TP=BAM;
執(zhí)行命令后,LOG日志會保存在/BAM/FTP/FixInfo_BAM.zip文件中,F(xiàn)場可以采用FTP工具登錄到BAM后獲取該文件。
如果需要現(xiàn)場反饋操作日志或者告警日志,現(xiàn)場將FixInfo_BAM.zip文件下載到本地,然后解壓縮。 如果獲取操作日志,只需要將OperateLog目錄下的文件壓縮后發(fā)送給后方。如果獲取告警日志,則將Warn目錄下的所有文件壓縮后返回給后方。
6.5CHR/文本日志獲取方法
V1和V2版本獲取CHR日志有所不同,如下是獲取V1版本的CHR和文本日志,F(xiàn)amLogFmt目錄下存儲的是CHR日志,F(xiàn)amlog目錄下存儲的是文本日志。
如下是獲取V29版本的CHR和文本日志,famlog目錄下存儲的是CHR日志,F(xiàn)amLogFmt目錄下存儲的是文本日志。
如下是獲取V210版本的CHR和文本日志,fmt目錄下存儲的是CHR日志,txt目錄下存儲的是文本日志。
V1版本CHR/文本日志文件格式如下:
01Log20071014000034_20071014235834.log.zip
其中01表示框號,20071014000034_20071014235834表示的是文件記錄的時間,年-月-日-時-分-秒。
V2版本CHR/文本日志文件格式如下:
RNC0000_00Log20081117174447_20081117180123.log.zip
其中RNC0000表示RNC ID, 00表示框號,20081117174447_20081117180123表示的是文件記錄的時間,年-月-日-時-分-秒。
為了快速有效的反饋文本日志和CHR日志,現(xiàn)場需要了解故障的具體時間點和故障的框號。按照對應的時間點和故障的框號獲取有效的日志,盡量降低日志文件的大小,減小中間傳遞文件的時間。
6.6話統(tǒng)數(shù)據(jù)獲取方法
V1V2版本的話統(tǒng)數(shù)據(jù)獲取方法如下:
話統(tǒng)數(shù)據(jù)格式如下:
A20081231.0930+0800-1000+0800_EMS-NORMAL.mrf.bz2
其中20081231表示年月日,0930+0800-1000+0800表示9:30到08:00的記錄時間。現(xiàn)場可以根據(jù)這個時間來反饋有效的數(shù)據(jù)。