[摘要]:本文主要是通過對(duì)幾次通信故障案例進(jìn)行分析,強(qiáng)調(diào)對(duì)信令進(jìn)行追蹤的重要性,旨在加強(qiáng)對(duì)信令流程的重視,以此提高在日常的網(wǎng)絡(luò)維護(hù)特別是故障搶修中進(jìn)行故障定位的速度。
隨著移動(dòng)通信的迅速發(fā)展,移動(dòng)通信用戶快速增加,移動(dòng)通信的網(wǎng)絡(luò)日趨復(fù)雜,網(wǎng)絡(luò)的日常維護(hù)、網(wǎng)絡(luò)故障的定位、網(wǎng)絡(luò)故障的排除也日趨困難。一旦有通信故障,就會(huì)產(chǎn)生大面積的影響。就網(wǎng)絡(luò)維護(hù)部門而言能否在出現(xiàn)通信故障時(shí),快速定位故障點(diǎn),從而在最短時(shí)間內(nèi)排除故障,就顯得日益重要。信令是建立通信的前提,信令就象網(wǎng)絡(luò)的脈搏一樣,通過對(duì)信令的分析可以洞察到網(wǎng)絡(luò)中存在的問題,下面就對(duì)幾次故障的處理過程與大家交流。
案例一:
1.故障現(xiàn)象
大量用戶申告手機(jī)很難打通。通過實(shí)際的撥測(cè)發(fā)現(xiàn)手機(jī)呼叫手機(jī)很難打通,手機(jī)呼叫固定電話無問題,固定電話呼叫手機(jī)很難打通?偨Y(jié)為手機(jī)為被叫時(shí)呼叫不暢。通過戶外測(cè)試發(fā)現(xiàn)MSC/VLR所掛的3套BSC下均有此現(xiàn)象,初步定位為全網(wǎng)故障,而手機(jī)做為主叫和被叫在信令流程上的主要區(qū)別在于:被叫時(shí)比主叫時(shí)多了分配漫游號(hào)碼、位置查詢和PAGING的過程。
2.故障的定位
。1)。用信令儀表對(duì)A接口進(jìn)行信令跟蹤,因?yàn)樵贏接口是用TMSI進(jìn)行呼叫接續(xù),所以首先在HLR中查出測(cè)試手機(jī)對(duì)應(yīng)的TMSI號(hào)碼,對(duì)該TMSI進(jìn)行跟蹤。用該手機(jī)做被叫,發(fā)現(xiàn)每次呼叫不通時(shí),均沒有跟蹤到信令流程,故障基本可以定位在交換側(cè)。
。2).用信令儀表對(duì)HLR與MSC/VLR間的C接口進(jìn)行信令跟蹤,對(duì)被叫手機(jī)進(jìn)行跟蹤,通過大量的信令跟蹤,總結(jié)出每次呼叫失敗時(shí)的信令流程如下:
HLR返回給發(fā)起呼叫MSC/VLR的消息Send Routing Information Ack的信令為:
════════〖 GSM MAP Part 〗═══
═01100100 100: Message Type:End
10100011 163: Element Type:
00000010 002: INVOKE ID TAG(ID=0x00 )
00100010 034: ERROR CODE[=34] System Failure
00000010 002: Network Resource:VLR
而被叫手機(jī)所在的MSC/VLR返回給HLR的消息Provide Roaming Number Ack為:
══════〖 GSM MAP Part 〗═══
01100100 100: Message Type:End
10100011 163: Element Type:
00000010 002: INVOKE ID TAG(ID=0x00 )
00100010 034: ERROR CODE[=34] Resource Limited
00000010 002: Network Resource:VLR
結(jié)合上面的信令流程可以看出,有正常的位置查詢流程?梢耘袛喙收宵c(diǎn)在MSC/VLR,從MSC/VLR返回給HLR的消息Provide Roaming Number Ack的錯(cuò)誤代碼“ERROR CODE[=34] Resource Limited”可以看出是因?yàn)镸SC/VLR沒有成功給被叫手機(jī)分配漫游號(hào)碼,導(dǎo)致發(fā)起呼叫的MSC/GMSC無法知道被叫手機(jī)的位置信息,從而無法進(jìn)行呼叫的接續(xù),導(dǎo)致電話不通。而主叫手機(jī)不用進(jìn)行位置查詢,不用分配漫游號(hào)碼,所以手機(jī)呼叫固定電話時(shí)沒有故障。
3.解決方法:
故障點(diǎn)判定以后,問題就可以迎刃而解了。在ALCATEL交換機(jī)中有一類負(fù)責(zé)手機(jī)漫游號(hào)碼的分配的模塊MRSACE,當(dāng)該類模塊資源不足或模塊吊死時(shí)會(huì)分配不出漫游號(hào)碼,從信令流程上也證實(shí)了這一點(diǎn)。將該類模塊重新啟動(dòng)后,呼叫正常。
案例二
1. 故障現(xiàn)象
大量用戶反映手機(jī)撥打固定電話困難,要重?fù)軒状尾拍艽蛲。通過實(shí)地測(cè)試,發(fā)現(xiàn)存在該現(xiàn)象,而且在忙時(shí),如下午6點(diǎn)左右下班時(shí),該問題更加突出,但手機(jī)與手機(jī)沒有該類問題。
2. 故障定位
當(dāng)前的網(wǎng)絡(luò)結(jié)構(gòu)是:移動(dòng)網(wǎng)與固定網(wǎng)通過移動(dòng)關(guān)口局相連。從故障現(xiàn)象來看,問題應(yīng)該出現(xiàn)在移動(dòng)關(guān)口局或固定網(wǎng)方面。于是對(duì)移動(dòng)關(guān)口局與固定關(guān)口局之間的信令進(jìn)行追蹤,發(fā)現(xiàn)手機(jī)呼叫固定電話不成功時(shí)的信令流程為:
移動(dòng)GMSC 固定GMSC
-----------------à IAI
?---------------- CGC
-----------------à CLF
?---------------- RLG
從以上信令流程可以判定,問題就出現(xiàn)CGC上,CGC表示電路擁塞,此次故障應(yīng)該是對(duì)方中繼電路問題。
3 . 解決方法
經(jīng)與對(duì)方聯(lián)系,確定了以上判斷,等對(duì)方將中繼問題排除后,恢復(fù)。
案例三
1. 故障現(xiàn)象
在對(duì)遵義的長(zhǎng)途來話的呼損分析中發(fā)現(xiàn),遵義MSC3的長(zhǎng)途來話的呼損中總是存在一定1.3%左右的空號(hào)呼損。通過一段時(shí)間的觀察,發(fā)現(xiàn)每次都有。
2. 故障定位
從GSM規(guī)范的接續(xù)流程分析,因?yàn)槭謾C(jī)做被叫時(shí),不是用手機(jī)號(hào)碼進(jìn)行接續(xù),而是用交換機(jī)分配的一個(gè)臨時(shí)漫游號(hào)碼MSRN進(jìn)行接續(xù)的,所以不可能是在被叫手機(jī)號(hào)碼上出現(xiàn)問題。為了尋找問題所在,我決定從信令方面著手。用MPA7300信令儀對(duì)省會(huì)城市貴陽(yáng)A1/A2到MSC3的信令進(jìn)行了大量跟蹤。發(fā)現(xiàn)了下面的信令流程:
TLink3A SLink3 01:07.990
BSN: 126 FSN: 94 MSU ISUP
23-255- 60 23-255- 1 7-27 IAM 13900087211 13033661232F
TLink4A SLink4 01:20.273
BSN: 100 FSN: 71 MSU ISUP
23-255- 1 23-255- 60 7-27 ACM 07902080
TLink4A SLink4 01:22.082
BSN: 102 FSN: 77 MSU ISUP
23-255- 1 23-255- 60 7-27 REL Unallocated (unassigned) number
TLink3A SLink3 01:22.169
BSN: 28 FSN: 104 MSU ISUP
23-255- 60 23-255- 1 7-27 RLC
從以上信令流程可以看出,空號(hào)的原因就是由于被叫手機(jī)呼轉(zhuǎn)到了一個(gè)空號(hào)上,從而產(chǎn)生了空號(hào)的呼損“Unallocated (unassigned) number”。
3. 故障解決
要解決該問題,原理上很簡(jiǎn)單,只要將被叫手機(jī)的呼轉(zhuǎn)取消就可以了。但是從GSM規(guī)范中規(guī)定手機(jī)被叫時(shí)是以MSRN進(jìn)行接續(xù)的(如以上信令中的13900087211),MSRN與手機(jī)號(hào)碼之間沒有固定的對(duì)應(yīng)關(guān)系。如何找到被叫號(hào)碼成了問題的關(guān)鍵。經(jīng)過分析,決定對(duì)呼轉(zhuǎn)的空號(hào)07902080進(jìn)行跟蹤。經(jīng)過對(duì)相應(yīng)局向信令進(jìn)行了大量跟蹤,發(fā)現(xiàn)如下的信令流程:
TLink1A SLink1 02:23.064
BSN: 115 FSN: 9 MSU ISUP
23-255- 0 23-255- 60 6-26 IAM 07902080 13908510777F 13508521349 13508521349
TLink2A SLink2 02:23.154
BSN: 9 FSN: 116 MSU ISUP
23-255- 60 23-255- 0 6-26 REL Unallocated (unassigned) number
TLink1A SLink1 02:23.297
BSN: 116 FSN: 10 MSU ISUP
23-255- 0 23-255- 60 6-26 RLC
從信令可以看出主叫號(hào)碼為13908510777,被叫號(hào)碼為13508521349,呼轉(zhuǎn)的空號(hào)為07902080。將被叫13508521349的呼轉(zhuǎn)號(hào)碼取消后即可。
案例四
1. 故障現(xiàn)象
計(jì)費(fèi)中心反映手機(jī)撥打北京1860不計(jì)費(fèi)。
2. 故障定位
首先對(duì)該現(xiàn)象進(jìn)行分析,手機(jī)打其它外地1860都可以正常計(jì)費(fèi),唯獨(dú)對(duì)北京1860不計(jì)費(fèi),對(duì)計(jì)費(fèi)分檢系統(tǒng)而言,區(qū)別僅僅在費(fèi)率區(qū)(區(qū)號(hào)不同)。而北京1860和北京普通號(hào)碼是一樣的,既然普通號(hào)碼可以正常計(jì)費(fèi),那么1860也應(yīng)該能正常計(jì)費(fèi),說明費(fèi)率上沒有問題。通過以上分析,決定從信令上查找原因。通過對(duì)北京的0101860進(jìn)行追蹤發(fā)現(xiàn)了如下的信令流程:
BSN: 118 FSN: 30 MSU ISUP
23-255- 1 23-255- 60 1-10 IAM 0101860 13508521010F
TLink1A SLink1 00:42.684
BSN: 32 FSN: 122 MSU ISUP
23-255- 60 23-255- 1 1-10 ACM
TLink1A SLink1 00:44.755
BSN: 32 FSN: 125 MSU ISUP
23-255- 60 23-255- 1 1-10 ANM
TLink1A SLink1 00:45.237
BSN: 32 FSN: 0 MSU ISUP
23-255- 60 23-255- 1 1-10 REL
TLink4B SLink4 00:45.276
BSN: 0 FSN: 33 MSU ISUP
23-255- 1 23-255- 60 1-10 RLC
從信令流程上來看,沒有任何問題,但是將ACM和ANM消息展開后,發(fā)現(xiàn)計(jì)費(fèi)標(biāo)識(shí)為01,即為不計(jì)費(fèi)。這就是問題所在。
MESSTYPE : 06h = ACM
--- ACM ---
--- BACKW CALL ---
BA : ......01 = no charge
MESSTYPE : 09h = ANM
--- BACKW CALL ---
BA : ......01 = no charge
3. 故障解決
在交換機(jī)中將不計(jì)費(fèi)改為計(jì)費(fèi)后,恢復(fù)正常。
結(jié)束語(yǔ)
從以上案例可以看出,通過對(duì)信令進(jìn)行追蹤,對(duì)信令進(jìn)行分析可以在較短的時(shí)間內(nèi)定位故障點(diǎn),為故障的解決贏得時(shí)間。從另一個(gè)角度來說這也要求我們維護(hù)人員要不斷對(duì)各種信令規(guī)范進(jìn)行學(xué)習(xí),這樣才能在實(shí)戰(zhàn)中發(fā)揮作用。
摘自《通訊世界》