一、概述
從VoLTE開始LTE流程變得更加復(fù)雜;首先,原來的雙層網(wǎng)絡(luò)結(jié)構(gòu)被新加入的IMS域搞得異常復(fù)雜;其次,21個網(wǎng)元和38個接口使多數(shù)人都是過目即忘;此外,多業(yè)務(wù)混合并發(fā)、QoS得到應(yīng)用、專用承載不定時地做建立、修改和釋放操作。
在VOLTE網(wǎng)絡(luò)中由于專用承載的頻繁管理操作、SIP消息傳遞丟失、重發(fā)和高延遲,以及相互之間千絲萬縷的聯(lián)系,相互之間缺乏相關(guān)控制機制(如同步、交互)導(dǎo)致了一系列極為錯綜復(fù)雜網(wǎng)絡(luò)異常現(xiàn)象,這些給日常分析帶來許多困難。
VoLTE網(wǎng)絡(luò)的通信機制是來自4個標準化組織組合的產(chǎn)物,它們分別是:1.3GPP的23系列規(guī)范;2SIP/RTP/DIAMETER/IPSec取自IETF的RFC;3.VoLTE Profile和RCS取自GSMA的IR;4.Video code取自ITU-T的H.264。
目前網(wǎng)絡(luò)中的異常事件主要與這些標準之間的兼容性相關(guān);本文以切換與承載管理沖突形成的異常事件為樣本,分析VoLTE網(wǎng)絡(luò)中的異常事件。
二、切換與專用承載管理流程沖突導(dǎo)致的異常事件
1、切換與專用承載建立流程沖突導(dǎo)致(SIP消息503)
通常用戶撥打電話具有隨機性,網(wǎng)絡(luò)無法準確預(yù)估專用承載建立的時間點。當專用承載建立請求在源小區(qū)(eNB-A)發(fā)出RRC Connection Reconfigure和MME收到S1 pathswitch request之間到達時,源小區(qū)會認為UE已切出,源基站除了緩存用戶的用戶面數(shù)據(jù)外,不應(yīng)再處理該UE的(切換)消息,以原因值“未知的eNB UE S1APID”的方式拒絕專用承載建立請求,最終SBC會下發(fā)
503錯誤。

圖1 專用承載建立與空口切換流程沖突
如上圖所示:該問題的解決辦法是要使MME能再次向切換的目標小區(qū)(eNB-B)發(fā)專用承載建立請求,即在目標小區(qū)上發(fā)Path Switch Rquest ACK之后再發(fā)ERAB Setup Request。
目前一般是通過升級SGW來解決該問題;但是升級之后可能會出現(xiàn)新問題下面討論的問題。
2、切換與專用承載釋放流程沖突導(dǎo)致的異常事件
切換與專用承載釋放流程沖突在專用承載建立、修改和釋放階段都可能概率性發(fā)生,在建立和修改階段一般會伴隨出現(xiàn)503錯誤,導(dǎo)致未接通;
在釋放階段,如果出現(xiàn)該問題則有可能會出現(xiàn)一種死循環(huán),QCI1專用承載一直無法釋放,除非人工干預(yù)(關(guān)機重啟或飛行模式切換),否則可能永遠無法做主被叫。

圖2 專用承載無法釋放,無法做主被叫,頻繁出現(xiàn)481,487和488錯誤
被掛(叫)側(cè)(UE-B)出現(xiàn)RRC重建,沒有及時接收到SIP消息,但S-CSCF先觸發(fā)500(Server Internal Error),并清理了主掛側(cè)的QCI專用承載和會話;但S-CSCF未同步清理被掛側(cè),直到SIP重傳超時后,通過408(Request Timeout)清理IMS域會話;被掛終端每隔4秒重復(fù)BYE消息,而SBC認為會話已結(jié)束,回復(fù)481(Call/Transaction Does Not Exist),未觸發(fā)MME啟動專用承載釋放流程,同時終端沒有其他途徑通知MME啟動專用承載釋放流程,因此QCI1專用承載一直吊死,后續(xù)通話無法進行。
在測試中切換是導(dǎo)致QCI1專用承載無法釋放的原因之一,還有很多其他的可能,為避免上述這種極端的情況出現(xiàn),目前給出的建議是:SBC無論在收到或發(fā)出BYE消息之后,不要等待BYE200消息的確認,無條件啟動會話清理和專用承載釋放流程。
3、SGW升級后連續(xù)下發(fā)S1AP消息導(dǎo)致的異常
為了解決本節(jié)第1點的問題,現(xiàn)網(wǎng)中通過對SGW升級來使MME能向目標小區(qū)重發(fā)專用承載建立請求(ERAB Setup Request),但該消息的發(fā)送時機不當仍然會導(dǎo)致產(chǎn)生一些異常。
(1) ERAB Setup Request消息在PathSwitch Request ACK之前抵達
圖3 ERAB Setup Request消息在PathSwitch Request ACK之前抵達
目標eNB(eNB-B)尚未完成S1承載的切換,因此會以cause值“unspecified”響應(yīng)建立請求,專用承載建立失敗,SBC將下發(fā)503錯誤。該現(xiàn)象說明SGW的處理機制存在一定問題,必須在Path Switch Request ACK之后再重發(fā)專用承載建立請求。
(2)ERAB Setup Request在Path Switch Request ACK之后1ms左右達到;
而eNB未響應(yīng)專用承載建立請求
圖4 專用承載建立請求消息丟失
根據(jù)3GPP規(guī)范和中國移動的技術(shù)白皮書,S1/X2切換目標側(cè)執(zhí)行階段,基站必須先響應(yīng)切換執(zhí)行,然后再處理專用承載管理。由于eNB沒有緩存該消息,導(dǎo)致沒有響應(yīng)專用承載建立請求。
目前給出的解決辦法:是對eNB做參數(shù)調(diào)整或升級,使其能夠緩存ERAB管理消息 (erabsetup/ erab modify/ erab release )。
(3)eNB異常處理NAS消息,eNB響應(yīng)了S1承載刪除請求,但沒有將NAS消息進一步傳遞給UE,導(dǎo)致UE的上下文出現(xiàn)異常; eNB發(fā)現(xiàn)上下文異常時,將請求MME清理UE上下文并釋放RRC Connection。
圖5 空口QCI1 DRB未釋放
本例現(xiàn)象發(fā)生在業(yè)務(wù)釋放階段,在SBC滿足第2點改造要求的情況下,對業(yè)務(wù)體驗不會有明顯影響。如果eNB不及時清理,或者SBC不及時清理,就有可能出現(xiàn)上述第2點的死循環(huán)現(xiàn)象。
4、Gx和Rx流程異常導(dǎo)致的專用承載建立失敗
PRCF的Gx和Rx接口采用Diameter信令,基于L-DRA路由,由于L-DRA的緩沖時延或者路由迂回都可能導(dǎo)致Gx鏈路時延大,RAR未及時發(fā)送到PGW;同時因X2/S1切換 SGW向PGW請求修改專用承載。根據(jù)協(xié)議規(guī)定,PGW會繼續(xù)SGW-initiated bearer modification procedure而reject RAR(result code: DIAMETER_OUT_OF_SPACE)。該問題與第1點類似,也是專用承載建立與切換流程沖突造成的專用承載建立失敗,同樣會觸發(fā)503錯誤,該類問題發(fā)生
在EPC域內(nèi)。
圖6專用承載建立與EPC切換流程沖突
三、VOLTE流程異常事件總結(jié)
在VOLTE網(wǎng)絡(luò)中業(yè)務(wù)流程涉及多個通信規(guī)范和標準,目前的異常事件主要集中在專用承載建立、修改和釋放過程;主要集中在以下三方面:
1.專用承載建立與流程沖突:主叫會收到503,終端主動轉(zhuǎn)CSFB;被叫會發(fā)出580,然后收到Cancel由網(wǎng)絡(luò)發(fā)CS paging轉(zhuǎn)CSFB。
2.專用承載修改與流程沖突:空口的專用承載修改一般在主叫側(cè)發(fā)生,終端會發(fā)出Canel,主動轉(zhuǎn)CSFB。
3.專用承載釋放與流程沖突:若SBC未及時觸發(fā)專用承載清理,或者eNB丟失S1AP消息,有很可能出現(xiàn)死鎖現(xiàn)象,導(dǎo)致無法主被叫,特別是在被掛側(cè);若SBC已升級(收到BYE消息立即清理)且MME由S1AP消息重發(fā)機制,則目前的問題主要集中在基站上。
針對以上問題,路測儀表統(tǒng)計為掉話,但不影響客戶感知;可以向用戶提出申請在統(tǒng)計中剔除。

[[i] 本帖最后由 ranhj 于 2016-12-8 09:41 編輯 [/i]]