一、概述
從VoLTE開始LTE流程變得更加復雜;首先,原來的雙層網絡結構被新加入的IMS域搞得異常復雜;其次,21個網元和38個接口使多數人都是過目即忘;此外,多業(yè)務混合并發(fā)、QoS得到應用、專用承載不定時地做建立、修改和釋放操作。
在VOLTE網絡中由于專用承載的頻繁管理操作、SIP消息傳遞丟失、重發(fā)和高延遲,以及相互之間千絲萬縷的聯系,相互之間缺乏相關控制機制(如同步、交互)導致了一系列極為錯綜復雜網絡異,F象,這些給日常分析帶來許多困難。
VoLTE網絡的通信機制是來自4個標準化組織組合的產物,它們分別是:1.3GPP的23系列規(guī)范;2SIP/RTP/DIAMETER/IPSec取自IETF的RFC;3.VoLTE Profile和RCS取自GSMA的IR;4.Video code取自ITU-T的H.264。
目前網絡中的異常事件主要與這些標準之間的兼容性相關;本文以切換與承載管理沖突形成的異常事件為樣本,分析VoLTE網絡中的異常事件。
二、切換與專用承載管理流程沖突導致的異常事件
1、切換與專用承載建立流程沖突導致(SIP消息503)
通常用戶撥打電話具有隨機性,網絡無法準確預估專用承載建立的時間點。當專用承載建立請求在源小區(qū)(eNB-A)發(fā)出RRC Connection Reconfigure和MME收到S1 pathswitch request之間到達時,源小區(qū)會認為UE已切出,源基站除了緩存用戶的用戶面數據外,不應再處理該UE的(切換)消息,以原因值“未知的eNB UE S1APID”的方式拒絕專用承載建立請求,最終SBC會下發(fā)
503錯誤。
圖1 專用承載建立與空口切換流程沖突
如上圖所示:該問題的解決辦法是要使MME能再次向切換的目標小區(qū)(eNB-B)發(fā)專用承載建立請求,即在目標小區(qū)上發(fā)Path Switch Rquest ACK之后再發(fā)ERAB Setup Request。
目前一般是通過升級SGW來解決該問題;但是升級之后可能會出現新問題下面討論的問題。
2、切換與專用承載釋放流程沖突導致的異常事件
切換與專用承載釋放流程沖突在專用承載建立、修改和釋放階段都可能概率性發(fā)生,在建立和修改階段一般會伴隨出現503錯誤,導致未接通;
在釋放階段,如果出現該問題則有可能會出現一種死循環(huán),QCI1專用承載一直無法釋放,除非人工干預(關機重啟或飛行模式切換),否則可能永遠無法做主被叫。
圖2 專用承載無法釋放,無法做主被叫,頻繁出現481,487和488錯誤
被掛(叫)側(UE-B)出現RRC重建,沒有及時接收到SIP消息,但S-CSCF先觸發(fā)500(Server Internal Error),并清理了主掛側的QCI專用承載和會話;但S-CSCF未同步清理被掛側,直到SIP重傳超時后,通過408(Request Timeout)清理IMS域會話;被掛終端每隔4秒重復BYE消息,而SBC認為會話已結束,回復481(Call/Transaction Does Not Exist),未觸發(fā)MME啟動專用承載釋放流程,同時終端沒有其他途徑通知MME啟動專用承載釋放流程,因此QCI1專用承載一直吊死,后續(xù)通話無法進行。
在測試中切換是導致QCI1專用承載無法釋放的原因之一,還有很多其他的可能,為避免上述這種極端的情況出現,目前給出的建議是:SBC無論在收到或發(fā)出BYE消息之后,不要等待BYE200消息的確認,無條件啟動會話清理和專用承載釋放流程。
3、SGW升級后連續(xù)下發(fā)S1AP消息導致的異常
為了解決本節(jié)第1點的問題,現網中通過對SGW升級來使MME能向目標小區(qū)重發(fā)專用承載建立請求(ERAB Setup Request),但該消息的發(fā)送時機不當仍然會導致產生一些異常。
(1) ERAB Setup Request消息在PathSwitch Request ACK之前抵達
圖3 ERAB Setup Request消息在PathSwitch Request ACK之前抵達
目標eNB(eNB-B)尚未完成S1承載的切換,因此會以cause值“unspecified”響應建立請求,專用承載建立失敗,SBC將下發(fā)503錯誤。該現象說明SGW的處理機制存在一定問題,必須在Path Switch Request ACK之后再重發(fā)專用承載建立請求。
(2)ERAB Setup Request在Path Switch Request ACK之后1ms左右達到;
而eNB未響應專用承載建立請求
圖4 專用承載建立請求消息丟失
根據3GPP規(guī)范和中國移動的技術白皮書,S1/X2切換目標側執(zhí)行階段,基站必須先響應切換執(zhí)行,然后再處理專用承載管理。由于eNB沒有緩存該消息,導致沒有響應專用承載建立請求。
目前給出的解決辦法:是對eNB做參數調整或升級,使其能夠緩存ERAB管理消息 (erabsetup/ erab modify/ erab release )。
(3)eNB異常處理NAS消息,eNB響應了S1承載刪除請求,但沒有將NAS消息進一步傳遞給UE,導致UE的上下文出現異常; eNB發(fā)現上下文異常時,將請求MME清理UE上下文并釋放RRC Connection。
圖5 空口QCI1 DRB未釋放
本例現象發(fā)生在業(yè)務釋放階段,在SBC滿足第2點改造要求的情況下,對業(yè)務體驗不會有明顯影響。如果eNB不及時清理,或者SBC不及時清理,就有可能出現上述第2點的死循環(huán)現象。
4、Gx和Rx流程異常導致的專用承載建立失敗
PRCF的Gx和Rx接口采用Diameter信令,基于L-DRA路由,由于L-DRA的緩沖時延或者路由迂回都可能導致Gx鏈路時延大,RAR未及時發(fā)送到PGW;同時因X2/S1切換 SGW向PGW請求修改專用承載。根據協議規(guī)定,PGW會繼續(xù)SGW-initiated bearer modification procedure而reject RAR(result code: DIAMETER_OUT_OF_SPACE)。該問題與第1點類似,也是專用承載建立與切換流程沖突造成的專用承載建立失敗,同樣會觸發(fā)503錯誤,該類問題發(fā)生
在EPC域內。
圖6專用承載建立與EPC切換流程沖突
三、VOLTE流程異常事件總結
在VOLTE網絡中業(yè)務流程涉及多個通信規(guī)范和標準,目前的異常事件主要集中在專用承載建立、修改和釋放過程;主要集中在以下三方面:
1.專用承載建立與流程沖突:主叫會收到503,終端主動轉CSFB;被叫會發(fā)出580,然后收到Cancel由網絡發(fā)CS paging轉CSFB。
2.專用承載修改與流程沖突:空口的專用承載修改一般在主叫側發(fā)生,終端會發(fā)出Canel,主動轉CSFB。
3.專用承載釋放與流程沖突:若SBC未及時觸發(fā)專用承載清理,或者eNB丟失S1AP消息,有很可能出現死鎖現象,導致無法主被叫,特別是在被掛側;若SBC已升級(收到BYE消息立即清理)且MME由S1AP消息重發(fā)機制,則目前的問題主要集中在基站上。
針對以上問題,路測儀表統計為掉話,但不影響客戶感知;可以向用戶提出申請在統計中剔除。
[[i] 本帖最后由 ranhj 于 2016-12-8 09:41 編輯 [/i]]