故障現(xiàn)象
某FDD-LTE項(xiàng)目,路測(cè)DT中存在信號(hào)較好時(shí)也會(huì)出現(xiàn)Attach失敗。而且?guī)茁瘦^高,全網(wǎng)基本有5%的幾率會(huì)出現(xiàn)。
選取一個(gè)比較明顯的簇進(jìn)行分析,如下表所示?梢钥吹匠藰(biāo)黃行可能因?yàn)樾盘?hào)質(zhì)量差而失敗外,剩下都是在信號(hào)較好時(shí)Attach失敗。
查看其中一次LOG可以發(fā)現(xiàn):
UE會(huì)上發(fā)兩次ATTACH REQ,如下圖所示,但是第一次的REQ之后并無(wú)RRC Connection Request。
兩次ATTACH REQ時(shí)間間隔為4 s,如下圖所示。
為什么會(huì)出現(xiàn)此問(wèn)題呢?正常來(lái)說(shuō)應(yīng)該ATTCH REQ之后UE會(huì)上發(fā)RRC Connection Request,為什么沒(méi)有上發(fā)呢?正常一次ATTACH失敗之后T3410應(yīng)該為15 s,為什么4 s就會(huì)再次上發(fā)呢?
故障分析
故障排查先從終端是否存在硬件故障或軟件模式設(shè)置錯(cuò)誤開(kāi)始。在排除了終端問(wèn)題后,再繼續(xù)排查是否存在網(wǎng)管參數(shù)設(shè)置問(wèn)題。
一、更換終端測(cè)試
初始懷疑是由于終端或者軟件有問(wèn)題導(dǎo)致RRC Connection Request沒(méi)有上發(fā),所以嘗試更換終端及使用QXDM進(jìn)行測(cè)試。
將終端MF823更換為MF831,測(cè)試軟件從CXT更換為QXDM。發(fā)現(xiàn)更改后還是會(huì)出現(xiàn)此問(wèn)題。說(shuō)明使用不同的終端和測(cè)試軟件會(huì)遇到相同的問(wèn)題。
因此先排除故障是由測(cè)試軟件問(wèn)題導(dǎo)致的可能性。
二、修改終端附著模式
觀察ATTACH REQ消息,如下圖所示。
對(duì)比后發(fā)現(xiàn)現(xiàn)場(chǎng)的Attach類型為2,而一般正常的attach的類型為1。類型2是指EPS attach combined EPS/IMSI attach ,懷疑是UE聯(lián)合附著在EPS和2/3G的核心網(wǎng),在2/3G的核心網(wǎng)附著失敗,最后在EPS附著成功。
現(xiàn)場(chǎng)在QXDM中,把終端的Service Domain Preference配置參數(shù)值由CS+PS修改為PS,如下圖所示。即是將終端在網(wǎng)絡(luò)側(cè)的注冊(cè)模式從(電路域+數(shù)據(jù)域)修改為(數(shù)據(jù)域),排查附著失敗是否是由于終端的附著類型設(shè)置錯(cuò)誤而導(dǎo)致的。
在修改終端側(cè)設(shè)置后進(jìn)行測(cè)試,發(fā)現(xiàn)問(wèn)題依然存在。說(shuō)明在終端側(cè)變更設(shè)置也會(huì)遇到相同的問(wèn)題。
結(jié)合步驟一和步驟二這兩點(diǎn)可以得出,故障問(wèn)題的出現(xiàn)與終端無(wú)關(guān)。排除故障是由終端問(wèn)題導(dǎo)致的可能性。因此,后續(xù)進(jìn)行網(wǎng)管配置參數(shù)的排查。
三、排查接入概率因子參數(shù)
在咨詢專家之后,發(fā)現(xiàn)在該站點(diǎn)下發(fā)的SIB2消息中,接入類的兩個(gè)參數(shù)配置可能會(huì)導(dǎo)致此類問(wèn)題,如下圖所示。
ac-BarringForMO-Signalling和ac-BarringForMO-Data的因子分別是指:信令接入概率因子和呼叫接入概率因子。
故障處理
- 在EMS網(wǎng)管的配置管理中,打開(kāi)無(wú)線參數(shù)--->LTE-FDD--->小區(qū)重選配置--->E-UTRAN小區(qū)重選頁(yè)面,將信令和呼叫兩個(gè)接入的概率因子從0.95修改至1。
2. 在修改兩個(gè)接入概率因子之后,進(jìn)行實(shí)地測(cè)試。
- 單站測(cè)試站下37次Attach之后未出現(xiàn)之前錯(cuò)誤。
- 簇10測(cè)試?yán)W(wǎng),共Attach 96次未出現(xiàn)之前錯(cuò)誤。
故障已排除,可以確定就是此參數(shù)導(dǎo)致問(wèn)題。
通信小知識(shí)
為什么信令接入概率因子和呼叫接入概率因子會(huì)造成這一類故障呢?
這是因?yàn)樵O(shè)置該參數(shù)會(huì)固定造成一定比例的接入失敗。例如本案例中,參數(shù)設(shè)置為0.95,就會(huì)約5%左右的接入失敗。該參數(shù)存在的目的是LTE系統(tǒng)為了避免海量終端接入所導(dǎo)致的無(wú)線接入網(wǎng)過(guò)載,從而引發(fā)更嚴(yán)重問(wèn)題的一種規(guī)避手段。
按照該參數(shù)的原理,只有在網(wǎng)絡(luò)用戶數(shù)量非常密集的時(shí)候才使用非1配置,例如:超忙小區(qū),有必要將用戶數(shù)量均衡到其他小區(qū)的情況。
信令和呼叫接入概率因子參數(shù)的作用是:對(duì)主叫信令業(yè)務(wù)(比如attach)或主叫數(shù)據(jù)業(yè)務(wù)是否禁止的標(biāo)識(shí)。如果存在禁止信令或數(shù)據(jù)內(nèi)容,或存在禁止的UE接入,那么就配置ac-BarringForMO-Signalling和/或ac-BarringForMO-Data內(nèi)容。
而不管終端做的什么類型的ATTACH,上發(fā)的RRCConnectionRequest消息中的原因值都是mo-Signalling。所以對(duì)于ATTACH,影響主要是信令接入概率因子這一個(gè)參數(shù),如果主叫中有出現(xiàn),是第二個(gè)參數(shù)。
對(duì)應(yīng)這兩個(gè)參數(shù)還有信令禁止接入時(shí)間和呼叫禁止接入時(shí)間兩個(gè)配套參數(shù)。這兩個(gè)配套參數(shù)的默認(rèn)配置都是4 s,這樣也就解釋了為什么兩次Attach之間是4 s而不是T3410配置的15 s。
ac-BarringForMO-Signalling如果啟用了UE inactivity timer的話,主要針對(duì)手機(jī)在入網(wǎng)時(shí)attach和周期性TAU或正常的TAU的RRC。
ac-BarringForMO-Data主要針對(duì)數(shù)據(jù)業(yè)務(wù)的主叫mo-data(如手機(jī)上網(wǎng),ftp,聯(lián)通的短信等)。
- 兩個(gè)參數(shù)的結(jié)構(gòu)
對(duì)所有的UE來(lái)說(shuō),都屬于隨機(jī)分配的10類移動(dòng)群體(mobile populations)之一,定義為接入類別(Access Classes)0 - 9。所屬的群號(hào)(population number)被存儲(chǔ)在SIM/USIM卡中。另外,移動(dòng)終端也可能屬于5個(gè)特殊類別(接入類別11 - 15)中的一個(gè)或多個(gè),同樣,也存儲(chǔ)在SIM/USIM卡中。這些特殊類別是分配給特定的高優(yōu)先級(jí)的用戶,如下所示(列舉的順序并不代表優(yōu)先級(jí)順序)[9]:
Class15 → PLMN Staff
Class14→Emergency Services
Class 13→Public Utilities(例如:水/煤氣供應(yīng)商)
Class12→Security Services
Class11→For PLMN Use
如果UE至少隸屬于那些與在空口上指定的準(zhǔn)許的類別(permitted classes)對(duì)應(yīng)的Access Classe之一,并且當(dāng)前服務(wù)網(wǎng)絡(luò)支持這些Access Class,則允許UE發(fā)起接入嘗試,否則接入嘗試是被禁止的。
接入類別適用場(chǎng)合如下:
Classes 0~9→Home and Vistised PLMNs.
Classes 11,15→Home PLMN only if the EHPLMN list is not present or any EHPLMN.
Classes 12,13,14→Home PLMN and Visited PLMNs of home country only. For this purpose the home country is defined as the country of the MCC part of the IMSI.
總結(jié)
接入時(shí),如果信令接入概率因子和呼叫接入概率因子配置為0.95,那么不管是做什么業(yè)務(wù)都會(huì)有一定幾率(5%)出現(xiàn)接入失敗。這樣會(huì)對(duì)接入涉及到的時(shí)延類指標(biāo)造成較大影響。比如:UE發(fā)送2次ATU更新才能成功,導(dǎo)致Fast Return時(shí)延過(guò)大等問(wèn)題。
此類問(wèn)題比較明顯的特征就是Attach Req之后并沒(méi)有RRC Connection Req和MSG1消息。當(dāng)碰到此現(xiàn)象時(shí),可以對(duì)這2個(gè)參數(shù)進(jìn)行檢查,查看是否是此參數(shù)配置導(dǎo)致。