故障現(xiàn)象
某FDD-LTE項目,路測DT中存在信號較好時也會出現(xiàn)Attach失敗。而且?guī)茁瘦^高,全網(wǎng)基本有5%的幾率會出現(xiàn)。
選取一個比較明顯的簇進行分析,如下表所示。可以看到除了標黃行可能因為信號質量差而失敗外,剩下都是在信號較好時Attach失敗。
查看其中一次LOG可以發(fā)現(xiàn):
UE會上發(fā)兩次ATTACH REQ,如下圖所示,但是第一次的REQ之后并無RRC Connection Request。
兩次ATTACH REQ時間間隔為4 s,如下圖所示。

為什么會出現(xiàn)此問題呢?正常來說應該ATTCH REQ之后UE會上發(fā)RRC Connection Request,為什么沒有上發(fā)呢?正常一次ATTACH失敗之后T3410應該為15 s,為什么4 s就會再次上發(fā)呢?
故障分析
故障排查先從終端是否存在硬件故障或軟件模式設置錯誤開始。在排除了終端問題后,再繼續(xù)排查是否存在網(wǎng)管參數(shù)設置問題。
一、更換終端測試
初始懷疑是由于終端或者軟件有問題導致RRC Connection Request沒有上發(fā),所以嘗試更換終端及使用QXDM進行測試。
將終端MF823更換為MF831,測試軟件從CXT更換為QXDM。發(fā)現(xiàn)更改后還是會出現(xiàn)此問題。說明使用不同的終端和測試軟件會遇到相同的問題。
因此先排除故障是由測試軟件問題導致的可能性。
二、修改終端附著模式
觀察ATTACH REQ消息,如下圖所示。

對比后發(fā)現(xiàn)現(xiàn)場的Attach類型為2,而一般正常的attach的類型為1。類型2是指EPS attach combined EPS/IMSI attach ,懷疑是UE聯(lián)合附著在EPS和2/3G的核心網(wǎng),在2/3G的核心網(wǎng)附著失敗,最后在EPS附著成功。
現(xiàn)場在QXDM中,把終端的Service Domain Preference配置參數(shù)值由CS+PS修改為PS,如下圖所示。即是將終端在網(wǎng)絡側的注冊模式從(電路域+數(shù)據(jù)域)修改為(數(shù)據(jù)域),排查附著失敗是否是由于終端的附著類型設置錯誤而導致的。

在修改終端側設置后進行測試,發(fā)現(xiàn)問題依然存在。說明在終端側變更設置也會遇到相同的問題。
結合步驟一和步驟二這兩點可以得出,故障問題的出現(xiàn)與終端無關。排除故障是由終端問題導致的可能性。因此,后續(xù)進行網(wǎng)管配置參數(shù)的排查。
三、排查接入概率因子參數(shù)
在咨詢專家之后,發(fā)現(xiàn)在該站點下發(fā)的SIB2消息中,接入類的兩個參數(shù)配置可能會導致此類問題,如下圖所示。

ac-BarringForMO-Signalling和ac-BarringForMO-Data的因子分別是指:信令接入概率因子和呼叫接入概率因子。
故障處理
- 在EMS網(wǎng)管的配置管理中,打開無線參數(shù)--->LTE-FDD--->小區(qū)重選配置--->E-UTRAN小區(qū)重選頁面,將信令和呼叫兩個接入的概率因子從0.95修改至1。

2. 在修改兩個接入概率因子之后,進行實地測試。
- 單站測試站下37次Attach之后未出現(xiàn)之前錯誤。
- 簇10測試拉網(wǎng),共Attach 96次未出現(xiàn)之前錯誤。
故障已排除,可以確定就是此參數(shù)導致問題。
通信小知識
為什么信令接入概率因子和呼叫接入概率因子會造成這一類故障呢?
這是因為設置該參數(shù)會固定造成一定比例的接入失敗。例如本案例中,參數(shù)設置為0.95,就會約5%左右的接入失敗。該參數(shù)存在的目的是LTE系統(tǒng)為了避免海量終端接入所導致的無線接入網(wǎng)過載,從而引發(fā)更嚴重問題的一種規(guī)避手段。
按照該參數(shù)的原理,只有在網(wǎng)絡用戶數(shù)量非常密集的時候才使用非1配置,例如:超忙小區(qū),有必要將用戶數(shù)量均衡到其他小區(qū)的情況。
信令和呼叫接入概率因子參數(shù)的作用是:對主叫信令業(yè)務(比如attach)或主叫數(shù)據(jù)業(yè)務是否禁止的標識。如果存在禁止信令或數(shù)據(jù)內容,或存在禁止的UE接入,那么就配置ac-BarringForMO-Signalling和/或ac-BarringForMO-Data內容。
而不管終端做的什么類型的ATTACH,上發(fā)的RRCConnectionRequest消息中的原因值都是mo-Signalling。所以對于ATTACH,影響主要是信令接入概率因子這一個參數(shù),如果主叫中有出現(xiàn),是第二個參數(shù)。
對應這兩個參數(shù)還有信令禁止接入時間和呼叫禁止接入時間兩個配套參數(shù)。這兩個配套參數(shù)的默認配置都是4 s,這樣也就解釋了為什么兩次Attach之間是4 s而不是T3410配置的15 s。
ac-BarringForMO-Signalling如果啟用了UE inactivity timer的話,主要針對手機在入網(wǎng)時attach和周期性TAU或正常的TAU的RRC。
ac-BarringForMO-Data主要針對數(shù)據(jù)業(yè)務的主叫mo-data(如手機上網(wǎng),ftp,聯(lián)通的短信等)。
對所有的UE來說,都屬于隨機分配的10類移動群體(mobile populations)之一,定義為接入類別(Access Classes)0 - 9。所屬的群號(population number)被存儲在SIM/USIM卡中。另外,移動終端也可能屬于5個特殊類別(接入類別11 - 15)中的一個或多個,同樣,也存儲在SIM/USIM卡中。這些特殊類別是分配給特定的高優(yōu)先級的用戶,如下所示(列舉的順序并不代表優(yōu)先級順序)[9]:
Class15 → PLMN Staff
Class14→Emergency Services
Class 13→Public Utilities(例如:水/煤氣供應商)
Class12→Security Services
Class11→For PLMN Use
如果UE至少隸屬于那些與在空口上指定的準許的類別(permitted classes)對應的Access Classe之一,并且當前服務網(wǎng)絡支持這些Access Class,則允許UE發(fā)起接入嘗試,否則接入嘗試是被禁止的。
接入類別適用場合如下:
Classes 0~9→Home and Vistised PLMNs.
Classes 11,15→Home PLMN only if the EHPLMN list is not present or any EHPLMN.
Classes 12,13,14→Home PLMN and Visited PLMNs of home country only. For this purpose the home country is defined as the country of the MCC part of the IMSI.
總結
接入時,如果信令接入概率因子和呼叫接入概率因子配置為0.95,那么不管是做什么業(yè)務都會有一定幾率(5%)出現(xiàn)接入失敗。這樣會對接入涉及到的時延類指標造成較大影響。比如:UE發(fā)送2次ATU更新才能成功,導致Fast Return時延過大等問題。
此類問題比較明顯的特征就是Attach Req之后并沒有RRC Connection Req和MSG1消息。當碰到此現(xiàn)象時,可以對這2個參數(shù)進行檢查,查看是否是此參數(shù)配置導致。