基于網(wǎng)管性能數(shù)據(jù)的KPI優(yōu)化方法

相關(guān)專題: 無(wú)線 中興通訊

摘要: 結(jié)合中興通訊在全球商用網(wǎng)的優(yōu)化案例,討論基于網(wǎng)管性能統(tǒng)計(jì)數(shù)據(jù)對(duì)網(wǎng)絡(luò)KPI進(jìn)行優(yōu)化的思路和具體方法。對(duì)網(wǎng)絡(luò)日常優(yōu)化所需關(guān)注的主要KPI進(jìn)行了介紹。

概述

隨著商用網(wǎng)絡(luò)規(guī)模的不斷擴(kuò)大,單純采用路測(cè)優(yōu)化方式已經(jīng)不能滿足工作需求。在網(wǎng)絡(luò)成熟期,更多的情況是首先通過(guò)后臺(tái)網(wǎng)管的海量數(shù)據(jù)統(tǒng)計(jì)和分析,初步找出異常指標(biāo),繼而確定是RNC級(jí)的問(wèn)題還是個(gè)別小區(qū)問(wèn)題,再結(jié)合具體的優(yōu)化手段進(jìn)行詳細(xì)分析。本文對(duì)基于后臺(tái)網(wǎng)管性能統(tǒng)計(jì)數(shù)據(jù)的KPI優(yōu)化手段進(jìn)行初步的分析。

在傳統(tǒng)的基于DT和CQT數(shù)據(jù)的優(yōu)化過(guò)程中,數(shù)據(jù)的采集是一個(gè)比較費(fèi)時(shí)的過(guò)程。為了復(fù)現(xiàn)某個(gè)問(wèn)題,可能需要進(jìn)行大量的路測(cè),之后在對(duì)長(zhǎng)時(shí)間的路測(cè)數(shù)據(jù)進(jìn)行回放分析的過(guò)程中,定位到具體需要分析的問(wèn)題點(diǎn),然后從不同的角度進(jìn)行分析,最終找到問(wèn)題的解決方案。雖然在一些智能化的工具支持下,問(wèn)題的定位與分析能在一定程度上簡(jiǎn)化,但這仍然屬于對(duì)個(gè)案問(wèn)題進(jìn)行優(yōu)化的范疇,缺乏全網(wǎng)級(jí)的綜合信息加以支撐。而基于后臺(tái)網(wǎng)管性能數(shù)據(jù)的優(yōu)化則與之相反,這種優(yōu)化方法基于大量的性能統(tǒng)計(jì)數(shù)據(jù),強(qiáng)調(diào)各KPI指標(biāo)之間的關(guān)聯(lián)性以及KPI指標(biāo)與各種外在因素的密切聯(lián)系。工程師需要做的,是在相應(yīng)工具的支持下,從性能數(shù)據(jù)與配置數(shù)據(jù)、告警數(shù)據(jù)、地理信息、時(shí)間信息等入手,深入挖掘數(shù)據(jù)之間的聯(lián)系,從而定位KPI相關(guān)問(wèn)題發(fā)生的原因,提出相應(yīng)的解決方案。

常用KPI簡(jiǎn)介

根據(jù)各類計(jì)數(shù)器,可定義很多種性能指標(biāo)。其中一部分是一般性能指標(biāo),可稱為GPI(General Performance Indicator)。一部分是常用的用于評(píng)價(jià)網(wǎng)絡(luò)質(zhì)量的指標(biāo),可認(rèn)為是網(wǎng)絡(luò)關(guān)鍵指標(biāo)。

KPI通常分為路測(cè)部分和后臺(tái)部分,本文中專門(mén)討論后臺(tái)部分的指標(biāo)。后臺(tái)網(wǎng)管統(tǒng)計(jì)可分為RNC級(jí)統(tǒng)計(jì)和Cell級(jí)統(tǒng)計(jì),針對(duì)不同的指標(biāo)采用不同的統(tǒng)計(jì)范圍和粒度。

從實(shí)際應(yīng)用的角度,通常有以下幾類KPI,分為接入類、切換類、掉話類、資源類、速率類、質(zhì)量類等,其中很多指標(biāo)可以進(jìn)一步按業(yè)務(wù)等條件進(jìn)行細(xì)分,構(gòu)成復(fù)雜的KPI體系。但在日常的KPI監(jiān)控和優(yōu)化的過(guò)程中,通常選取最重要的幾項(xiàng)指標(biāo),反映網(wǎng)絡(luò)的總體性能。當(dāng)有必要時(shí),才對(duì)描述細(xì)節(jié)性能的指標(biāo)進(jìn)行考察。這體現(xiàn)了問(wèn)題分解、逐步求精的分析思路。從用戶的使用感受角度考慮,最重要的KPI指標(biāo)應(yīng)該是掉話率,包括語(yǔ)音、可視電話、PS R99業(yè)務(wù)以及HSPA業(yè)務(wù)的掉話率,而CS業(yè)務(wù)的掉話相對(duì)PS業(yè)務(wù)來(lái)說(shuō)帶來(lái)的負(fù)面體驗(yàn)更嚴(yán)重。其次一個(gè)重要的KPI類別是接入類指標(biāo),這反映了用戶是否能在任何時(shí)間、任何地點(diǎn)及時(shí)地獲取高質(zhì)量的移動(dòng)通信服務(wù)。接下來(lái)的重要指標(biāo)包括質(zhì)量類指標(biāo)、速率類指標(biāo)等,這些是用戶直接能感受到并關(guān)心的。切換類、資源類指標(biāo)則更多地為運(yùn)營(yíng)商所關(guān)注。

需要說(shuō)明的是,在基于網(wǎng)管的KPI體系中,部分KPI指標(biāo)比較難于體現(xiàn),典型的如呼叫建立時(shí)延,其信令點(diǎn)涉及對(duì)核心網(wǎng)消息的解碼,通常不在RNC內(nèi)完成,因此更多的是從路測(cè)途徑對(duì)時(shí)延KPI進(jìn)行測(cè)試評(píng)估。

在基于網(wǎng)管數(shù)據(jù)的KPI優(yōu)化方式中,典型的KPI如下圖1所示。

圖1 典型網(wǎng)管KPI示意圖

網(wǎng)管KPI優(yōu)化

網(wǎng)管KPI優(yōu)化流程

網(wǎng)管KPI優(yōu)化是通過(guò)對(duì)OMC統(tǒng)計(jì)數(shù)據(jù)的分析來(lái)定位異常KPI的過(guò)程。異常KPI是指日常網(wǎng)絡(luò)運(yùn)行監(jiān)控中網(wǎng)絡(luò)質(zhì)量報(bào)告輸出的KPI不滿足項(xiàng),如接入成功率、掉話率、異系統(tǒng)切換成功率等。不同的KPI的分析方法可能有所不同,但總體流程是存在共性的,其分析思路是:

從面到點(diǎn)進(jìn)行問(wèn)題定位和分析,即從RNC級(jí)性能到小區(qū)級(jí)(Cell)性能,結(jié)合KPI之間的橫向分析,以及從KPI到相關(guān)PI的縱向分析。從RNC入手,可以了解整個(gè)WCDMA網(wǎng)絡(luò)的整體性能。如果RNC級(jí)的指標(biāo)有異常,則要分別對(duì)每個(gè)小區(qū)的指標(biāo)進(jìn)行分析,確認(rèn)指標(biāo)異常是普遍現(xiàn)象還是個(gè)別現(xiàn)象:如果是普遍現(xiàn)象,需要從覆蓋、容量、干擾、傳輸、設(shè)備軟硬件、無(wú)線參數(shù)等方面進(jìn)行分析;如果是個(gè)別小區(qū)異常,應(yīng)從相應(yīng)的小區(qū)性能統(tǒng)計(jì)項(xiàng)進(jìn)行詳細(xì)分析。需要注意的是,在查看百分比類相對(duì)性指標(biāo)時(shí),還需要同時(shí)查看指標(biāo)中的絕對(duì)次數(shù),因?yàn)榘俜直戎笜?biāo)有時(shí)會(huì)掩蓋部分小區(qū)的問(wèn)題。分兩種情況:一是百分比指標(biāo)差,但采樣點(diǎn)少,不具備統(tǒng)計(jì)意義;二是失敗次數(shù)(分子)多,但由于總體樣本點(diǎn)(分母)更多,其百分比指標(biāo)會(huì)很好,容易掩蓋一些問(wèn)題,需要特別注意。

在網(wǎng)管KPI優(yōu)化過(guò)程中,純粹的OMC統(tǒng)計(jì)數(shù)據(jù)可能還不夠,這時(shí)就需要多元化的數(shù)據(jù)作為分析的輸入,如設(shè)備告警/設(shè)備日志數(shù)據(jù)、小區(qū)跟蹤數(shù)據(jù)。如果仍然無(wú)法定位問(wèn)題,則進(jìn)行相關(guān)小區(qū)的DT/CQT專項(xiàng)測(cè)試,結(jié)合UE側(cè)數(shù)據(jù)進(jìn)行分析,直至問(wèn)題的定位解決。圖2是網(wǎng)管KPI優(yōu)化流程,解析如下。

(1)后臺(tái)統(tǒng)計(jì)指標(biāo)有RNC級(jí)的不合格指標(biāo)時(shí),明確是否突發(fā)性、可自愈性的異常。這類異常包括大風(fēng)、大雨、冰雹等氣候變化,假日、集會(huì)、體育比賽等用戶集散變化,傳輸瞬斷現(xiàn)象,電源故障等,通常持續(xù)時(shí)間不長(zhǎng),但是對(duì)統(tǒng)計(jì)指標(biāo)可能有很大影響,需記錄具體原因和提出相應(yīng)的改進(jìn)建議;

(2)若不是突發(fā)、可自愈的指標(biāo)異常,要做的第一件事是檢查設(shè)備告警信息,排除可能的設(shè)備告警,這點(diǎn)很重要。若設(shè)備無(wú)告警或告警消除后指標(biāo)沒(méi)有恢復(fù)正常,進(jìn)行下一步;

(3)將統(tǒng)計(jì)指標(biāo)和話務(wù)量聯(lián)合起來(lái)進(jìn)行過(guò)濾,列出所有指標(biāo)不滿足的小區(qū),并進(jìn)行地理化顯示;收集網(wǎng)絡(luò)當(dāng)前的傳輸配置表、軟硬件版本和無(wú)線參數(shù)配置信息,分析篩選出的異常小區(qū)是否存在某些共性,如有則針對(duì)其共性進(jìn)行專題分析。典型的共性特征包括:CN/RNC側(cè)重點(diǎn)檢查近期有無(wú)版本升級(jí)、CPU負(fù)荷、鏈路資源占用情況等;傳輸側(cè)檢查是否有傳輸節(jié)點(diǎn)中斷、傳輸誤碼率過(guò)高等;檢查硬件更新情況;檢查無(wú)線側(cè)網(wǎng)元有無(wú)軟件升級(jí);查看小區(qū)上行接收功率指標(biāo),看是否存在上行干擾;檢查異常小區(qū)的幾個(gè)最常調(diào)整的無(wú)線參數(shù),看參數(shù)是否異常;查看異常小區(qū)統(tǒng)計(jì)指標(biāo)惡化發(fā)生的時(shí)間段,查找有無(wú)規(guī)律;其他暫沒(méi)有列出的共性情況;

圖2 網(wǎng)管KPI優(yōu)化流程圖

(4)若異常小區(qū)沒(méi)有找到共性,或優(yōu)化后仍有不滿足指標(biāo)的小區(qū),則進(jìn)行單小區(qū)的異常指標(biāo)分析。主要關(guān)注無(wú)線接通率、掉話率、軟切換成功率、2/3G互操作指標(biāo)、PS業(yè)務(wù)速率等幾方面。

(5)上面所有步驟處理完畢后,若仍然有小區(qū)異常,并且確認(rèn)是設(shè)備Bug或是系統(tǒng)實(shí)現(xiàn)問(wèn)題,需要設(shè)備廠商相關(guān)技術(shù)人員解決。

無(wú)線接通率優(yōu)化

影響無(wú)線接通率的原因分析如下:

(1)覆蓋弱區(qū)發(fā)起接入使得信令流程無(wú)法完成導(dǎo)致接入失敗;

(2)接入時(shí)被叫手機(jī)發(fā)起位置更新使得尋呼不到手機(jī)導(dǎo)致接入失。

(3)小區(qū)重選不及時(shí)使得UE未在最優(yōu)小區(qū)發(fā)起接入導(dǎo)致接入失;

(4)隨機(jī)接入?yún)?shù)(前導(dǎo)功率、小區(qū)搜索窗長(zhǎng)度等)設(shè)置不當(dāng)使得RRC建立不成功導(dǎo)致接入失敗;

(5)LAC區(qū)交界處發(fā)起接入,由于小區(qū)更新導(dǎo)致的接入失敗;

(6)RAB建立失敗導(dǎo)致的接入失敗。RAB指派建立過(guò)程有兩個(gè)制約,一是RB建立,這是對(duì)UE的參數(shù)配置過(guò)程,一般不會(huì)發(fā)生問(wèn)題;二是無(wú)線鏈路重配過(guò)程,主要完成對(duì)NodeB鏈路參數(shù)配置,相對(duì)容易發(fā)生失敗。常見(jiàn)的失敗原因有:無(wú)線鏈路重配準(zhǔn)備失。ó(dāng)NodeB的資源出現(xiàn)問(wèn)題,如發(fā)生實(shí)例吊死);無(wú)線鏈路重配取消(當(dāng)RNC內(nèi)部資源或流程出現(xiàn)問(wèn)題)。還有一種情況會(huì)導(dǎo)致RAB失敗,即小區(qū)負(fù)荷較高時(shí)RNC通過(guò)接納控制發(fā)出拒絕指令。

無(wú)線掉話率優(yōu)化

無(wú)線掉話率優(yōu)化的思路如下:

(1)分析RNC的掉話率指標(biāo),主要從整個(gè)RNC的整體掉話率指標(biāo)上判斷掉話率指標(biāo)是否正常。

(2)分析小區(qū)的掉話率指標(biāo)。主要需要分析小區(qū)“AMR掉話率”、“VP掉話率”、“PS掉話率”、“硬切換掉話率”、“系統(tǒng)間切換掉話率”,對(duì)所有小區(qū)分別用以上的指標(biāo)進(jìn)行排序,選擇指標(biāo)特別差的小區(qū)或者最差的一些小區(qū),進(jìn)一步分析掉話原因。

(3)檢查小區(qū)是否異常。檢查小區(qū)告警,排除小區(qū)異常方面的原因。

(4)分析掉話原因,從覆蓋、切換、干擾幾方面考慮。如果失敗信令顯示用戶面或無(wú)線鏈路失敗,并且原因是“RLC不可恢復(fù)錯(cuò)誤”的話,可能是覆蓋導(dǎo)致的掉話問(wèn)題;分析該小區(qū)相關(guān)的切換指標(biāo)(分析小區(qū)的切入成功率和切出成功率),確認(rèn)是否由于切換失敗導(dǎo)致的掉話;通過(guò)分析小區(qū)總帶寬接收功率相關(guān)指標(biāo),分析在掉話率高的時(shí)段,是否相應(yīng)的上行干擾指標(biāo)也很高,進(jìn)一步確認(rèn)是否上行干擾導(dǎo)致的掉話問(wèn)題。

(5)通過(guò)路測(cè)重現(xiàn)問(wèn)題。當(dāng)通過(guò)后臺(tái)網(wǎng)管數(shù)據(jù)分析無(wú)法進(jìn)一步解決掉話問(wèn)題的時(shí)候,需要針對(duì)小區(qū)進(jìn)行路測(cè),跟蹤手機(jī)側(cè)和RNC的信令流程進(jìn)行分析。

切換成功率優(yōu)化

影響切換成功率主要有以下幾個(gè)因素:切換區(qū)過(guò)小,切換參數(shù)設(shè)置不當(dāng),鄰區(qū)漏配。

(1)切換區(qū)過(guò)小。切換區(qū)過(guò)小會(huì)使UE沒(méi)有足夠的時(shí)間完成切換;

(2)切換參數(shù)設(shè)置不當(dāng)。會(huì)導(dǎo)致鄰區(qū)增加/刪除不及時(shí),或乒乓切換;

(3)鄰區(qū)漏配。這種情況是最常見(jiàn)的導(dǎo)致切換失敗的原因,而且對(duì)網(wǎng)絡(luò)性能影響較大。漏配的鄰區(qū)不但會(huì)直接造成掉話,還會(huì)給網(wǎng)絡(luò)帶來(lái)額外干擾,降低網(wǎng)絡(luò)容量。

其他指標(biāo)

下面的這些指標(biāo)不是優(yōu)化最關(guān)心的,但有時(shí)也需要結(jié)合它們對(duì)具體問(wèn)題進(jìn)行分析。尤其是當(dāng)網(wǎng)絡(luò)用戶數(shù)達(dá)到一定程度后,會(huì)更經(jīng)常用到這些指標(biāo)的統(tǒng)計(jì)。

(1)話務(wù)量與掉話率

單純從掉話率統(tǒng)計(jì)的絕對(duì)值無(wú)法準(zhǔn)確判斷小區(qū)是否存在問(wèn)題,必須結(jié)合小區(qū)話務(wù)量指標(biāo)。只有小區(qū)話務(wù)量(呼叫次數(shù))足夠多時(shí)統(tǒng)計(jì)結(jié)果才有參考價(jià)值。

(2)RTWP

基站空載時(shí),RTWP(Received Total Wideband Power,寬帶接收總功率)均值在-106~-104dBm之間屬正常;按照50%負(fù)載對(duì)應(yīng)3dB噪聲抬升,可知RTWP小于-100dBm基本屬于正常范圍。分析這個(gè)指標(biāo)需要結(jié)合話務(wù)量。若在話務(wù)量正常的情況下出現(xiàn)RTWP異常抬升,則有可能是存在較嚴(yán)重的外部干擾,這是提示干擾存在的重要手段之一。

(3)碼資源利用率

碼資源利用率太高或太低都不好,現(xiàn)實(shí)中常見(jiàn)的是邊緣站點(diǎn)的碼資源利用率較低,而密集社區(qū)、寫(xiě)字樓、商業(yè)區(qū)等地域的站點(diǎn)碼資源利用率很高,需要保持關(guān)注,防止因碼資源受限發(fā)生的網(wǎng)絡(luò)問(wèn)題。

地理化分析方法

隨著Google Earth等現(xiàn)代GIS工具的廣泛普及,越來(lái)越多的優(yōu)化工具從中受益,使得優(yōu)化過(guò)程中能盡最大可能地利用地理化信息,輔助優(yōu)化方案的制訂。在KPI優(yōu)化的過(guò)程中,常見(jiàn)的地理化分析方法包括:

(1)利用各小區(qū)的關(guān)鍵KPI值對(duì)小區(qū)顏色進(jìn)行渲染,直觀表達(dá)全網(wǎng)的KPI分布情況。統(tǒng)計(jì)指標(biāo)的圖形化顯示對(duì)大規(guī)模網(wǎng)絡(luò)優(yōu)化分析的好處顯而易見(jiàn),圖形化的分析結(jié)果直觀、清晰,且能夠表示出站點(diǎn)的相對(duì)位置,可以從宏觀層面來(lái)分析問(wèn)題,便于分層次實(shí)施優(yōu)化。如圖3所示是某網(wǎng)絡(luò)中各小區(qū)的掉話率分布情況,不同顏色代表不同的掉話率等級(jí)。

圖3 小區(qū)掉話率分布圖

(2)對(duì)TopN問(wèn)題小區(qū)的地理化關(guān)聯(lián)分析,就是將有問(wèn)題的小區(qū)重點(diǎn)集中呈現(xiàn),以便發(fā)現(xiàn)地理上的共性。這樣不但有助于整理優(yōu)化思路,也有助于對(duì)一些隱藏問(wèn)題的判斷,如潛在干擾的發(fā)現(xiàn)、傳輸問(wèn)題的發(fā)現(xiàn)等。圖4是一個(gè)典型案例。黃色區(qū)域中包含的是12個(gè)掉話率最高的站點(diǎn),紅色區(qū)域中的3個(gè)站點(diǎn)則是掉話率在前三位的,這表明這些站點(diǎn)在拓?fù)浣Y(jié)構(gòu)上的很強(qiáng)的關(guān)聯(lián)性。后經(jīng)查實(shí),這些站點(diǎn)是通過(guò)共同的傳輸接口板接入RNC的,接口板的安插不良導(dǎo)致了掉話率的突然提高,重新連接問(wèn)題即告解決。

圖4 小區(qū)KPI的地理共性分析

小結(jié)

WCDMA網(wǎng)絡(luò)的優(yōu)化是一個(gè)復(fù)雜的過(guò)程,需要從大量數(shù)據(jù)中進(jìn)行問(wèn)題的分類、定位、分析和處理。中興通訊在全球成功部署大量WCDMA網(wǎng)絡(luò)的基礎(chǔ)上,形成了完善的KPI優(yōu)化流程和方法。很多網(wǎng)規(guī)網(wǎng)優(yōu)專家經(jīng)驗(yàn)已固化到中興通訊網(wǎng)規(guī)網(wǎng)優(yōu)工具套件中,如ZXPOS CNT/CNA/CNO等,其中不少算法已經(jīng)申請(qǐng)相關(guān)專利。中興通訊將不斷積累經(jīng)驗(yàn),來(lái)提高網(wǎng)絡(luò)的質(zhì)量及用戶的滿意程度,為全球運(yùn)營(yíng)商打造WCDMA精品網(wǎng)絡(luò)。

作者:GU網(wǎng)規(guī)網(wǎng)優(yōu)部 尹建華   來(lái)源:C114中國(guó)通信網(wǎng)
微信掃描分享本文到朋友圈
掃碼關(guān)注5G通信官方公眾號(hào),免費(fèi)領(lǐng)取以下5G精品資料
  • 1、回復(fù)“YD5GAI”免費(fèi)領(lǐng)取《中國(guó)移動(dòng):5G網(wǎng)絡(luò)AI應(yīng)用典型場(chǎng)景技術(shù)解決方案白皮書(shū)
  • 2、回復(fù)“5G6G”免費(fèi)領(lǐng)取《5G_6G毫米波測(cè)試技術(shù)白皮書(shū)-2022_03-21
  • 3、回復(fù)“YD6G”免費(fèi)領(lǐng)取《中國(guó)移動(dòng):6G至簡(jiǎn)無(wú)線接入網(wǎng)白皮書(shū)
  • 4、回復(fù)“LTBPS”免費(fèi)領(lǐng)取《《中國(guó)聯(lián)通5G終端白皮書(shū)》
  • 5、回復(fù)“ZGDX”免費(fèi)領(lǐng)取《中國(guó)電信5GNTN技術(shù)白皮書(shū)
  • 6、回復(fù)“TXSB”免費(fèi)領(lǐng)取《通信設(shè)備安裝工程施工工藝圖解
  • 7、回復(fù)“YDSL”免費(fèi)領(lǐng)取《中國(guó)移動(dòng)算力并網(wǎng)白皮書(shū)
  • 8、回復(fù)“5GX3”免費(fèi)領(lǐng)取《R1623501-g605G的系統(tǒng)架構(gòu)1
  • 本周熱點(diǎn)本月熱點(diǎn)

     

      最熱通信招聘

      最新招聘信息