無線網絡中的數據倉庫技術研究(李方偉、李樂民、李忻)
摘要:本文主要介紹數據倉庫技術是解決無線網絡中的使用報告的性能及靈活性問題的一
種新方法,這種技術從無線網絡收集話務數據,并提供使用報告和使用預測。
關鍵詞 數據倉庫技術 使用報告 使用預測
1引言
蜂窩移動通信網的快速增長和新業(yè)務的不斷增加,給運營者帶來了更多獲取經濟效益
的機遇。為了贏得更多的市場份額,運營者有必要全面了解無線網絡技術和用戶使用情況,
以及自己對市場和系統(tǒng)規(guī)劃的期望。對網絡性能分析和網絡規(guī)劃而言,需要得到用戶的使
用模式以及對提供服務質量作出正確決策的準確報告,這些報告必須及時反映蜂窩網絡業(yè)
務中的市場競爭的變化。為建立一個能夠完成上述要求的系統(tǒng),可采用數據倉庫技術。數
據倉庫能有向地、穩(wěn)定地收集數據,以支持管理決策。數據倉庫中的數據可以多種方式進
行有效地分割與組合,以便查詢、分析和顯示信息。
本文介紹的數據倉庫系統(tǒng)能從網絡上收集業(yè)務,并通過一個用戶友好的網絡界面,以
可操作的方式智能地呈現給終端用戶。為一個子網或整個網絡上的單個用戶或一組用戶生
成不同的使用報告,可實現三個指示將來使用趨勢的不同預測模型。這些報告和預測可作
為網絡容量規(guī)劃、資源分配、用戶使用檢測以及用戶呼叫方案選擇。該系統(tǒng)是解決大量的
快速變化的數據生成使用報告的靈活性和性能問題的一個新解決方法。該系統(tǒng)在作為網絡
應用的決策支持平臺方面具有重要的潛力。
網絡規(guī)劃和用戶市場組建中的優(yōu)越性是在蜂窩業(yè)務中贏得市場份額的關鍵因素。無線
網絡必須適應用戶使用模式的變動,這樣的網絡能為用戶提供更多的靈活性和更高的服務
質量,這就是吸引新用戶的最好方法。達到這些目標的首要條件是詳細地分析系統(tǒng)和用戶
使用情況,這也是蜂窩系統(tǒng)分析或市場規(guī)劃所要做的,需要得到使用報告,以對蜂窩系統(tǒng)
規(guī)劃、市場及銷售預測采取必要的措施。
然而,由于呼叫數據十分龐大、系統(tǒng)結構不斷演變以及用戶組的變動,使用分析報告
往往不易生成。蜂窩網絡是由許多無線站組成的,每個站覆蓋的服務區(qū)叫做小區(qū)。蜂窩電
話通過一個無線信道與基站通信,每個小區(qū)只分配有限的信道數。當蜂窩電話從一個基站
移動到另一個基站時,就要切換。如果小區(qū)沒有了可用的信道,新呼叫或切換呼叫就被阻
塞了。移動交換中心(MSC)每天要處理大約上百萬個呼叫。因此,當報告需要收索上百
萬條記錄時,生成報告的處理速度就相當成問題了。這就促使我們使用數據倉庫技術而不
是標準數據庫。
2數據倉庫系統(tǒng)的組成及其實現方案
數據倉庫系統(tǒng)由數據處理器、數據倉庫和網絡報表服務器三個主要部分組成。數據處
理器從MSC接收自動信息統(tǒng)計(AMA)記錄并完成解壓、傳輸和裝載。AMA數據包括:電話
號碼、日期、小區(qū)、切換等。這些集中起來的數據被裝載到已填充的主真值表的數據庫里。
網絡報表服務器查詢數據倉庫,然后把使用報告發(fā)給瀏覽器。為了防止數據倉庫過載,應
把數據倉庫從網絡報表服務器中分隔出來。另外,由于這使得不同應用可用不同方法查詢
相同數據庫,故這種結構很容易升級,以適應多種網絡報表服務器。
數據倉庫系統(tǒng)可以采用標準的星型結構來實現。它包括一個主真值表(“使用方法”
表)和幾個元素表!笆褂梅椒ā北砟苋菁{不同時刻收集的使用情況。
數據處理器主要處理數據解壓、傳輸和裝載。解壓的過程首先是把原始的二進制數據
解為可讀的文本數據。這個過程的輸出只是一些個人呼叫記錄,諸如,電話號碼、起始呼
叫時間、終止呼叫時間翩始小區(qū)和信道、終結小區(qū)和信道前無切換、呼入和呼出、被叫號
碼、呼叫持續(xù)時間以及其它信息。每個MSC每天輸出數據大小在50-150MB之間。
裝載過程首先檢查可能在先前處理過程中已出現的潛在錯誤。結合當前關鍵字的檢查,
就可確保關鍵字的每個值是唯一的。如發(fā)現新的小區(qū),那么就更新該小區(qū)的元素表,然后
把已排列的數據裝入數據倉庫。同時,裝載過程從“使用方法”表或直接從呼叫記錄計算
特定應用收集表,并把它們裝入數據倉庫。
數據倉庫的清除和保存是通過使用“使用方法”表來完成的。每天都進行數據裝入,
而按周清除數據倉庫數據。最早期的數據在每周末保存,由于需清除數據的量很大,按區(qū)
域把“使用方法”表分割開,使得每個分割保持一周的數據。
3使用報告與分析
數據倉庫系統(tǒng)中,設計用戶界面的的基本原理是:要求必須具有友好的用戶界面,一
致的外觀,在整個系統(tǒng)中以同樣的方式操作,以減少終端用戶的學習時間。界面設計的主
要目標之一是為終端用戶提供一個靈活的方法,使其能訪問所有期望訪問的數據,但又必
須使界面盡可能簡單。
使用報告可分為以下三類:
(1)個人使用:計算單用戶的使用模式。
(2)群和區(qū)域使用:計算在網絡的子集上動態(tài)定義的用戶群的使用模式。
(3)系統(tǒng)使用:計算整個系統(tǒng)的業(yè)務模式。
3.1個人使用報告
數據倉庫系統(tǒng)根據結出的用戶號和時間段,生成顯示呼叫的平均持續(xù)時間,收集時段
內使用時間以及以小時計算和以天計算的呼叫號碼的報告,并且這些報告都是用圖表表示
的。數據倉庫系統(tǒng)可用這種呼叫功能來表示一個減少用戶每月費用的呼叫方案。
數據倉庫系統(tǒng)也能生成按特定時間收集的呼叫小區(qū)用戶的使用報告,這些報告可顯示
用戶的蹤跡或位置。更重要的是,它為確定該用戶在不同的時間段是否忙閑提供了一個線
索。數據倉庫系統(tǒng)可用這些信息來引進一個有效利用增進資源的呼叫方案。
另外,數據倉庫系統(tǒng)也能找到呼叫的平均持續(xù)時間、時段內的使用時間或者在時段內
的失敗呼叫的號碼。這些呼叫可分為長途呼叫和局域呼叫,這類報告提供了可用于市場規(guī)
劃的“家區(qū)”信息。
3.2群與區(qū)域使用報告
為了生成群和區(qū)域使用報告,用戶必須選擇使用預定義的群和區(qū)域。對群使用報告,
數據倉庫系統(tǒng)可以:(1)以使用分鐘數形式顯示由選定組生成的每個小區(qū)/微區(qū)的最忙時
業(yè)務量,也顯示最忙小時和摘要信息;(2)顯示每個群的呼叫號碼,使用分鐘數,呼出
分鐘數,呼入分鐘數,計時分鐘數以及非計時分鐘數。也就是說,群的使用報告顯示群在
分配小區(qū)內的使用或在時段內使用分鐘數的使用類型。群的使用用戶有:預付費用戶和高
使用率用戶。
區(qū)域使用報告可顯示在選定時段內每個區(qū)域的使用分鐘數總和。區(qū)域使用報告允許分
析任何指定區(qū)的業(yè)務量。數據倉庫系統(tǒng)也提供群與區(qū)域的合成使用報告,以便研究由選定
區(qū)域的指定群產生的系統(tǒng)業(yè)務量。例如,我們可以研究在指定區(qū)域的局域用戶與漫游用戶
間的系統(tǒng)資源沖突。
3.3系統(tǒng)使用報告
系統(tǒng)使用報告可顯示整個系統(tǒng)的全部示意圖表,包括總計使用報告——顯示每小區(qū)/
微區(qū)合計使用;長話使用報告——顯示每個中繼群的呼出與呼入使用分鐘數;前綴使用報
告——計算用戶定義的每個前綴的使用(例如,具有800號的話務量就可通過定義一個800
前綴而輕易得到,在極端情況,前綴可以是電話號碼本身。);系統(tǒng)峰值使用報告——顯
示系統(tǒng)范圍的最忙時間和話務量,這提供了對網絡資源的上界要求。
4使用預測與方案選擇
數據倉庫系統(tǒng)除了提供不同級的使用報告外,它還可通過基于過去的使用情況來預測
以后的使用,這有助于網絡規(guī)劃;谟脩艉艚心J胶途W絡資源,它弓隊最佳的呼叫方案,
這也有助于網絡的優(yōu)化。
4.1使用預測
數據倉庫系統(tǒng)提供了兩類使用預測報告,即“總話務量預測報告’與“群話務量預測
報告”。二者的區(qū)別是,后者預測指定群的使用。若結定一個小區(qū),預測報告就會生成當
前時間段已存在的話務量與下一時間段的預測話務量的圖表。用戶以天數定義一個時間段,
可使用時間段內的峰值話務量或者平均話務量模型。另外,終端用戶可選擇一種預測方法:
線形回歸法(指數平均或者移動平均)。當預測到小區(qū)的話務量在增長時,則需采取措施
擴大容量,如增加新的通信信道以滿足需要。
4.2方案選擇
利用個人使用報告提供的數據和業(yè)務量預測方案,可為蜂窩用戶設計一個呼叫方案選
擇應用算法。若結出用戶電話號碼和時間段,這種應用算法基于用戶在時間段內的預計速
率和使用模式,可在不同成本方案中選擇最低成本的方案。
另外,可用兩種方法進一步擴充該應用算法。首先,用戶呼叫方案的選擇可基于過去
使用模式或者預測的使用模式(用線形回歸方法),各方案的成本預測時段可為一周或一
月,擴充用戶使用特征來計算具有最低成本的呼叫方案,如果用戶的使用有某種趨勢(如
上升或下降),那么這種擴充可選擇一個不同于過去使用的方案。
第二個擴充是提高選擇的性能。最低成本方案選擇方法對用戶不一定總是最好的,每
個小區(qū)的信道數是有限的,如果在同一時刻太多的用戶使用同一信道,那么很多呼叫就可
能被阻塞,從而會引起用戶不滿。故一個好的推薦方案應該是符合可用資源的最低成本呼
叫方案,改進的選擇性能考慮到了每個小區(qū)的使用特征和阻塞概率。使用該改進的選擇性
能,每種方案的總體成本是用作為金融成本與對給定方案在相關時間段的阻塞率的線形函
數來計算的,這樣就可選出最低成本方案了。
5結論
本文描述了基于網絡的數據倉庫系統(tǒng),通過使用數據倉庫技術,有效地滿足了網絡的
性能和靈活性的要求?商峁┎煌愋偷氖褂脠蟾妫鼈兛捎糜诨緢蟾嫔、動態(tài)建模、
用戶文檔生成和使用預測。作為數據庫的另一個應用,通過一個二維的生滅過程可以確定
蜂窩網絡的阻塞概率,基于方案成本和網絡資源的可用性,可設計用于用戶呼叫方案選擇
的應用程序。數據倉庫技術可應用于需要分析大量的報警數據的網絡操作中。也可以把數
據倉庫技術應用到網絡性能管理中去。
摘自《電信科學》