近10年來,中國移動的用戶數(shù)呈爆炸式增長,其BOSS和經(jīng)分系統(tǒng)的數(shù)據(jù)積累已達天文數(shù)字,其后臺系統(tǒng)之復(fù)雜和巨大也毫無懸念地堪稱世界之最。那么,除了計費以外,這些豐富的數(shù)據(jù)資源給我們帶來了哪些財富?管理這些數(shù)據(jù)的成本又占據(jù)了多少運營成本?更重要的是,在競爭環(huán)境發(fā)生變化、電信市場的競爭進入以數(shù)字業(yè)務(wù)或全業(yè)務(wù)為主要產(chǎn)品的長尾市場競爭時,中國移動這幾年建立起來的超級龐大而復(fù)雜的支撐系統(tǒng)會成為競爭的核心能力還是包袱?這些問題都應(yīng)該是一個進入成年期的企業(yè)所要考慮的重要內(nèi)容。因為在信息爆炸時代,能給企業(yè)帶來價值的數(shù)據(jù)是寶藏,反之就是垃圾。
計費系統(tǒng)的數(shù)據(jù)
計費系統(tǒng)從早期的小型計費軟件逐漸發(fā)展到目前成為電信行業(yè)最重要的IT系統(tǒng),每天承擔(dān)著巨大的交易量。其發(fā)展動力來自兩個方面:一是高速用戶數(shù)增長帶來系統(tǒng)處理能力和速度的快速擴容,從普通速度硬盤,到高速內(nèi)存數(shù)據(jù)庫,可謂對所有市場上的技術(shù)無所不用,被稱之為“用空間換時間”;二是省級公司與各地市本地需求間的矛盾,集團公司統(tǒng)一營銷策劃案與各分公司市場部具體地方銷售策略之間的矛盾導(dǎo)致計費系統(tǒng)高密度的系統(tǒng)變更,很多省公司計費中心對一星期經(jīng)歷10次以上的上線習(xí)以為常,并稱之為“用時間換空間(市場空間)”。
系統(tǒng)如此高速擴充,使我們無法顧及整體數(shù)據(jù)架構(gòu)和整體應(yīng)用架構(gòu)的規(guī)劃和設(shè)計,也沒有時間從業(yè)務(wù)的視角分析計費支撐系統(tǒng)生命之源的業(yè)務(wù)流程。我們曾經(jīng)分析,如果一個用戶訂購了所有的套餐(這是不可能的),那么他一年的計費記錄信息也不應(yīng)超過150kB數(shù)據(jù),對于一個擁有1000萬用戶的運營商來說,10TB的計費數(shù)據(jù)已經(jīng)是不小的規(guī)模,可實際上目前一般我們都會有50TB以上的數(shù)據(jù),甚至100TB。可以想象,數(shù)據(jù)的冗余、存儲的冗余使垃圾數(shù)據(jù)已經(jīng)達到了難以控制的局面,凡是有數(shù)據(jù)處理經(jīng)驗的人都知道,管理這個規(guī)模的數(shù)據(jù)有多么艱難。
經(jīng)分系統(tǒng)的數(shù)據(jù)
經(jīng)分系統(tǒng)一般有4個主要功能:建模分析,尋找聚合數(shù)據(jù)群并判斷市場切分;統(tǒng)計分析,預(yù)測結(jié)果并回歸建模;出統(tǒng)計報表;出KPI指標情況。由于各種原因,中國電信市場的不充分競爭導(dǎo)致經(jīng)分系統(tǒng)的前兩個功能基本沒有派上用場,大部分經(jīng)分系統(tǒng)還是用后兩個功能。但經(jīng)分系統(tǒng)的建設(shè)參考了國外的數(shù)據(jù)結(jié)構(gòu)建設(shè),導(dǎo)致其數(shù)據(jù)架構(gòu)不夠高效,加上作為數(shù)據(jù)源的計費系統(tǒng)混亂的數(shù)據(jù)架構(gòu)狀況,使這方面的問題更加突出。一般意義的數(shù)據(jù)倉庫工具都是為建模分析設(shè)計的。每年企業(yè)都要拿出大量的資金來擴容經(jīng)分系統(tǒng),因為不擴容就無法滿足客戶增長的需要,而反思其對收入的貢獻則實在是無法平衡,導(dǎo)致各省公司在做此類IT投資時苦不堪言。更關(guān)鍵的問題是,如果競爭真的進入白熱化,中國移動的競爭利器可能就是經(jīng)分系統(tǒng),但長期以來的經(jīng)分報表化操作可能會使經(jīng)分系統(tǒng)的數(shù)據(jù)體系難以支持高頻度建模。
分析以上兩個方面的原因,我們可以看到這樣幾個方面的問題。
首先是每到月初和月末的兩周,計費和經(jīng)分系統(tǒng)都會承受出報表的巨大壓力,這往往成為每年擴容的惟一依據(jù);第二就是數(shù)據(jù)似乎永遠也無法保證全部正確,即數(shù)據(jù)的惟一性問題,于是系統(tǒng)就不斷重建新數(shù)據(jù)集,包括內(nèi)存駐留、臨時駐留、短暫駐留等等花樣繁出,導(dǎo)致運營商很難看清整體數(shù)據(jù)體系;第三是計費出報表時與計費功能及詳單查詢搶資源,經(jīng)分系統(tǒng)出報表和地市數(shù)據(jù)查詢或其他應(yīng)用搶資源,經(jīng)分系統(tǒng)上除了報表KPI以外,功能已經(jīng)很少,即便如此,經(jīng)分系統(tǒng)仍舊面臨永遠的資源短缺。
數(shù)據(jù)體系改進建議
根據(jù)上述計費系統(tǒng)和經(jīng)分系統(tǒng)的數(shù)據(jù)情況,筆者對運營商數(shù)據(jù)體系的改進提出以下4點建議。
1.以業(yè)務(wù)流程為驅(qū)動力,首先分析語音業(yè)務(wù)、數(shù)據(jù)業(yè)務(wù)、固數(shù)業(yè)務(wù)的特點,把實現(xiàn)靈活快速的業(yè)務(wù)組合作為數(shù)據(jù)架構(gòu)調(diào)整或優(yōu)化的最高目標,同時最大限度地保留原有數(shù)據(jù)體系而進行新的數(shù)據(jù)架構(gòu)設(shè)計。
2.分別建立交易型(transactionaldatasystem)、分析型(analyticaldata system)和操作型(Operational data system)數(shù)據(jù)集。但這個過程不可一蹴而就,要持之以恒,并由縱觀企業(yè)IT全局戰(zhàn)略的部門來負責(zé)。3個數(shù)據(jù)系統(tǒng)成型后才可逐漸根據(jù)業(yè)務(wù)的需要和不同數(shù)據(jù)的歷史價值進行數(shù)據(jù)生命周期的定義。
3.參照SID形成對企業(yè)數(shù)據(jù)體系的全面掌控,包括建立數(shù)據(jù)字典、數(shù)據(jù)域間流程的描述、數(shù)據(jù)變更展示等。根據(jù)以往經(jīng)驗,這部分工作有相當大的難度,最主要的難度來自現(xiàn)有的計費系統(tǒng)。以上敘述的原因,導(dǎo)致幾乎1/2的數(shù)據(jù)由中間數(shù)據(jù)表構(gòu)成,這部分數(shù)據(jù)很難根據(jù)SID的模型做映射,也沒有固定的數(shù)據(jù)架構(gòu)和數(shù)據(jù)屬性,從而成了數(shù)據(jù)黑洞。對這類問題,運營商需要伴隨ODS(操作型數(shù)據(jù)系統(tǒng))的建立而逐步進行改進。
4.與企業(yè)業(yè)務(wù)流程、系統(tǒng)流程、變更流程同步建立數(shù)據(jù)變更流程管控平臺,形成對數(shù)據(jù)全生命周期的監(jiān)控,完全改變現(xiàn)有管控。當我們無法改變現(xiàn)有在線系統(tǒng)時,就需要對它進行監(jiān)控,并建立完善的變更流程,抑制錯誤的做法。因此要建立一整套相對完善的數(shù)據(jù)監(jiān)控系統(tǒng),為決策層提供數(shù)據(jù)生命周期管理、數(shù)據(jù)變更管理、數(shù)據(jù)介質(zhì)使用、數(shù)據(jù)使用權(quán)限管理等方面最直接的依據(jù)。
總之,數(shù)據(jù)、應(yīng)用和業(yè)務(wù)流程是電信企業(yè)IT建設(shè)的3個重大領(lǐng)域,在沒有統(tǒng)一IT組織架構(gòu)的現(xiàn)實情況下,我們從事支撐系統(tǒng)開發(fā)和運維的同時,必須實事求是,不能完全推翻過去的IT系統(tǒng),只能將其改進。從業(yè)務(wù)流程分析出發(fā),自上而下地提出對數(shù)據(jù)系統(tǒng)的改進措施是比較現(xiàn)實的做法,特別是參考TMF的SID模型進一步形成企業(yè)數(shù)據(jù)架構(gòu)。我們要依據(jù)全業(yè)務(wù)經(jīng)驗的業(yè)務(wù)模型著手設(shè)計企業(yè)交易型數(shù)據(jù)系統(tǒng)、分析型數(shù)據(jù)系統(tǒng)和操作型數(shù)據(jù)系統(tǒng),循序漸進地實施,并在企業(yè)數(shù)據(jù)模型設(shè)計的過程中考慮數(shù)據(jù)的生命周期定義。
作者:山西移動IT規(guī)劃建設(shè)中心 陳鋼 來源:通信世界周刊