摘要 介紹了移動智能網(wǎng)以及建設容災系統(tǒng)的必要性,并指出了移動智能網(wǎng)容災的實現(xiàn)過程與方案,舉例說明了各種備份方案的優(yōu)缺點。
一、引言
智能網(wǎng)(Intelligent Network)是在傳統(tǒng)的通信網(wǎng)絡基礎上,為迅速快捷地提供新業(yè)務而設置的一種附加網(wǎng)絡結(jié)構(gòu)。智能網(wǎng)可分為固定智能網(wǎng)和移動智能網(wǎng)。無論是固定智能網(wǎng)還是移動智能網(wǎng),它們都將網(wǎng)絡的交換功能和業(yè)務的控制功能相分離。通過集中的業(yè)務控制、業(yè)務數(shù)據(jù)、業(yè)務管理和業(yè)務生成體系,快速、方便、靈活、經(jīng)濟、有效地生成和實現(xiàn)各種新業(yè)務。另外,采用模塊化的功能實體之間的標準、開放的協(xié)議接口,實現(xiàn)了不同廠家設備之間的互通。
如圖1所示,移動智能網(wǎng)是一個能夠靈活方便地生成新業(yè)務的體系結(jié)構(gòu)。這個體系結(jié)構(gòu)是依靠現(xiàn)有移動網(wǎng)絡中引入智能網(wǎng)設備來實現(xiàn)的。這些設備主要有業(yè)務交換點(SSP)、業(yè)務控制點(SCP)、業(yè)務數(shù)據(jù)點(SDP)/充值中心(VC)、智能外設(IP)、業(yè)務管理點(SMP)、業(yè)務管理接入點(SMAP)及業(yè)務生成環(huán)境點(SCEP)。
圖1 移動智能網(wǎng)體系構(gòu)架
對移動運營商而言,移動智能網(wǎng)各種設備的宕機,意味著數(shù)十萬甚至上百萬元的經(jīng)濟損失,同時產(chǎn)生的是移動用戶對移動運營商的不信任,對移動網(wǎng)絡可靠性的懷疑,可能導致大量用戶的轉(zhuǎn)網(wǎng)和投訴。這些直接的或間接的損失是十分巨大的。并且隨著移動用戶的快速增長,越來越多的移動運營商開始考慮進一步增加智能網(wǎng)的可靠性。其中最直接的辦法是對智能網(wǎng)設備進行容災備份,保證在主機出現(xiàn)故障的情況下,容災系統(tǒng)能及時為網(wǎng)絡用戶提供服務,使損失降至最低。
二、移動智能網(wǎng)容災備份系統(tǒng)簡介
從前面介紹可以看出,移動智能網(wǎng)是由各種各樣的智能設備組成的,要對智能網(wǎng)進行容災備份就是要對智能網(wǎng)中的各種智能設備進行容災備份。在移動智能網(wǎng)的各種智能設備中,SCP、SMP與VC無疑是最重要的智能設備。所以,我們考慮移動智能網(wǎng)的容災備份主要就是指這3種智能設備的容災備份。
先來看SCP的容災,對SCP的容災,通常有兩個層次上的理解:一是應用級容災,即SCP節(jié)點服務的容災。當某個SCP節(jié)點發(fā)生災害,其原來所提供的服務將不間斷地、平滑地、實時地遷移到其容災節(jié)點上,而業(yè)務用戶本身不會察覺。另一種是數(shù)據(jù)級容災,即對SCP節(jié)點關鍵數(shù)據(jù)的容災。通過增加相應的容災設備,將主節(jié)點上的數(shù)據(jù)在備份節(jié)點上備份保存。當主節(jié)點被破壞時,數(shù)據(jù)在備份節(jié)點上仍然有完整的保存;當主節(jié)點設備恢復后,系統(tǒng)可利用備份的數(shù)據(jù)進行數(shù)據(jù)恢復并提供業(yè)務。由于SMP、VC系統(tǒng)結(jié)構(gòu)和SCP系統(tǒng)結(jié)構(gòu)類似,所以,容災實現(xiàn)思路也類似。
三、移動智能網(wǎng)容災備份實現(xiàn)方式
1.數(shù)據(jù)級容災實現(xiàn)方式
數(shù)據(jù)級容災實際上是基于數(shù)據(jù)庫的一種靜態(tài)數(shù)據(jù)備份,其核心是建立1個數(shù)據(jù)庫備份中心,對全網(wǎng)主設備SCP的數(shù)據(jù)庫數(shù)據(jù)進行備份。當主設備SCP故障恢復后,可通過數(shù)據(jù)備份中心的備份數(shù)據(jù)對主設備SCP進行數(shù)據(jù)恢復,該方式不能進行業(yè)務邏輯的容災。數(shù)據(jù)級容災是在數(shù)據(jù)庫層面的解決方案,可實現(xiàn)數(shù)據(jù)庫的海量或增量復制備份及恢復。
2.業(yè)務級容災實現(xiàn)方式
業(yè)務級容災是對業(yè)務邏輯進行容災。在主設備發(fā)生災難時,由容災中心接管主設備業(yè)務,保障業(yè)務的連續(xù)性和安全性,降低業(yè)務中斷帶來的風險。業(yè)務級容災可由1+1和N+1兩種方式來實現(xiàn)。
3.應用級容災備份的實現(xiàn)
主節(jié)點發(fā)生故障后,備份節(jié)點能夠接替主節(jié)點,為用戶提供服務。下面對SCP、VC與SMP的應用級容災備份逐一進行介紹。
(1)SCP的應用級容災備份眾所周知,智能網(wǎng)業(yè)務的實現(xiàn)主要是由SCP與SSP之間的消息交互完成的。而在中國移動的網(wǎng)絡中,SCP與SSP之間一般通過HSTP進行信令轉(zhuǎn)接。在正常情況下,HSTP會將MSC/SSP發(fā)送的消息轉(zhuǎn)發(fā)給主節(jié)點(SCP)。圖2示出SCP的應用級容災備份。
圖2 SCP的應用級容災備份
如圖3所示,主節(jié)點產(chǎn)生故障后,手工啟用備份系統(tǒng),通知HSTP進行修改,使原來發(fā)給主節(jié)點的消息能夠轉(zhuǎn)發(fā)給備份節(jié)點。HSTP在進行GT翻譯時,直接翻譯成備份節(jié)點的信令點編碼。
圖3 啟用備份系統(tǒng)
對于容災系統(tǒng)備份節(jié)點的啟用,建議采用手工方式進行,其原因是:如果采用自動倒換方式,那么,就存在由于信令鏈路故障或其他可以及時恢復的故障而啟動容災系統(tǒng)倒換的情況。這樣反而容易造成系統(tǒng)誤判,對網(wǎng)絡安全產(chǎn)生一定影響。
(2)VC的應用級備份 預付費用戶的充值是通過SCP與VC之間的消息交互完成的,例如用戶撥打13800138000電話進行充值時,如圖4所示,首先觸發(fā)到用戶歸屬的SCP,然后,SCP根據(jù)用戶輸入充值卡的密碼,選擇相應的VC進行充值卡的鑒權(quán)。
圖4 VC的應用級備份
如圖5所示,主節(jié)點發(fā)生故障后,手工啟用備份系統(tǒng)。此時,HSTP會將SCP發(fā)給主VC的消息轉(zhuǎn)發(fā)給備份節(jié)點(與SCP容災時,HSTP的修改方式相同),從而實現(xiàn)主備用系統(tǒng)的倒換,由備份節(jié)點代替主VC完成對充值卡的鑒權(quán)。
圖5 啟用備份系統(tǒng)
(3)SMP的應用級備份 以備份節(jié)點來做SMP的應用級容災,主要是為接管由BOSS系統(tǒng)接收用戶開戶、銷戶、查詢等操作請求。SMP與BOSS系統(tǒng)的接口是由接口機來完成的,其間通過數(shù)據(jù)網(wǎng)相連。如圖6所示,SMP的接口機作為SERVER端,BOSS系統(tǒng)主動連接SMP的BOSS系統(tǒng)接口機。因此,主SMP出現(xiàn)故障后,需要通知BOSS系統(tǒng)修改配置文件(將需要連接的IP地址改為備份節(jié)點的BOSS接口機的IP地址),將發(fā)給原SMP的消息,轉(zhuǎn)發(fā)給備份節(jié)點,從而使備份節(jié)點能夠接替故障SMP工作。
圖6 SMP的應用級備份
四、西南某地移動局智能網(wǎng)容災備份方案
目前,西南某地移動局經(jīng)過前幾期的工程建設后,移動智能網(wǎng)的規(guī)模逐漸擴大,智能設備相當多。下面的方案將主要針對西南某地移動局的SCP、SMP,以及VC進行容災備份。
1.全網(wǎng)數(shù)據(jù)級容災備份
本方案只對西南某地移動局的4個SCP、2個SMP和1個VC進行數(shù)據(jù)級備份。在主城區(qū)或近郊分公司建立1個基于數(shù)據(jù)庫的數(shù)據(jù)級備份中心,采用集中備份的方式。
集中備份中心由備份服務器、磁帶庫和磁盤陣列組成。集中備份網(wǎng)絡采用LAN方式進行組網(wǎng),備份網(wǎng)絡獨立組網(wǎng),與應用網(wǎng)絡相對分離;智能網(wǎng)主設備可以通過100/1000M城域網(wǎng)或155M傳輸接入集中備份中心。在每個生產(chǎn)機房設一臺遠程維護終端,通過局域網(wǎng)對備份系統(tǒng)進行遠程監(jiān)控和管理。
2.全網(wǎng)業(yè)務級N+1容災備份
由于采用A廠的SCP1、SCP2與采用B廠的SCP3、SCP4上開展的智能業(yè)務不同,使用平臺不同,廠家也不同,因此,對4個SCP的業(yè)務級容災只能按不同廠家分別進行。本方案分別建立一個A廠設備容災中心和一個B廠設備容災中心。分別對A廠SCP1、SCP2、SMP1、VC設備和B廠SCP3、SCP4、SMP2設備進行異地業(yè)務級容災備份。
3.全網(wǎng)數(shù)據(jù)級和業(yè)務級N+1容災備份
本方案不僅建立一個數(shù)據(jù)備份中心對全網(wǎng)設備進行數(shù)據(jù)級備份,同時建立兩個容災中心,分別對A廠設備和B廠設備進行容災備份。
本方案是結(jié)合了方案一和方案二,同時考慮了重要節(jié)點和節(jié)點數(shù)據(jù)的安全,具有更高的安全性與可靠性。
4.各種方案優(yōu)缺點的分析
表1列出各中方案優(yōu)缺點比較。從表1可以看出,方案一只進行了數(shù)據(jù)級容災,智能網(wǎng)數(shù)據(jù)通過集中備份中心得到了備份。主設備發(fā)生故障后,智能業(yè)務將被中斷,主設備恢復后可從集中備份中心將數(shù)據(jù)進行恢復。該方案投資小,但容災的效果差,不具備業(yè)務邏輯容災功能。方案二對智能網(wǎng)A廠設備和B廠設備分別進行了業(yè)務級容災。在主設備出現(xiàn)故障時,容災備份節(jié)點能快速平滑地接管主設備的業(yè)務,將損失降到最低,但由于主設備和容災節(jié)點之間采用數(shù)據(jù)同步網(wǎng)絡傳輸數(shù)據(jù),數(shù)據(jù)的異地備份要通過人工實現(xiàn)。方案三不僅對智能網(wǎng)A廠設備和B廠設備分別進行了業(yè)務級容災,還對全網(wǎng)進行了數(shù)據(jù)級容災,保障了智能網(wǎng)節(jié)點和數(shù)據(jù)安全性,容災和備份兼顧,效果好。
表1 各種方案優(yōu)缺點比較
五、結(jié)束語
移動智能網(wǎng)是實現(xiàn)多種業(yè)務和網(wǎng)絡功能的一種有效手段。目前,我國移動智能網(wǎng)的發(fā)展相當迅速,隨之而來就是智能網(wǎng)的容災備份方案的選擇問題。本文介紹了移動智能網(wǎng)備份的一些基本過程,列舉了一個具體事例,分析了移動智能網(wǎng)各個備份容災方案的優(yōu)缺點。希望能對我國各個地市進行移動智能網(wǎng)備份容災時有點幫助。