容災(zāi)的重要性
隨著企業(yè)信息系統(tǒng)的普及和整個社會電子商務(wù)的發(fā)展,現(xiàn)代企業(yè)的運作日益依賴于信息技術(shù)。越來越多的關(guān)鍵數(shù)據(jù)被存儲在計算機(jī)系統(tǒng)中,這些數(shù)據(jù)的丟失和損壞將對企業(yè)造成難以估量的損失。同時企業(yè)對于數(shù)據(jù)可用性的要求也大為提高,因為即使是短時間的系統(tǒng)停機(jī)也將造成業(yè)務(wù)停頓和經(jīng)濟(jì)損失。
傳統(tǒng)的數(shù)據(jù)備份技術(shù)和服務(wù)器集群(Cluster)技術(shù)足以避免由于各種軟硬件故障、人為操作失誤和病毒侵襲所造成的破壞,保障數(shù)據(jù)安全;但當(dāng)面臨大范圍災(zāi)害性突發(fā)事件,如地震、火災(zāi)、恐怖襲擊時,上述技術(shù)就無能為力了。此時若想迅速恢復(fù)應(yīng)用系統(tǒng)的數(shù)據(jù),保持企業(yè)的正常運行,就必須建立異地的災(zāi)難備份系統(tǒng)——容災(zāi)系統(tǒng)(Disaster Recovery)。比如在美國“9. 11”事件中,駐扎其間的幾千家跨國企業(yè)集團(tuán)的電腦系統(tǒng)數(shù)據(jù)資料頃刻間化為烏有,很多公司多年積累的經(jīng)營數(shù)據(jù)毀于一旦,公司處于崩潰的邊緣;而一些建立了容災(zāi)系統(tǒng)的公司,卻在第二天就恢復(fù)了正常運轉(zhuǎn)。此次事件再次喚起了人們對數(shù)據(jù)安全性和容災(zāi)技術(shù)的重視。
一旦IT 系統(tǒng)和數(shù)據(jù)遭到災(zāi)難性打擊,企業(yè)將面臨破產(chǎn)的威脅,因此數(shù)據(jù)資料的完好保存是企業(yè)在災(zāi)難后能夠繼續(xù)生存的保證。雖然企業(yè)不能控制或防止災(zāi)難的發(fā)生, 但如果災(zāi)難發(fā)生時已做好了相應(yīng)的準(zhǔn)備,已將業(yè)務(wù)數(shù)據(jù)備份存儲在距離主要業(yè)務(wù)中心數(shù)里之外的遠(yuǎn)程備份中心,就可以保護(hù)重要數(shù)據(jù),就可以保持企業(yè)的持續(xù)運作,從而輕松面對各種災(zāi)難。
近年來我國移動通信的快速發(fā)展,業(yè)務(wù)量迅猛增長,新業(yè)務(wù)不斷出現(xiàn),由此對移動電話漫游計費清算系統(tǒng)提出了更高的要求。由于計費清算中心擔(dān)負(fù)著計費數(shù)據(jù)的采集、接收和處理工作,以及國際、國內(nèi)漫游計費功能等,因此對其運行可靠性要求很高。為了使我國的移動電話計費結(jié)算系統(tǒng)能夠適應(yīng)未來移動通信業(yè)務(wù)發(fā)展的需要,計費結(jié)算處理時間縮短,資金回收加快,提高移動通信的服務(wù)水平,就需要建立健全的數(shù)據(jù)管理策略, 避免各種災(zāi)難帶來的數(shù)據(jù)丟失和業(yè)務(wù)中斷。中國移動通信公司在對全國移動計費清算中心進(jìn)行了大規(guī)模容災(zāi)化改造,已經(jīng)獲得了良好的效果。以下對計費結(jié)算中心的容災(zāi)中心建設(shè)方案進(jìn)行簡要論述。
容災(zāi)技術(shù)的基本原理
傳統(tǒng)的數(shù)據(jù)系統(tǒng)的安全體系主要有數(shù)據(jù)備份系統(tǒng)和高可用(HA)系統(tǒng)兩個方面。備份系統(tǒng)提供應(yīng)用系統(tǒng)的數(shù)據(jù)后援,確保在任意情況下數(shù)據(jù)具有完整的恢復(fù)能力。高可用(HA)系統(tǒng)確保本地應(yīng)用系統(tǒng)在多機(jī)環(huán)境下具有抗御任何單點故障的能力,一旦系統(tǒng)發(fā)生局部的意外(如操作系統(tǒng)故障、掉電、網(wǎng)絡(luò)故障等) ,高可用系統(tǒng)可以在最短的時間迅速確保系統(tǒng)的應(yīng)用繼續(xù)運行(熱備份) 。它們屬于容錯系統(tǒng), 就是系統(tǒng)在運行過程中, 若其某個子系統(tǒng)或部件發(fā)生故障, 系統(tǒng)將能夠自動診斷出故障所在的位置和故障的性質(zhì), 并且自動啟動冗余或備份的子系統(tǒng)或部件, 保證系統(tǒng)繼續(xù)運行, 自動保存或恢復(fù)文件和數(shù)據(jù)。容錯的機(jī)制, 就是為系統(tǒng)提供關(guān)鍵子系統(tǒng)或部件的冗余或備份資源, 如電源、磁盤驅(qū)動器、中央處理器、控制器、存儲器以及網(wǎng)絡(luò)交換部件等。容錯和容災(zāi)共同之處都是為了保證系統(tǒng)的安全可靠; 其主要的區(qū)別是所針對的導(dǎo)致系統(tǒng)中斷的原因不同, 容錯是為了防止網(wǎng)絡(luò)內(nèi)部的某些子系統(tǒng)出現(xiàn)故障, 而容災(zāi)是為了防止由于自然災(zāi)害等導(dǎo)致的整個系統(tǒng)全部或大部分發(fā)生問題。
容災(zāi)技術(shù)則是通過在異地建立和維護(hù)一個備份系統(tǒng),利用地理上分散性來保證數(shù)據(jù)對于災(zāi)難性事件的抵御能力。容災(zāi)系統(tǒng)在實現(xiàn)中可分為兩個層次:數(shù)據(jù)容災(zāi)和應(yīng)用容災(zāi)。數(shù)據(jù)容災(zāi)指建立一個異地的數(shù)據(jù)系統(tǒng),作為本地關(guān)鍵應(yīng)用數(shù)據(jù)的一個備份。應(yīng)用容災(zāi)是在數(shù)據(jù)容災(zāi)的基礎(chǔ)上,在異地建立一套完整的與本地生產(chǎn)系統(tǒng)相當(dāng)?shù)膫浞輵?yīng)用系統(tǒng)(可以是互為備份),在災(zāi)難情況下,遠(yuǎn)程系統(tǒng)迅速接管業(yè)務(wù)運行,因此,應(yīng)用容災(zāi)是更高層次的容災(zāi)系統(tǒng)。
應(yīng)用級容災(zāi)的實現(xiàn)
本期容災(zāi)備份工程的總體建設(shè)目標(biāo)是:在盡量不影響原來系統(tǒng)業(yè)務(wù)功能的條件下,在北京中心和深圳中心之間,分別為國內(nèi)漫游業(yè)務(wù)系統(tǒng)和國際漫游業(yè)務(wù)系統(tǒng)建立容災(zāi)備份機(jī)制,以確保當(dāng)主系統(tǒng)發(fā)生意外災(zāi)難或有計劃的長時間停機(jī)的情況下,備系統(tǒng)能夠在短時間內(nèi)接替、延續(xù)主系統(tǒng)的生產(chǎn)任務(wù),并保證主系統(tǒng)以前的處理結(jié)果在備系統(tǒng)中能夠繼續(xù)使用,同時與備系統(tǒng)的后續(xù)處理保持?jǐn)?shù)據(jù)一致。
實現(xiàn)應(yīng)用系統(tǒng)的容災(zāi)可以采用多種技術(shù)手段,如基于數(shù)據(jù)庫復(fù)制的方式;基于操作系統(tǒng)文件系統(tǒng)復(fù)制的方式;基于高端聯(lián)機(jī)存儲設(shè)備(磁盤陣列)之間的數(shù)據(jù)寫操作同步的方式,以及應(yīng)用軟件數(shù)據(jù)同步的方式。各種實現(xiàn)手段均有其各自的優(yōu)缺點。
采用硬件同步方式的優(yōu)點是對應(yīng)用程序透明,在日后增加新業(yè)務(wù)時的軟件維護(hù)費用很低。但由于北京和深圳地理位置相距2000多公里,TB一級的數(shù)據(jù)傳輸量,每天將產(chǎn)生上千萬張的用戶話單,如果采用采用傳統(tǒng)的磁盤鏡像、數(shù)據(jù)庫復(fù)制、操作系統(tǒng)級同步等低層次的數(shù)據(jù)同步方案主備系統(tǒng)之間2000多公里的距離上實現(xiàn)完全同步,即使使用光纖,延遲會比較大,等待同步的握手時間會比較長,這樣每天傳輸TB級的數(shù)據(jù)在實現(xiàn)上是有一定困難的,并且由于網(wǎng)絡(luò)傳輸距離遠(yuǎn),使得延遲增大,會影響主系統(tǒng)生產(chǎn)性能;另外,建設(shè)成本也過于龐大,經(jīng)過初步測算,如果使用硬件同步的方式,按照TB級數(shù)據(jù)的量,它在北京和深圳要申請的線路(廣域網(wǎng)絡(luò)專線租用)帶寬要超過100兆,這就需要投入很高的日常運作成本,這筆投資非常大,而這不僅僅是一次性投資,它要租用一個上百兆的線路的話,每個月還要交付數(shù)目不菲的線路租用費,所以使用成本難以令人接受,因此采用通常意義上的數(shù)據(jù)鏡像備份技術(shù)是不現(xiàn)實的。
應(yīng)用級同步處理方式是指北京和深圳都采用相同的應(yīng)用軟件,對主系統(tǒng)和備系統(tǒng)兩個中心的軟件、硬件進(jìn)行擴(kuò)容改造,使得兩套系統(tǒng)具有相同的處理能力,并具有數(shù)據(jù)同步處理的能力,進(jìn)而實現(xiàn)容災(zāi)備份。這種方案全部依賴于應(yīng)用軟件,根據(jù)業(yè)務(wù)處理的特點來完成系統(tǒng)和數(shù)據(jù)處理的同步,從而大大減少主系統(tǒng)和備系統(tǒng)同步所需的信息,降低了對網(wǎng)絡(luò)帶寬的需求和運營成本,其缺點是系統(tǒng)的軟件復(fù)雜度較高,從而導(dǎo)致日后在增加新業(yè)務(wù)功能時軟件維護(hù)費用增加。
經(jīng)過對主系統(tǒng)中心和備系統(tǒng)中心現(xiàn)狀全面的分析和綜合考慮,決定采用應(yīng)用級同步處理的方式來實現(xiàn)中國移動通信計費結(jié)算中心容災(zāi)備份。
應(yīng)用級容災(zāi)系統(tǒng)方案的結(jié)構(gòu)如圖1所示;趹(yīng)用的容災(zāi)方案就是不使用硬件技術(shù)和中間件技術(shù),只是通過修改它的計費清算軟件來達(dá)到主系統(tǒng)和備系統(tǒng)同時處理移動計費清算業(yè)務(wù)的目的。這樣最主要的是會節(jié)省客戶的運營成本,最主要的是客戶不需要在北京和深圳之間租用幾十兆甚至上百兆帶寬的線路,另外這種同步的效率可靠性也能夠達(dá)到用戶的滿意程度。主備雙方采用完全相同的應(yīng)用軟件,這個方案的核心是要在應(yīng)用程序當(dāng)中嵌入數(shù)據(jù)同步的功能。在文件傳輸模塊中,要求省中心同時向主系統(tǒng)和備系統(tǒng)發(fā)送上發(fā)文件,一般情況下,國際運營商/國際清算中心的數(shù)據(jù)文件只發(fā)送到主系統(tǒng),主系統(tǒng)通過傳輸網(wǎng)絡(luò)將數(shù)據(jù)傳送到備系統(tǒng)。在正常情況下,僅主系統(tǒng)將處理結(jié)果文件向各省或國際運營者下發(fā),而備系統(tǒng)只生成結(jié)果文件但不下發(fā)。
在應(yīng)用系統(tǒng)開發(fā)中將涉及對應(yīng)用程序的容災(zāi)化改造,而且對以后的新業(yè)務(wù)功能的開發(fā)、維護(hù)、版本更新等,都必須遵照一定的容災(zāi)設(shè)計規(guī)范,確保在實現(xiàn)新的業(yè)務(wù)功能的同時保證主備系統(tǒng)數(shù)據(jù)處理的同步。應(yīng)用級數(shù)據(jù)同步一般有兩種方案:一是采用復(fù)制和導(dǎo)入主系統(tǒng)處理結(jié)果的方法;二是備份中心對輸入文件進(jìn)行同步再處理。其中第一種方法的優(yōu)點是災(zāi)難切換后新主系統(tǒng)與原主系統(tǒng)的數(shù)據(jù)一致性較好,缺點是切換時備系統(tǒng)的內(nèi)部數(shù)據(jù)同步較復(fù)雜。第二種方案的優(yōu)點是內(nèi)部數(shù)據(jù)一致性較好,但主備系統(tǒng)的數(shù)據(jù)一致性的同步機(jī)制比較復(fù)雜。綜合考慮這兩種方案的優(yōu)缺點,我們決定將兩種方案相結(jié)合,針對不同應(yīng)用程序的特點,選擇相應(yīng)的實現(xiàn)方案。
應(yīng)用級容災(zāi)系統(tǒng)所要解決的首要問題是在日常情況下如何保持主備系統(tǒng)同步處理數(shù)據(jù)并且保證主備系統(tǒng)處理結(jié)果相同。要達(dá)到這個目標(biāo),需要解決以下幾個核心問題:
1.主備應(yīng)用系統(tǒng)軟件更新隨機(jī)性
由于原有的清算系統(tǒng)的業(yè)務(wù)在不斷更新和演化,軟件版本會不斷更新,若要確保備系統(tǒng)與主系統(tǒng)具有相同處理能力和處理行為的等價系統(tǒng),首先必須建立起一套有效的主備系統(tǒng)版本更新和監(jiān)控的控制機(jī)制和管理規(guī)章制度。軟件版本控制包括源代碼、目標(biāo)碼、開發(fā)和生產(chǎn)環(huán)境的控制。
![](http://image.c114.net/obsolete/tech/picture/040508-23.jpg)
2.主生產(chǎn)系統(tǒng)處理的數(shù)據(jù)隨機(jī)性
主生產(chǎn)系統(tǒng)在處理數(shù)據(jù)時有相當(dāng)多的隨機(jī)數(shù)據(jù),主要包括:運行環(huán)境數(shù)據(jù),包括系統(tǒng)時間等操作系統(tǒng)或其他調(diào)用返回的數(shù)據(jù);公共參數(shù),即數(shù)據(jù)庫公參表;子系統(tǒng)私有參數(shù),應(yīng)用程序配置文件等相對靜態(tài)的參數(shù)等等。如果備系統(tǒng)采用同步處理的方式運行的話,必須確保使用與主系統(tǒng)完全相同的隨機(jī)數(shù)據(jù),才能得到相同的處理結(jié)果。
例如,若備系統(tǒng)在處理某一話單文件時使用與主系統(tǒng)不同的處理時間,則有可能對過期話單有不同的判斷結(jié)果,從而造成主備系統(tǒng)的結(jié)算帳目差異。
為保證備系統(tǒng)在完成同一數(shù)據(jù)處理時使用與主系統(tǒng)完全相同的隨機(jī)數(shù)據(jù),必須將主系統(tǒng)中所使用的上述隨機(jī)數(shù)據(jù)傳遞到備系統(tǒng),備系統(tǒng)依照此隨機(jī)數(shù)據(jù)進(jìn)行處理,才可以確保主備系統(tǒng)處理結(jié)果的一致性。我們將這些由主系統(tǒng)產(chǎn)生并傳遞到備系統(tǒng)的隨機(jī)數(shù)據(jù)稱為同步索引(SyncIndex),簡稱IDX。
對于前面過期話單檢測的例子,解決的辦法是將主系統(tǒng)處理該文件的處理時間傳遞到備系統(tǒng),備系統(tǒng)放棄自己的系統(tǒng)時間而使用主系統(tǒng)的時間來檢測過期話單,這樣就可以保證主備系統(tǒng)處理結(jié)果是完全一致的。這里的處理時間就是IDX所包含的隨機(jī)數(shù)據(jù)。
3.與外部系統(tǒng)的接口數(shù)據(jù)的同步
三期系統(tǒng)的主要外部接口包括31個省中心和上百個國際運營商(包括國際清算中心),為實現(xiàn)容災(zāi)備份,備系統(tǒng)必須同這些外部系統(tǒng)具有與主系統(tǒng)相同的接口,接收和處理相同的數(shù)據(jù),并且需要建立起一套校驗機(jī)制以確保主備系統(tǒng)接收和處理的是完全相同的數(shù)據(jù)。
容災(zāi)同步機(jī)制的目的是要保證主備系統(tǒng)的處理同步和結(jié)果一致,現(xiàn)在系統(tǒng)的每個業(yè)務(wù)線處理由多個子系統(tǒng)合作完成,而且各個子系統(tǒng)之間是相互依賴的,即一個子系統(tǒng)的輸出是另一個子系統(tǒng)的輸入。因此為了保證主備系統(tǒng)的處理同步和結(jié)果一致,就需要保證主備系統(tǒng)各個子系統(tǒng)對應(yīng)進(jìn)程處理同步和結(jié)果一致,由此我們引入了同步機(jī)制。
同步機(jī)制包括:同步索引(IDX)機(jī)制、結(jié)果導(dǎo)入機(jī)制及準(zhǔn)同步索引機(jī)制。
同步索引(IDX)機(jī)制的原理是在主系統(tǒng)處理的過程中不斷產(chǎn)生同步信息,并發(fā)給備系統(tǒng),同步信息中包含對上述處理隨機(jī)輸入數(shù)據(jù)的描述。備系統(tǒng)在接收到此同步信息后觸發(fā)相應(yīng)的處理模塊,該處理模塊根據(jù)同步信息中包含的數(shù)據(jù)進(jìn)行相應(yīng)的業(yè)務(wù)處理,從而保證主備系統(tǒng)處理的同步和結(jié)果的一致性。
結(jié)果導(dǎo)入機(jī)制:理論上講,上面所述的IDX同步處理方式,可以實現(xiàn)各種應(yīng)用系統(tǒng)的同步,其前提條件是,所有的隨機(jī)變量都需要由主系統(tǒng)記錄到IDX中并傳遞到備系統(tǒng),備系統(tǒng)嚴(yán)格按照IDX進(jìn)行處理。但是,如果需要傳遞的隨機(jī)變量數(shù)目過多,會導(dǎo)致IDX過于巨大,主備系統(tǒng)處理邏輯和處理性能都會因此受到很大影響,從而導(dǎo)致同步索引機(jī)制難以實施。對于這種情況,可以考慮使用結(jié)果導(dǎo)入機(jī)制,即直接將主系統(tǒng)處理的結(jié)果數(shù)據(jù)發(fā)送到備系統(tǒng)。在此同步機(jī)制下,備系統(tǒng)只需將主系統(tǒng)傳遞過來的結(jié)果數(shù)據(jù)導(dǎo)入而不進(jìn)行其它任何處理,就可以得到與主系統(tǒng)完全一致的結(jié)果。
![](http://image.c114.net/obsolete/tech/picture/040508-24.jpg)
準(zhǔn)同步索引機(jī)制:結(jié)果導(dǎo)入機(jī)制雖然可以在對系統(tǒng)性能以及處理邏輯影響較小的情況下,保證主備系統(tǒng)處理結(jié)果的一致性,但系統(tǒng)只有最終結(jié)果,沒有中間結(jié)果,系統(tǒng)內(nèi)部數(shù)據(jù)(數(shù)據(jù)庫表與表、表和文件之間等)難以一致;導(dǎo)致主備切換后備系統(tǒng)不能接續(xù)原主系統(tǒng)進(jìn)行處理。因此為了解決在災(zāi)難切換時的數(shù)據(jù)一致,這里提出結(jié)果導(dǎo)入方式和半同步處理方式互補(bǔ)的方式:準(zhǔn)同步索引機(jī)制。即使用結(jié)果導(dǎo)入來備份主系統(tǒng)的處理結(jié)果,使得在災(zāi)難情況發(fā)生后可以查看以前的處理結(jié)果。而備系統(tǒng)使用簡化的IDX進(jìn)行同步處理,從而得到另一套處理結(jié)果。這套結(jié)果可能同主系統(tǒng)的處理結(jié)果略有不同,但不會丟失話單等重要數(shù)據(jù),而且其結(jié)果數(shù)據(jù)是內(nèi)部一致的。在災(zāi)難切換后使用內(nèi)部一致的數(shù)據(jù)來繼續(xù)處理可以大大簡化切換時的數(shù)據(jù)一致化操作。
容災(zāi)平臺
遠(yuǎn)程應(yīng)用級容災(zāi)系統(tǒng)實施的關(guān)鍵是容災(zāi)平臺(Disaster Recovery Platform)的構(gòu)建。
容災(zāi)平臺完成同步數(shù)據(jù)的生成、管理、傳輸及應(yīng)用系統(tǒng)的同步功能,保障主備系統(tǒng)間的應(yīng)用程序同步跟從及備份功能,所提供的功能在主備系統(tǒng)是有所差異的。
在主系統(tǒng),應(yīng)用系統(tǒng)與容災(zāi)平臺協(xié)作,調(diào)用容災(zāi)平臺的應(yīng)用程序接口(DR API),獲取同步信息,如輸入?yún)?shù)、系統(tǒng)時間、環(huán)境變量、處理文件名、生成結(jié)果等,經(jīng)DR平臺將同步數(shù)據(jù)打包生成同步數(shù)據(jù)文件,通過同步數(shù)據(jù)管理器及文件傳輸系統(tǒng),將同步信息傳輸?shù)絺湎到y(tǒng)。
備系統(tǒng)的容災(zāi)平臺在接收到同步數(shù)據(jù)信息后,通過同步數(shù)據(jù)管理器進(jìn)行解包驗證處理,并且按照主系統(tǒng)的處理順序,交給DR API同步索引執(zhí)行器,備系統(tǒng)應(yīng)用系統(tǒng)通過DR API獲得同步信息,執(zhí)行信息服務(wù)處理程序,完成與主系統(tǒng)一致的操作,達(dá)到同步跟從功能。
考慮到某些數(shù)據(jù)量較小的結(jié)果是無法通過DR API的同步索引生成機(jī)制獲得備份的,就考慮添加DR API結(jié)果導(dǎo)出功能,應(yīng)用系統(tǒng)通過DR API的結(jié)果導(dǎo)出功能,將結(jié)果導(dǎo)出后,交給結(jié)果導(dǎo)出管理器管理打包,再通過傳輸系統(tǒng)傳送到備系統(tǒng),備系統(tǒng)的結(jié)果導(dǎo)入管理器接收到主系統(tǒng)的導(dǎo)出結(jié)果,在備系統(tǒng)進(jìn)行相應(yīng)的導(dǎo)入工作,完成主系統(tǒng)關(guān)鍵數(shù)據(jù)的備份功能。
除了同步數(shù)據(jù)生成及結(jié)果導(dǎo)入導(dǎo)出模塊外,還需要考慮主備系統(tǒng)軟件版本同步控制、容災(zāi)監(jiān)控與切換以及容災(zāi)前臺維護(hù)界面與報表功能。
綜上所述,遠(yuǎn)程容災(zāi)平臺實施模型如圖3所示。
該容災(zāi)平臺實施模型包括以下幾個功能模塊:
1.容災(zāi)應(yīng)用程序接口(DR API)
即容災(zāi)系統(tǒng)開發(fā)平臺,功能主要包括IDX生成和執(zhí)行API、容災(zāi)結(jié)果導(dǎo)出API,這些API需要嵌入到三期的應(yīng)用程序中去,并且在以后新業(yè)務(wù)開發(fā)過程中都要遵守依據(jù)此平臺所制定容災(zāi)開發(fā)規(guī)范,在新業(yè)務(wù)的應(yīng)用程序中適當(dāng)?shù)厍度隓R API,來保證主備系統(tǒng)處理的同步。
![](http://image.c114.net/obsolete/tech/picture/040508-25.jpg)
2.同步數(shù)據(jù)管理模塊
包括同步數(shù)據(jù)文件生成(在主系統(tǒng)中根據(jù)容災(zāi)API所產(chǎn)生的同步數(shù)據(jù)生成同步數(shù)據(jù)文件以便向備系統(tǒng)傳遞),公共參表數(shù)據(jù)版本管理同步,同步數(shù)據(jù)解釋執(zhí)行(在備系統(tǒng)中),業(yè)務(wù)程序間依賴關(guān)系檢測等功能。它是容災(zāi)平臺的核心,負(fù)責(zé)協(xié)調(diào)各個子系統(tǒng),對備系統(tǒng)有調(diào)度功能,它負(fù)責(zé)啟動或觸發(fā)所有的三期需同步的應(yīng)用程序。
3.Exporter/Importer結(jié)果導(dǎo)出/導(dǎo)入模塊
依API導(dǎo)出結(jié)果數(shù)據(jù)生成數(shù)據(jù)映像文件,從映像文件導(dǎo)入數(shù)據(jù)庫等,作為DR API的補(bǔ)充。結(jié)果導(dǎo)入也利用同步數(shù)據(jù)管理器來調(diào)度協(xié)調(diào)主備系統(tǒng)。
4.軟件版本控制
用于控制和監(jiān)控容災(zāi)系統(tǒng)源代碼、執(zhí)行碼的版本確保主備系統(tǒng)使用相同版本的軟件,包括軟件的包裝、安裝和升級等過程控制。軟件版本的更新必須遵循嚴(yán)格的規(guī)范。
5.容災(zāi)前臺維護(hù)界面
容災(zāi)前臺維護(hù)界面用于配置容災(zāi)同步管理平臺,使其滿足三期系統(tǒng)的容災(zāi)需求,并與被應(yīng)用系統(tǒng)調(diào)用的容災(zāi)應(yīng)用程序接口(DR API)相配合。前臺維護(hù)界面包括應(yīng)用系統(tǒng)同步數(shù)據(jù)參數(shù)配置,結(jié)果導(dǎo)出/導(dǎo)入?yún)?shù)配置,軟件版本管理與安裝界面等。
6. 容災(zāi)文件傳輸
容災(zāi)文件傳輸?shù)闹饕δ馨◤V域網(wǎng)中轉(zhuǎn)、主備同步信息文件傳輸。
由于備系統(tǒng)需要建立和外部系統(tǒng)(省中心和國際運營者)的網(wǎng)絡(luò)連接以及主備系統(tǒng)之間的熱線網(wǎng)絡(luò),因而在廣域網(wǎng)物理拓?fù)浣Y(jié)構(gòu)上已經(jīng)建立了一套備份網(wǎng)絡(luò),從而可以在某省中心與主系統(tǒng)之間發(fā)生網(wǎng)絡(luò)傳輸故障時通過備系統(tǒng)來中轉(zhuǎn)省上發(fā)文件,這樣可以充分發(fā)揮容災(zāi)備份的潛力,提高主系統(tǒng)的生產(chǎn)可靠性、穩(wěn)定性和及時性。
主備同步信息文件傳輸主要負(fù)責(zé)將主系統(tǒng)產(chǎn)生的同步數(shù)據(jù)文件(包括IDX文件、結(jié)果導(dǎo)出映像文件、公參表映像文件、軟件版本更新文件等)傳遞到備系統(tǒng)。
7. 系統(tǒng)管理與高可靠性控制
系統(tǒng)操作員可以通過該功能模塊管理控制主系統(tǒng)和備系統(tǒng),診斷故障,保障系統(tǒng)的高可靠性,系統(tǒng)對可預(yù)見故障,自動修復(fù)錯誤,如果出現(xiàn)較大故障,系統(tǒng)進(jìn)行高可靠性本地切換或主備系統(tǒng)切換。
結(jié)束語
基于本文研究的遠(yuǎn)程應(yīng)用級容災(zāi)系統(tǒng),目前已經(jīng)在實際計費工程項目中取得了良好的效果,在實際的容災(zāi)系統(tǒng)中得到了充分的運用,備系統(tǒng)實現(xiàn)了業(yè)務(wù)數(shù)據(jù)實時跟從處理,生產(chǎn)結(jié)果數(shù)據(jù)實時備份,并且在系統(tǒng)維護(hù)和管理決策人員做出災(zāi)難決策后,系統(tǒng)執(zhí)行切換的時間將不超過2小時,完全能夠抵御百年一遇的災(zāi)難攻擊。該技術(shù)也可以廣泛運用于銀行、證券、電信、軍事指揮、機(jī)密通信等大型計算機(jī)信息系統(tǒng)之中,為預(yù)防災(zāi)難性事件提供了有力保障。該系統(tǒng)的建立使中國移動的計費清算系統(tǒng)可實現(xiàn)系統(tǒng)永續(xù)運行的需求,極大的提升了在其國內(nèi)外電信運營企業(yè)之間的信譽(yù)與地位,增強(qiáng)了用戶的安全感,堅定了持有中國移動股票的股民們的信心。在電信運營商越來越注重用戶滿意度的今日,中國移動遠(yuǎn)程計費清算備份中心的建立,加強(qiáng)了中國移動的市場競爭力,進(jìn)一步提升了中國移動的行業(yè)地位,將有利于其國際間業(yè)務(wù)的開展,另外,GPRS、移動短消息、移動數(shù)據(jù)業(yè)務(wù)等新業(yè)務(wù)正不斷增長,良好的業(yè)務(wù)支撐系統(tǒng)的建立,也為中國移動進(jìn)一步的業(yè)務(wù)拓展打好了堅實的基礎(chǔ)。
據(jù)悉,這也是國際上兩地距離相距最遠(yuǎn)、傳輸數(shù)據(jù)量最大、采用技術(shù)最新的遠(yuǎn)程備份系統(tǒng)之一。遠(yuǎn)程應(yīng)用級容災(zāi):移動通信計費清算的得力助手
----《中國移動通信》