導(dǎo)讀:信息化所帶來(lái)的數(shù)據(jù)集中將風(fēng)險(xiǎn)也集中,一個(gè)數(shù)據(jù)中心故障所能造成的影響也許就是全球性的。要確保數(shù)據(jù)中心安全需要考慮的方面實(shí)在是太多了,防火、防水、防停電、防震、防盜、還得防恐怖襲擊。這個(gè)時(shí)候也許沒有什么比擁有一個(gè)完善的容災(zāi)系統(tǒng)更讓人心動(dòng)的了。
引子
2012年12月21日并沒有成為所謂的世界末日,人們或忐忑或興奮的度過了這一天。
世界末日雖然沒有如“約”而至,但縱觀2012年世界并不安寧,桑迪給美國(guó)東海岸洗了一遍澡,不過好像用的都是美國(guó)西部的水,害的西部人民干的夠嗆。北京的大雨考驗(yàn)了帝都的排水系統(tǒng)。
數(shù)據(jù)中心所面對(duì)的災(zāi)難挑戰(zhàn)
這些年數(shù)據(jù)中心的工作人員也沒有閑著,桑迪讓數(shù)據(jù)中心人員不得不一邊住在機(jī)房與設(shè)備共存亡一邊祈禱發(fā)電機(jī)能挺到電力恢復(fù)。Fisher Plaza數(shù)據(jù)中心、莫斯科的ISP服務(wù)器機(jī)房、美國(guó)威斯康辛數(shù)據(jù)中心、加爾各答的一家銀行的工作人員忙著充當(dāng)消防員。土耳其伊斯坦布爾Vodafone數(shù)據(jù)中心的同志好像是劃船離開的辦公室。
信息化所帶來(lái)的數(shù)據(jù)集中將風(fēng)險(xiǎn)也集中,一個(gè)數(shù)據(jù)中心故障所能造成的影響也許就是全球性的。要確保數(shù)據(jù)中心安全需要考慮的方面實(shí)在是太多了,防火、防水、防停電、防震、防盜、還得防恐怖襲擊。這個(gè)時(shí)候也許沒有什么比擁有一個(gè)完善的容災(zāi)系統(tǒng)更讓人心動(dòng)的了。容災(zāi)系統(tǒng)實(shí)現(xiàn)了數(shù)據(jù)或應(yīng)用在另一個(gè)地理位置的重現(xiàn),當(dāng)災(zāi)難發(fā)生前或發(fā)生后用戶可以通過容災(zāi)系統(tǒng)保證應(yīng)用系統(tǒng)在可接受的時(shí)間和可接受的數(shù)據(jù)丟失量之內(nèi)在另一數(shù)據(jù)中心重現(xiàn)啟動(dòng),將災(zāi)難對(duì)業(yè)務(wù)的影響降到最低。在現(xiàn)階段各個(gè)行業(yè)都非常關(guān)注容災(zāi)系統(tǒng)的建設(shè),各個(gè)行業(yè)紛紛出臺(tái)了針對(duì)各行業(yè)自身的容災(zāi)要求,用戶遵循行業(yè)要求和自身需求建設(shè)容災(zāi)系統(tǒng)。
容災(zāi)建設(shè)方法
容災(zāi)系統(tǒng)的建設(shè)是一個(gè)系統(tǒng)工程,需遵循有效的方法,將各方面因素考慮完整,按嚴(yán)謹(jǐn)?shù)牧鞒掏瓿擅恳徊降慕ㄔO(shè),才能真正實(shí)現(xiàn)災(zāi)難恢復(fù)的目標(biāo)。不論是實(shí)現(xiàn)哪一級(jí)別的容災(zāi)建設(shè),都需要包含技術(shù)、流程、人員三要素和需求分析、策略制定、方案實(shí)施、運(yùn)維管理四個(gè)步驟。
在技術(shù)層面,數(shù)據(jù)復(fù)制技術(shù)是容災(zāi)技術(shù)的基礎(chǔ),可靠的復(fù)制技術(shù)才能保證產(chǎn)生正確的數(shù)據(jù)副本;高效的復(fù)制技術(shù)可以減少數(shù)據(jù)丟失量,獲得更好的RPO。管理系統(tǒng)也是技術(shù)的另一個(gè)層面,管理系統(tǒng)將技術(shù)、流程、人員有機(jī)的組合在一起,使之能工作的更加高效。下面我們就華為HVS高端存儲(chǔ)在容災(zāi)技術(shù)方面做一個(gè)簡(jiǎn)單的介紹。
HVS高端存儲(chǔ)數(shù)據(jù)復(fù)制技術(shù)介紹
華為高端存儲(chǔ)HVS作為面向用戶核心業(yè)務(wù)的存儲(chǔ)系統(tǒng),承載著客戶最關(guān)鍵數(shù)據(jù),數(shù)據(jù)安全不容有閃失。HVS高端存儲(chǔ)自身具有智能矩陣式系統(tǒng)架構(gòu)和 Raid2.0技術(shù)提高了系統(tǒng)自身的數(shù)據(jù)安全性,系統(tǒng)可靠性達(dá)到了99.999%的高標(biāo)準(zhǔn)。對(duì)于站點(diǎn)級(jí)事故來(lái)講HVS高端存儲(chǔ)擁有完善的遠(yuǎn)程數(shù)據(jù)保護(hù)功能 和容災(zāi)解決方案,確保用戶數(shù)據(jù)和應(yīng)用在災(zāi)備中心重現(xiàn),將整個(gè)數(shù)據(jù)可靠性提高到了99.9999%的更高水平。
數(shù)據(jù)和應(yīng)用在災(zāi)備中心重現(xiàn)的基礎(chǔ)是數(shù)據(jù)能從生產(chǎn)中心順利的復(fù)制到災(zāi)備中心,HVS HyperReplication系列遠(yuǎn)程復(fù)制功能負(fù)責(zé)數(shù)據(jù)在生產(chǎn)中心和災(zāi)備中心的傳輸。Hyper Replication分為同步(HyperReplication/S)和異步(HyperReplication/A)兩種模式,在同步模式下主機(jī)寫 I/O進(jìn)行雙寫后再返回到主機(jī),生產(chǎn)中心與災(zāi)備中心數(shù)據(jù)0丟失(RPO=0)。在異步模式下,主機(jī)寫I/O到達(dá)生產(chǎn)站點(diǎn)后并不立即傳輸?shù)綖?zāi)備站點(diǎn),而是在 設(shè)定的傳輸點(diǎn)再進(jìn)行傳輸,HVS高端存儲(chǔ)針對(duì)異步傳輸模式進(jìn)行了優(yōu)化,通過緩存時(shí)間戳專業(yè)技術(shù)將將整個(gè)系統(tǒng)的最小RPO降低到5s,使用戶在進(jìn)行遠(yuǎn)程異地 傳輸時(shí)數(shù)據(jù)丟失量更小,業(yè)務(wù)損失更少。
HVS高端存儲(chǔ)還是業(yè)界首款支持與中低端存儲(chǔ)進(jìn)行遠(yuǎn)程復(fù)制的高端存儲(chǔ),客戶可以在災(zāi)備站點(diǎn)使用中低端存儲(chǔ)作為災(zāi)備存儲(chǔ),降低整個(gè)容災(zāi)系統(tǒng)建設(shè)的成本。
HVS高端存儲(chǔ)數(shù)據(jù)一致性技術(shù)介紹
在異步遠(yuǎn)程復(fù)制技術(shù)中數(shù)據(jù)一致性是數(shù)據(jù)丟失量之外另一個(gè)重要指標(biāo),數(shù)據(jù)一致性是指關(guān)聯(lián)數(shù)據(jù)之間的邏輯關(guān)系的正確性和完整性。當(dāng)某種異常情況發(fā)生時(shí), 數(shù)據(jù)并沒有按照應(yīng)用程序規(guī)定的邏輯關(guān)系完整的寫入磁盤,應(yīng)用程序讀入的數(shù)據(jù)無(wú)法按照原有的邏輯進(jìn)行解析,導(dǎo)致應(yīng)用程序無(wú)法啟動(dòng)。數(shù)據(jù)一致性是容災(zāi)系統(tǒng)業(yè)務(wù) 恢復(fù)的關(guān)鍵。
數(shù)據(jù)一致性問題往往會(huì)導(dǎo)致應(yīng)用程序無(wú)法啟動(dòng)。引起數(shù)據(jù)一致性問題的一個(gè)主要原因是位于數(shù)據(jù)I/O路徑上的緩存機(jī)制。這樣當(dāng)系統(tǒng)發(fā)生故障時(shí),如仍有 “滯留”在緩存中的I/O未被處理完,導(dǎo)致部分?jǐn)?shù)據(jù)尚未寫入磁盤,就會(huì)造成數(shù)據(jù)的不一致。HVS高端存儲(chǔ)利用快照技術(shù)完美的解決了數(shù)據(jù)一致性問題,在異步 傳輸前通過快照為數(shù)據(jù)盤創(chuàng)建一個(gè)特定時(shí)間點(diǎn)的映像,通過這個(gè)特定時(shí)間點(diǎn)的快照映像,保證數(shù)據(jù)的一致性。
引起數(shù)據(jù)不一致性的另外一個(gè)主要原因是“卷組一致性問題”。某些應(yīng)用的數(shù)據(jù)存放在多個(gè)磁盤卷上,這些相關(guān)聯(lián)的磁盤卷是一個(gè)整體,必須保持一致性,以便共同為上層應(yīng)用提供一份可用的數(shù)據(jù),這就是卷組一致性。HVS高端存儲(chǔ)設(shè)置CG(Consistency Group)概念,將相關(guān)聯(lián)的磁盤卷添加到一個(gè)CG中,在對(duì)這些磁盤卷進(jìn)行操作(比如備份、快照、復(fù)制)時(shí),把它們做為一個(gè)整體操作。避免因?yàn)閷?duì)各個(gè)磁盤卷的操作在時(shí)間上的不同步導(dǎo)致整體數(shù)據(jù)不一致。
HVS高端存儲(chǔ)容災(zāi)管理系統(tǒng)介紹
從業(yè)務(wù)特性上來(lái)講,容災(zāi)系統(tǒng)真正發(fā)揮作用的時(shí)間并不多,也許幾年才會(huì)用上一次,甚至幾年也沒用上一次,可以算得上是小概率事件了,但為了讓容災(zāi)系統(tǒng)在小概率事件中能真正發(fā)揮作用,一個(gè)自動(dòng)化、可靠、高效的容災(zāi)管理是非常必要的。容災(zāi)管理可以分為兩個(gè)層面,第一個(gè)層面是日常的基礎(chǔ)管理,這部分管理工作主要是技術(shù)管理,解決數(shù)據(jù)完整性、配置一致性,計(jì)劃的正確性的問題。第二個(gè)層面是針對(duì)容災(zāi)演練和容災(zāi)切換的管理,解決故障或?yàn)?zāi)難發(fā)生時(shí)的整體規(guī)劃和配合的問題。華為Ultra系列容災(zāi)管理軟件將容災(zāi)相關(guān)的管理工作集中化、圖形化、流程化,幫助客戶更好地建設(shè)、維護(hù)、使用容災(zāi)系統(tǒng)。華為UltraAPM容災(zāi)管理平臺(tái)解決方案摒棄以存儲(chǔ)為視角的容災(zāi)管理方式,改為以客戶應(yīng)用為視角,以應(yīng)用為容災(zāi)的核心元素,符合用戶習(xí)慣。UltraAPM適用于兩中心、兩地三中心、多分支機(jī)構(gòu)、共享式等多種災(zāi)備場(chǎng)景。
華為UltraVR虛擬化容災(zāi)解決方案結(jié)合HVS高端存儲(chǔ)提供的增值功能,為企業(yè)提供虛擬化環(huán)境下的容災(zāi)解決方案。UltraVR是一款與虛擬化架構(gòu)高度集成的容災(zāi)管理軟件,對(duì)虛擬化環(huán)境中虛擬機(jī)進(jìn)行容災(zāi)設(shè)置與管理。配合華為存儲(chǔ)設(shè)備的增值功能提供:虛擬機(jī)本地恢復(fù)、容災(zāi)切換、容災(zāi)回切、一鍵恢復(fù)、容災(zāi)演練等功能,在不改變虛擬化基礎(chǔ)架構(gòu)的情況下滿足用戶各種容災(zāi)需求。
HVS高端存儲(chǔ)容災(zāi)總結(jié)
作為一款高端存儲(chǔ),安全可信是首要的,HVS高端存儲(chǔ)通過容災(zāi)將系統(tǒng)可靠性提升到6個(gè)9的高水平,解決客戶對(duì)數(shù)據(jù)安全的后顧之憂。同時(shí)HVS高端存儲(chǔ)在數(shù)據(jù)復(fù)制技術(shù)方面的優(yōu)化和專業(yè)的容災(zāi)管理軟件提高了HVS高端存儲(chǔ)的容災(zāi)效率,實(shí)現(xiàn)數(shù)據(jù)容災(zāi)彈性高效。