1. 容災系統的技術指標
衡量容災系統的兩個技術指標:
RPO(Recovery Point Objective):即數據恢復點目標,主要指的是業務系統所能容忍的數據丟失量。
RTO(Recovery Time Objective):即恢復時間目標,主要指的是所能容忍的業務停止服務的最長時間,也就是從災難發生到業務系統恢復服務功能所需要的最短時間周期。
RPO針對的是數據丟失,而RTO針對的是服務丟失,二者沒有必然的關聯性。RTO和RPO的確定必須在進行風險分析和業務影響分析後根據不同的業務需求確定。對於不同企業的同一種業務,RTO和RPO的需求也會有所不同。
2. 什麼是數據容災備份
容災備份系統是指在相隔較遠的異地,建立兩套或多套功能相同的IT系統,互相之間可以進行健康狀態監視和功能切換,當一處系統因意外(如火災、地震等)停止工作時,整個應用系統可以切換到另一處,使得該系統功能可以繼續正常工作。容災技術是系統的高可用性技術的一個組成部分,容災系統更加強調處理外界環境對系統的影響,特別是災難性事件對整個IT節點的影響,提供節點級別的系統恢復功能。
從其對系統的保護程度來分,可以將容災系統分為:數據容災和應用容災
數據容災就是指建立一個異地的數據系統,該系統是本地關鍵應用數據的一個實時復制。
應用容災是在數據容災的基礎上,在異地建立一套完整的與本地生產系統相當的備份應用系統(可以是互為備份),在災難情況下,遠程系統迅速接管業務運行。數據容災是抗禦災難的保障,而應用容災則是容災系統建設的目標。
3. 容災系統建設的技術指標有哪幾種
RPO和PTO是衡量容災系統建設的兩個重要常見指標,RPO-恢復點目標,決定了丟失多少數據,RTO-恢復時間目標,決定了業務中斷了多長時間。兩者的值要充分考慮到備份數據的重要程度和業務中斷時間的允許范圍。以和力記易的CDP容災備份產品備特佳軟體為例,可以實現RPO=0,RTO接近於0,保證數據0丟失,業務停頓時間最短可縮短至60秒內。與其他方案相比,CDP容災備份方案除了RPO和RTO外,還能保證恢復數據的完整性和可用性,從某種程度而言,數據的可用性是底線,甚至優於完整性。
除此之外,容災系統的建設還應該考慮到以下方面:
3、抗災難性。能夠做到異地容災,抵禦各種區域的大規模的天災人禍,便於災難演練;
4、安全可信任。容災備份系統將會毫無保留的接觸並獲得用戶的所有數據,要堅決杜絕後門,特別是有保密要求的數據及單位,最好採用國產自主創新的容災系統;
5、簡單易用。簡單易用是容災備份建設的必要條件,否則,即便采購了數據備份軟體,也會因為使用問題而不能獲得實際效果;
6、TCO合理,易用易維護易擴展易升級。項目建設不能簡單追求便宜,符合使用習慣的中文軟體或產品才是最好的選擇。最好是適合國人使用習慣的系統。
4. 解決雲時代容災的三個難題 雲容災
難題一 建立中國自己的容災體系和標准 十年前發生的美國「9・11」事件,第余頌衡一次深深觸動了中國企業災備這根神經。如今十年過去了,中國的災備建設情況到底如何呢?
災備建設要更上一層樓
在信息技術領域,災備系統是指以存儲系統作為基本支撐系統、以網路作為基本傳輸手段、以容錯軟硬體技術為直接技術手段、以管理技術為重要輔助手段的綜合系統。
時至今日,很多企業已經清楚地意識到,信息系統災難就在我們身邊,而並非遙不可及。「目前,發達國家70%的企業已經啟動了容災機制。」災備國家工程實驗室總工、北京郵電大學教授姚文斌在2011年第五屆中國容災高峰論壇上表示,「我國政府高度重視災備工作。從2003年起,相關政府部門和行業監管部門先後出台了多項關於容災的政策、法規和條例。雖然一些關系國計民生的關鍵行業企業已經明確了要建立信息系統災備和應急機制,但從執行層面看,進展相對緩慢。從目前情況看,除一些金融、電信機構已啟動容災建設外,其他行業的災難體系基礎還非常薄弱。中國的災備行業目前還處於起步階段。」
談到未來我國災備的發展方向,姚文斌表示,首先國家應該建立健全容災的法律法規。目前,在災備技術方面,相關的國際和國內標准數量相對較少,並且多停留在指導意見這個層面,缺乏具體的關於災備系統的操作和實施細節的評估標准。其次,應該建立適合我國信息化系統的災備體系。姚文斌介紹說:「災備國家工程實驗室成立後一直致力於協助相關政府部門構建國家災備標櫻冊准體系。我們已經制定了12個標准,之後還會制定其他相關標准。」
BCM標准指日可待
容災主要是從技術的角度來描述如何對數據進行保護以及如何保證業務的連續性。簡單說,容災的實現包含兩個重要因素:一個是技術,另一個是組織和人。一個企業或組織為了抵禦災難,又該做哪些方面的准備呢?這就牽涉到業務連續性管理。
BSI(英國標准化協會)IT卓越服務中心總監、BS 25999業務連續性管理體系主任審核員任暉將BCM的發展歸納為三個階段:第一個階段是業務持續計劃(BCP)階段,主要是制定業務連續性計劃,為避免某些潛在的風險做好准備;第二個階段是業務持續管理(BCM)階段,在這個階段,企業已經從做計劃過渡到進行業務持續性管理;第三個階段是業務持續管理系統(BCMS)階段,在這個階段,企業要建立一套完整有效的業務連續性管理流程。
「如果不進行容災演練,當災難發生時,人們就不知道應該如何去應對災難。演練的方法有很多種,相關的標准中有明確的說明。」任暉表示,「BCM的最高境界是將BCM融入到企業的文化當中。也就是說,企業中的每一個員工都應該有BCM的意識,再加上企業擁有一套健全的BCM體系和流程,一旦災難發生,企業能立刻調動所有資源,並及時啟動應急預案和災難恢復預案,豎做從而保證業務的持續發展。」
2011年,BCM標准誕生了一個新版本――ISO22301。但是,這個標准目前還是草案版,若想成為正式版的標准可能還要再等一兩年。
任暉介紹說:「除了BCM以外,企業還應該考慮應急管理,尤其是應急管理的管理系統,包括管理方法和人員的實際操作。目前,市場上只有關於應急管理的公共可獲取指南,而不是國際標准。」我國政府目前正在加緊制定中國的BCM標准,不斷完善BCM體系建設。
難題二
容災如何才能普及
時至今日,在很多企業用戶的心中,容災仍然是像金融、電信這樣的大型企業的專利。其實,只要企業對信息系統有較高的依賴程度,並且對數據的安全性和業務連續性有較高的要求,無論企業的規模大小,都可以建立適合自己的容災系統。
「容災已經成了IT建設的必需。用戶的容災需求與IT建設的發展階段密切相關。」上海愛數軟體有限公司(以下簡稱愛數公司)總裁賀鴻富在談到容災難普及的原因時表示,「2002以前,企業的IT基礎設施建設大規模興起;2002-2006年,許多企業已經轉到IT應用建設上;2006年之後,有些企業開始關注IT運維的有效性。那些已經邁入IT運維有效性建設階段的企業對容災會有迫切的需求。」
正確理解容災的機會成本
目前兩地三中心甚至兩地四中心的容災方案逐漸變成主流。這讓許多連一個完整的備份系統還沒有的中小企業用戶更感覺容災高不可攀。容災難普及的主要原因是什麼呢?賀鴻富認為原因有三:第一,用戶對容災價值的認可度;第二,用戶是否能夠選擇一個適合自己的容災方案;第三,如何看待容災的成本。
之所以有些用戶認為容災沒有用,主要是因為這些用戶當前的信息化建設需求沒有達到一定層次。畢竟災難是小概率事件,如果企業投入巨資建設容災系統,而平時容災系統又不能被充分利用,那麼對企業來說,用於容災系統建設的投資就可能是一種浪費。但是,對於那些必須保證業務系統7×24小時不間斷運行的企業來說,容災是必不可少的一種保護手段。
容災解決方案五花八門,包括備份、快照、持續數據保護(CDP)等。對於不具備專業技術背景的用戶來說,從眾多容災方案中選擇一款適合自己的經濟實惠的方案確實比較困難。如果能有一款方案,具有上述的所有功能,並且能夠一勞永逸地解決數據容災和應用容災的所有問題,那麼用戶與容災方案之間的距離就會被拉近。
容災主要解決的只有兩個問題:第一是保證數據不丟失,第二是保證應用不中斷。從應用等級來劃分,容災包括數據容災、應用容災和業務容災。對於普通企業來說,實現業務容災的目標比較困難。因此,對大多數企業來說,實現數據容災和應用容災是比較現實的問題。目前,市場上大多數的解決方案或者能滿足數據容災的需求,或者能解決應用容災的問題,但是能夠同時滿足數據容災和應用容災兩種應用需求的解決方案並不多。
有些用戶已經認識到容災的重要性,而且確實想部署容災系統,但是IT部門的負責人若想說服企業決策者投入大筆資金去建設一個容災系統是比較困難的事。企業的決策者通常十分關注項目的投入產出比。容災方案的成本包括初始成本、維護成本和機會成本。初始成本和維護成本很容易理解,關鍵是搞清機會成本與容災之間的關系。機會成本是指事故發生後給企業帶來的損失。如果企業沒有意識到必須花費必要的成本建立一個完整的容災系統,那麼容災的順利實施將成為一句空話。
一體化容災方興未艾
有沒有一種解決方案能夠同時解決數據容災和應用容災兩個問題?有沒有一種解決方案能夠融備份、快照、CDP、虛擬化等多種技術於一體?這不僅是用戶的需求,而且也是容災廠商努力的目標。包括愛數公司、Acronis公司等在內的一些公司都在積極倡導一體化容災的理念。一體化容災方案也成了容災普及的一個推動因素。
Acronis公司資深技術經理簡碩文分析說:「今天,針對實體機的備份和容災方案已經十分成熟。現在,企業用戶開始把更多的精力轉移到對虛擬機的保護上。兩三年前,人們只是把虛擬環境當成測試環境,但是現在,虛擬環境已經成了主要的應用環境。尤其是越來越多的中小企業用戶已經接受了虛擬化技術,並逐漸向雲計算架構過渡。雲端保護已經不再是一句 口號 。從保護實體機到保護虛擬機,這是數據保護和容災的一個轉折點。Acronis如今已經可以提供包括實體機、虛擬機以及雲端在內的數據保護和容災解決方案。」
未來,Acronis將提供統一的數據保護平台,包含磁碟存儲、歸檔、虛擬環境,甚至包含對郵件伺服器和資料庫的保護等。通過這個平台,用戶可以實現數據的集中備份、管理以及分發,同時還可以實現數據在磁碟、磁帶和雲端之間的轉移。
「我們建議,中小企業目前可以實體機保護為主,未來再視情況將數據保護擴展到虛擬化平台上。」簡碩文表示。
2011年9月,Acronis公司正式進軍中國市場。Acronis公司最新推出的Backup & Recovery 11是一套價格實惠的集成式災難恢復與數據保護解決方案。它既可以針對物理伺服器和虛擬機提供數據保護,又可以提供安全的遠程存儲,讓IT管理者通過一套統一的平台簡化作業,從而節省數據保護和容災的費用。
Acronis Backup & Recovery 11最突出的優勢在於,能以單個解決方案同時提供災難恢復與數據保護功能。
雲災備是必然趨勢
在《中國計算機報》評出的「2011業務連續性管理十大樣板工程」中,金融和電信兩個行業的案例佔了一半。此外,我們也看到,像政府、製造、互聯網等行業的用戶也越來越重視容災的建設。
以東風汽車有限公司(以下簡稱東風汽車)SAP業務系統備份及容災項目為例,東風汽車充分考慮到自身的實際需求,並結合昆騰的磁碟備份和重復數據刪除技術,實現了異地容災。
容災的技術核心是冗餘,一個設備壞了,另外一個設備可以頂上來。在雲計算環境中存在著大量的伺服器、存儲等資源,這種容錯式的設計為容災的實施提供了物理設施上的保障。應用於雲計算環境中的集中式管理和虛擬化技術,使得容災的實施變得更加簡單。
今天,我們已經看到許多國內外的廠商開始提供雲備份服務。用戶如果採用雲備份服務,只要藉助一個軟體,就可以將本地的數據備份到雲中,在進行數據恢復的時候,不僅可以把數據恢復到本地,而且可以恢復到雲中的其他地方。
災備國家工程實驗室總工姚文斌表示:「雲災備大大降低了災備的門檻。未來,雲災備必將得到更廣泛的應用,而且將成為雲環境的基本功能。」
難題三
如何找到適合自己的容災方案
根據容災等級的不同,容災方案可以分成許多種類。用戶究竟該如何選擇呢?
架構的變革
現在市場上大多數存儲產品的架構都是基於十年前的用戶需求設計的,很難滿足雲計算、虛擬化和大數據的應用需求。在雲計算時代,無論是中端存儲產品,還是高端存儲產品,其架構的改變是一種必然趨勢。傳統的高端存儲性能非常高,可操作性強,但是這樣的產品未必適合雲計算的應用。以雲服務商為例,它們需要的存儲平台是可以靈活伸縮的、能夠按需購買和按需配置的。網狀式或矩陣式的存儲控制器架構既能滿足用戶對性能的要求,又具有很高的靈活性,HP 3PAR雲存儲系統就採用了這樣的架構。
惠普公司資深技術顧問張楠表示:「許多用戶已經慢慢接受了雲存儲。雲存儲具有高可靠性,非常適合應用於容災。舉例來說,傳統高端存儲的某一個部件如果出現故障,系統的緩存功能就會被關閉,那麼整個系統的性能就會大打折扣。HP 3PAR雲存儲系統採用8個控制器,即使其中的某個節點出現故障,也不會影響整個系統的性能和可靠性。」2011年9月,惠普推出了HP P10000 3PAR存儲系統以及Peer Motion存儲軟體,使得客戶可以在虛擬化和雲計算環境中的磁碟系統之間實現應用負載的轉移及監控。
制定一個明確的策略
「容災分成不同的等級,不可能一步到位。一個成熟的客戶應該制定一個長期的容災發展戰略。」日立數據系統(HDS)資深解決方案顧問謝勇介紹說,「通常,一個客戶在實施容災之前,一定要將伺服器、存儲、應用等進行整合,並且對數據、應用和管理流程進行梳理。」
制定一個科學、明確的容災策略是容災取得成功的關鍵。很多企業在做容災之前根本沒有規劃,從而導致最終結果與當初的設想有天壤之別。
謝勇建議說:「容災既可以做同城或異地的,也可以做同步或非同步的,甚至可以做成兩地多個中心的方式。不同的容災方案成本不同,實施和維護的復雜度也不同。企業在構建容災系統之前一定要明確哪些功能是需要的,採用哪種技術能解決什麼樣的問題。」
現在,兩地三中心的容災架構是主流,很多銀行都採用了這種架構。兩地三中心的容災架構主要有級聯和多目標兩種方式。級聯方式比較復雜,採用的人較少。多目標容災架構的容災能力最強,其同步RPO(恢復點目標)值接近於零。用戶可以根據自己的需求、資金狀況等選擇適合自己的容災架構。
靈活運用新技術
今年日本發生的大地震也影響到了IBM位於日本東京附近的實驗室,實驗室中的很多設備倒下或傾斜。因為所有設備都採用了防地震套件,並經過特別的加固處理,所以在恢復後,所有關鍵數據都沒有丟失。IBM系統與科技部高端存儲產品經理龐文崢介紹說:「IBM可以提供從最簡單的磁帶容災到兩地三中心的全面容災方案,幫助用戶實現業務的連續運轉。」
如今,許多新技術都被應用到容災系統中,比如虛擬化、雲存儲等。IBM剛剛發布了基於雲的存儲引擎,它採用乙太網介面,可以實現基於雲存儲的多節點分布,最多可以包含30個節點,這些節點在物理上是完全分開的。龐文崢介紹說:「通過相應的軟體,我們可以保證數據在不同的節點之間自由流轉,並可以對所有節點實施層次化的管理,從而實現數據自動更新。」
「一個容災系統是否成功,硬體和技術的因素只佔40%,更重要的是相關的管理。」龐文崢總結說,「企業如果想選擇一個適合自己的容災方案,首先要明確業務連續性系統的建設目標,其次要實現數據的集中和IT架構的整合與簡化,最後要制定詳細的業務連續性計劃,包括組織、人員以及執行等方面的問題。」
可靠性是第一位的
實施容災的一個重要前提是建立一個高效、可靠的災備中心。在災備中心裡,除了伺服器、存儲、網路等IT設備以外,機房的物理基礎設施,包括供配電、製冷、監控等也十分重要。由於機房空間日益緊張,能源消耗越來越大,提高機房的效率,特別是製冷效率對用戶來說是一個嚴峻的挑戰。
捷聯克萊門特數據中心空調節能事業部經理郝鳳雲表示:「近幾年來,數據中心大型化的趨勢越來越明顯。為提高數據中心的製冷效率,空調系統也發生了巨大的變化。在冷源方面,捷聯克萊門特有一些獨特的技術。比如,我們在2003年就推出了第一台磁懸浮冷水機組。磁懸浮冷水機組採用變頻兩極壓縮,其效率比常規的離心機更高,可以更好地節省能源。」
對於災備中心來說,可靠性是第一位的。高效的冷卻系統可以避免設備因過熱而宕機。世紀互聯、北京市計算中心等都採用了捷聯克萊門特的冷卻系統。在現代化的數據中心裡,基於模塊化理念的一體化機房解決方案已成為主流。
5. 網路容災技術主要基於什麼
網路容災就是網路服務系統和網路存儲在出現問題的時候還能保障用戶正常應用。現在主要的技術就是同時運行兩套系統,比如一台網路服務系統伺服器,一般是同樣型號的兩台伺服器做雙機,當主伺服器因為某些原因當掉時,備份伺服器可以頂替主伺服器,繼續提供相應的服務,從而保證業務的連續性。
6. 容災備份的容災分類
從其對系統的保護程度來分,可以將容災系統分為:數據容災和應用容災
數據容災就是指建立一個異地的數據系統,該系統是本地關鍵應用數據的一個實時復制。
所謂數據容災,就是指建立一個異地的數據系統,該系統是本地關鍵應用數據的一個可用復制。在本地數據及整個應用系統出現災難時,系統至少在異地保存有一份可用的關鍵業務的數據。該數據可以是與本地生產數據的完全實時復制,也可以比本地數據略微落後,但一定是可用的。採用的主要技術是數據備份和數據復制技術。 數據容災技術,又稱為異地數據復制技術,按照其實現的技術方式來說,主要可以分為同步傳輸方式和非同步傳輸方式(各廠商在技術用語上可能有所不同),另外,也有如「半同步」這樣的方式。半同步傳輸方式基本與同步傳輸方式相同,只是在Read佔I/O比重比較大時,相對同步傳輸方式,可以略微提高I/O的速度。而根據容災的距離,數據容災又可以分成遠程數據容災和近程數據容災方式。下面,我們將主要按同步傳輸方式和非同步傳輸方式對數據容災展開討論,其中也會涉及到遠程容災和近程容災的概念,並作相應的分析。
所謂應用容災,是在數據容災的基礎上,在異地建立一套完整的與本地生產系統相當的備份應用系統(可以是互為備份),在災難情況下,遠程系統迅速接管業務運行。數據容災是抗禦災難的保障,而應用容災則是容災系統建設的目標。建立這樣一個系統是相對比較復雜的,不僅需要一份可用的數據復制,還要有包括網路、主機、應用、甚至IP等資源,以及各資源之間的良好協調。主要的技術包括負載均衡、集群技術。數據容災是應用容災的基礎,應用容災是數據容災的目標。 在選擇容災系統的構造時,還要建立多層次的廣域網路故障切換機制。本地的高可用系統指在多個伺服器搜皮櫻運行一個或多種應用的情況下,應確保任意伺服器出現任何故障時,其運行的應用不能中斷,應用程序和系統應能迅速切換到其它伺服器上運行,即本地系統集群和熱備份。 在遠程的容災系統中,要實現完整的應用容災,既要包含本地系統的安全機制、遠程的數據復制機制,還應具有廣域網范圍的遠程故障切換能力和故障診斷能力。也就是說,一旦故障發生,系統要有強大的故障診斷和切換策略制訂機制,確保快速的反應和迅速的業務接管。實際上,廣域網范圍的高可用能力與本地系統的高可用能力應形成一個整體,實現多級的故障切換和恢復機制,確保系統在各個范圍的可靠和安全。
集群系統是在冗餘的通常可用性系統基礎之上,運行高可靠性軟體而構成。高可靠性軟體用於自動檢測系統的運行狀態,在一台伺服器出現故障的情況下,自動地把設定的服務轉到另一台伺服器上。當運行伺服器提供的服務不可用時,備份伺服器自動接替運行伺服器的工作而不用重新啟動系統,而當運行伺服器恢復正常後,按照使用者的設定以自動或手動方式將服務切換到運行服務上運行。備份伺服器除了在運行伺服器世叢出現故障時接替其服務,還可以執行其他應用程序。因此,一台性能配備充分的主機可同時作為某一服務的運行伺服器和另一服務的備份伺服器使用,即兩台伺服器互為備份。一台主機可以運行多個服務,也可作為多個服務的備份伺服器。
數據容災系統,對於IT而言,就握侍是為計算機信息系統提供的一個能應付各種災難的環境。當計算機系統在遭受如火災、水災、地震、戰爭等不可抗拒的自然災難以及計算機犯罪、計算機病毒、掉電、網路/通信失敗、硬體/軟體錯誤和人為操作錯誤等人為災難時,容災系統將保證用戶數據的安全性(數據容災),甚至,一個更加完善的容災系統,還能提供不間斷的應用服務(應用容災)。可以說,容災系統是數據存儲備份的最高層次。
7. 什麼是容災備份
容災和備份是行業內形影不離的兩個概念,偶爾用戶也會模糊這兩個概念,不清楚目前的情況是做容災還是備份,盡管他們有些相似但他們也有著諸多的不同。
首先,概念上容災是指在上述的災難發生時,在保證生產系統的數據盡量少丟失的情況下,保持生存系統的業務不間斷地運行。從廣義上講,任何提高系統可用性的措施都可稱之為容災,它分為本地容災、異地容災、雲容災。一個容災系統的實現可以採用不同的技術,而容災系統的劃分,由其最終要達到的效果來決定。
備份是指數據或系統的備份,它是容災的基礎,是指為防止系統出現操作失誤或故障導致的數據丟失,而將全部或部分數據集合從應用主機的硬碟或陣列復制到其它存儲介質的過程。
其次兩者的目的也不盡相同,備份是一個將線上的數據轉移成離線數據的過程。備份的目的主要是為了應付數據安全的問題,例如數據的丟失,或系統數據中的邏輯錯誤等等。
而容災的建設目的則不是為了保護數據,而是為了業務的連續性和在線性。也就是說,當生產系統出現了任何的故障,容災系統都可以快速接管業務,使得生產業務不停頓,最大程度地減小損失。
8. 常見的容災備份技術有哪些
容災備份常見的的技術類型一般分成3類:
1、應用級別。跟據不同應用而設計的保護方式,能夠對應用數據進行細致的保護,像是ORACLE中自帶的DATA GUARD或是RMAN,但這種保護方式必須要有一定的技術水平,對應用也必須要有深入的了解,才能對關鍵數據進行保護及恢復,且系統及應用多半不能自行恢復
2、系統級別。依據系統的邏輯分區或是數據文件來進行保護,但無法針對應用內的數據變化進行保護,像是操作系統自帶的系統備份,或是傳統的冷備份及第三方保護工具,優點是不須對應用有很深的了解,但必須對系統有一定的技術水平,才能對關鍵應用或是系統數據進行保護及恢復
3、存儲級別。使用存儲的保護機制對磁碟分區進行保護,如快照或是鏡像,優點是不須對系統或是應用有很深的了解,但在保護數據的完整性,可用性保證及校驗方便性上較前二者差。
9. 容災系統包含哪些關鍵技術
說到容災,先要清楚「數據備份」的概念,因為,現在很多人把備份和容災經常放在一起講,但實際上是兩個概念。備份是為了應對災難來臨時造成的數據丟失問題。容災是為了在遭遇災害時保證信息系統正常運行,幫助企業實現業務連續性的目標;因此事實上容災系統與備份系統是獨立的。容災備份產品的最終目標是幫助企業和政府應對人為誤操作、軟體錯誤、病毒入等「軟」性災害以及硬體故障、自然災害等「硬」性災害。 按照國際標准share78,容災的方案可以分為以下7個層級: 0級:無異地備份 0級容災方案意味著僅攔彎在本地進行數據備份,沒有災難恢復計劃,一旦本地發生災難,將丟失全部的本地備份數據,業務無法恢復。 1級:實現異地備份 進行本地數據備份,然後將備份介質送往異地吵橡存放。異地未建容災備份中心,沒有災難恢復計劃。 2級:熱備份站點備份升衡旁 在滿足1級的條件基礎上,制定相應的災難恢復計劃,在異地有一個熱備份站點。災難發生後按照既定計劃快速進行業務恢復,數據恢復可能會有幾天甚至幾周的數據丟失。 3級:在線數據恢復 通過網關將數據進行備份並存放至異地,制定災難恢復計劃,建立異地災備中心,並配備部分數據處理系統及網路通信系統。通過網路切換,實現數據恢復。 4級:定時數據備份 在3級的基礎上,利用備份軟體自動定時備份至異地,並制定相應的災難恢復計劃。一旦災難發生,利用備份中心已有資源及異地備份數據恢復關鍵業務系統運行。會丟失部分數據,業務恢復時間達到天或者小時級。 5級:實時數據備份 這一等級的方案由於既能保證不影響當前交易的進行,又能實時復制交易產生的數據到異地,這一層次的方案是目前應用最廣泛的一類。 6級:數據零丟失 要求實現遠程實時備份,數據零丟失;備份中心具備與生產中心一致的處理能力,可實現業務的實時無縫切換,即業務接管。 近幾年,基於CDP持續數據保護技術的容災備份方案深受關注業務連續和數據安全的醫療、商超等行業歡迎,真正的CDP技術供應商和力記易更是深受客戶好評,感興趣的話可以在網上了解下,成功接管業務、保障與連續和防範數據丟失的案例非常多。
10. 數據容災的三級體系
目前比較完善的容災系統設計一般為三級體系結構的容災系統,整套系統包括存儲、備份和災難恢復部分。以下使用惠普生產的備份伺服器,模塊化磁碟陣列,備份磁帶庫和相關容災軟體舉例三級體系結構的容災系統的建立。
1、數據存儲子系統
正常情況下,業務系統運行在主中心伺服器上,業務數據返州存儲在主中心存儲磁碟陣列EMA12000中。EMA12000具有從12個磁碟驅動器到最多126個磁碟驅動器的擴展能力,能跨越多個大型主機和混合的UNIX、多廠商的Windows NT、Windows 2000以及其他開放系統的平台。
惠普為EMA12000系統設計的ASC陣列控制軟體,實現了對跨多伺服器平台數據的集中式控制,使數據不管在何時、在何地、以及何種方式需要,其可用性都能以真正的零停機時間得到成分保證。
2、數據備份子系統
為了實現業務數據的實時災漏念蔽難備份功能,關鍵應用可設置兩個數據中心,分別是主中心和備份中心。主中心系統配置主機包括兩台或多台HP ALPHA伺服器以及其他相關伺服器,通過構成SCSI CLUSTER組成多機高可靠性環境。主中心通過ATM/E3/WDM與備份中心連接。
在容災系統解決方案中,正常情況下,業務系統運行在主中心伺服器上,業務數據存儲在主中心存儲磁碟陣列EMA12000中,同時在備份中心配置EMA12000存儲磁碟陣列。主中心存儲磁碟陣列通過ATM/E3/WDM連接到備份中心磁碟陣列,DRM(數據復制管理器)使主中心存儲數據與備份中心數據保持實時完全一致。
3、災難恢復子系統
方案中,備份數據的磁帶庫安置在備份中心,利用備份伺服器直接連接到存儲陣列EMA12000和磁帶庫TL895,通過EBS(企業數據備份)和Legato NetWorker數據存儲管理系統控制系統的備份。萬一主數據中心出現意外災難,系統可以自動切換到備份數據中心,在保持連續運行的基礎上,快速恢復主數據中心的業務數據。
該套三級體系容災方案具有高度的可用性。第一級,為了避免系統單點失敗而影響整個系統的情況出現,採用了冗餘的手段,大到主機,存儲設備,小到光纖適配器,均具備冗餘容錯功能;第二級,無論是主機或存儲設備出現故障,均可通過主/備份中心光纖交換機之間的連接來保證通信和數據的完整性;第三級,萬一主數據中心出現意外災難,系統可以自動切換到備份數據中心。三級體系的科學設計保證了數據容災系高橡統的高度可用性和可靠性。
不僅如此,惠普獨有的HP OpenView網路設備管理軟體從根本上將系統管理人員解脫出來。整個系統的設備雖然很多,但不論是主機系統,存儲設備,還是光纖交換機,光纖卡,均能通過一台工作站進行集中的管理和監控,從另一個方面保證了整個業務系統的連續不斷地運行。除正常的計劃性停機外,該系統可以做到365×24的可用性。