淺析核電信息化數(shù)據(jù)的容災(zāi)備份
和力記易 發(fā)表于:13年03月19日 11:27 [來(lái)稿] DOIT.com.cn
一、引言
隨著計(jì)算能力以及存儲(chǔ)技術(shù)的日新月異,各種TB級(jí)的存儲(chǔ)被越來(lái)越廣泛的使用,這無(wú)疑在宣告一個(gè)事實(shí):大數(shù)據(jù)時(shí)代已經(jīng)完全進(jìn)入到我們的生活。作為核電領(lǐng)域來(lái)說(shuō),是更早步入大數(shù)據(jù)時(shí)代的領(lǐng)先者。其數(shù)據(jù)的主要構(gòu)成除了結(jié)構(gòu)化的各種數(shù)據(jù)庫(kù),還有大量電子文檔、圖像、視頻等非結(jié)構(gòu)化數(shù)據(jù)。這些數(shù)據(jù)具有增長(zhǎng)速度快、利用率高、安全等級(jí)高等特點(diǎn)。如何有效的對(duì)這些數(shù)據(jù)進(jìn)行容災(zāi)備份,確保這些數(shù)據(jù)不會(huì)丟失,提供這些數(shù)據(jù)的業(yè)務(wù)不會(huì)中斷,是核電領(lǐng)域必須考慮的一個(gè)問(wèn)題,這直接關(guān)系到了整個(gè)核電領(lǐng)域是否能夠正常運(yùn)轉(zhuǎn)。
二、核電信息化數(shù)據(jù)的特點(diǎn)
相較其它行業(yè)來(lái)說(shuō),核電領(lǐng)域的信息化數(shù)據(jù)具有自身的特點(diǎn),主要體現(xiàn)在以下幾個(gè)方面:
1、數(shù)據(jù)結(jié)構(gòu)混雜
數(shù)據(jù)的存在格式一般分為結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)數(shù)據(jù),而核電的數(shù)據(jù)基本上是非結(jié)構(gòu)化存在結(jié)構(gòu)化加工。所謂非結(jié)構(gòu)化存在是指的數(shù)據(jù)主要以電子文檔、設(shè)計(jì)/工程圖紙、實(shí)物、照片、影像/聲音等各種各樣的人文與科學(xué)數(shù)據(jù)為主,而所謂的結(jié)構(gòu)化加工是指的為了方便對(duì)非結(jié)構(gòu)數(shù)據(jù)進(jìn)行管理和利用,將按照國(guó)家核行業(yè)標(biāo)準(zhǔn)《核電電子文件元數(shù)據(jù)》的規(guī)定錄入結(jié)構(gòu)化數(shù)據(jù)庫(kù)中。這就使得核電領(lǐng)域數(shù)據(jù)的格式復(fù)雜多樣,結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)混雜。
2、數(shù)據(jù)要求保存周期長(zhǎng)
按照《核電文件檔案管理要求》的附錄“核電文件歸檔范圍和保管期限”中所提到的保管期限來(lái)看,基本上所有的文件都要求至少長(zhǎng)期保存,其中一大部分還要求永久保存。
3、數(shù)據(jù)要求具有抗破壞性
《核電文件檔案管理要求》的7.4.5.3中還明確提到“數(shù)據(jù)備份應(yīng)該考慮到自然災(zāi)害、人為破壞和其它意外情況等因素,采取可靠的備份措施,例如不同媒體的異地備份”。自然災(zāi)害很好理解,指的是水、火以及地震等災(zāi)難;所謂的人為破壞就是軟破壞,主要是指的人為所造成的數(shù)據(jù)破壞,如對(duì)數(shù)據(jù)進(jìn)行有意或者無(wú)意的修改、刪除等操作;其它意外情況范圍較廣,但也最容易發(fā)生,如計(jì)劃內(nèi)或者計(jì)劃外的重啟所引起的磁盤(pán)電流沖擊而導(dǎo)致的數(shù)據(jù)缺失等。
三、核電信息化數(shù)據(jù)的容災(zāi)備份現(xiàn)狀
核電領(lǐng)域?qū)?shù)據(jù)的備份一直很重視,但由于選擇的產(chǎn)品和備份技術(shù)不同,主要存在以下幾個(gè)問(wèn)題:
1、數(shù)據(jù)備份的實(shí)時(shí)性不強(qiáng)
大部分核電單位對(duì)數(shù)據(jù)采用了全備、增量、差異的備份方式,建立起了備份的作業(yè)。這就使得數(shù)據(jù)的備份行為按照作業(yè)的計(jì)劃執(zhí)行,備份作業(yè)在什么時(shí)候開(kāi)始,數(shù)據(jù)就在什么時(shí)候備份。這就意味著備份的行為是存在著明顯的備份時(shí)間窗口的,而這種備份時(shí)間窗口將會(huì)直接導(dǎo)致數(shù)據(jù)的丟失。假設(shè)每周日做全備而周一到周六每天的下午6點(diǎn)做增量備份(如圖1),那么如果在周三的5點(diǎn)59分?jǐn)?shù)據(jù)出現(xiàn)問(wèn)題的話,此時(shí)最近的恢復(fù)點(diǎn)是周二6點(diǎn)的恢復(fù)點(diǎn),這就意味著將要丟失近24小時(shí)的數(shù)據(jù)。
圖1
2、業(yè)務(wù)連續(xù)性不強(qiáng)
數(shù)據(jù)的作用是提供給應(yīng)用進(jìn)行處理和展現(xiàn),所以數(shù)據(jù)的好壞將直接決定了應(yīng)用是否正常。對(duì)于傳統(tǒng)的全備、增量、差異等備份方式來(lái)說(shuō),想使用備份數(shù)據(jù)的時(shí)候必須經(jīng)歷一個(gè)數(shù)據(jù)恢復(fù)的過(guò)程。同樣以周日做全備,周一到周六的每天下午6點(diǎn)做增量備份為例。如果當(dāng)前的時(shí)間是周六的上午,源數(shù)據(jù)的存儲(chǔ)介質(zhì)損壞,導(dǎo)致源數(shù)據(jù)丟失,此時(shí)在修復(fù)存儲(chǔ)介質(zhì)后要首先恢復(fù)上周日的全備份,然后依次恢復(fù)周一到周五的增量,我們且不說(shuō)周五下午6點(diǎn)到周六上午的數(shù)據(jù)不能被恢復(fù)。就是周一到周五能恢復(fù)的數(shù)據(jù)也要花費(fèi)大量的時(shí)間成本,在此期間應(yīng)用無(wú)法獲得正常數(shù)據(jù)的支撐,業(yè)務(wù)將會(huì)陷入癱瘓狀態(tài)。
3、不具備防破壞能力。
對(duì)于數(shù)據(jù)的破壞,我們?cè)谇懊娣殖闪俗匀黄茐、軟破壞以及意外破壞。?duì)于自然破壞來(lái)說(shuō)一般采用異地備份的方式,但是對(duì)于軟破壞以及意外破壞傳統(tǒng)的備份方式卻很難解決。我們還是以周日做全備,周一到周六的每天下午6點(diǎn)做增量備份為例。假設(shè)當(dāng)前時(shí)間是在周五的,上午8點(diǎn)到下午4點(diǎn)期間往數(shù)據(jù)庫(kù)中錄入了2萬(wàn)條索引記錄,而在4點(diǎn)01分,這些數(shù)據(jù)因?yàn)橐粭lSQL語(yǔ)句寫(xiě)錯(cuò)被誤刪除。那么此時(shí)離當(dāng)前時(shí)間最近的是周四下午6點(diǎn)的恢復(fù)點(diǎn),那時(shí)候是還沒(méi)有這2萬(wàn)條數(shù)據(jù)的。這就意味著被誤刪的2萬(wàn)條數(shù)據(jù)將永久丟失。
而對(duì)于意外情況,如重啟所造成的數(shù)據(jù)缺失而導(dǎo)致數(shù)據(jù)庫(kù)置疑以及無(wú)法加載時(shí),也只能恢復(fù)到上一個(gè)恢復(fù)點(diǎn),而這個(gè)恢復(fù)點(diǎn)距離故障點(diǎn)有很大的時(shí)間窗口,這就導(dǎo)致了破壞無(wú)法被完全修復(fù)。
四、核電信息化數(shù)據(jù)可靠災(zāi)備的建設(shè)目標(biāo)
綜合核電領(lǐng)域信息化數(shù)據(jù)的特點(diǎn),在進(jìn)行容災(zāi)備份時(shí),需要重點(diǎn)實(shí)現(xiàn)以下建設(shè)目標(biāo):
1、各服務(wù)器上重要數(shù)據(jù)零丟失
對(duì)數(shù)據(jù)進(jìn)行自動(dòng)監(jiān)控,連續(xù)捕獲和備份數(shù)據(jù)變化,只要數(shù)據(jù)發(fā)生變化,便實(shí)時(shí)、準(zhǔn)確的備份下來(lái)。保證了數(shù)據(jù)的安全,一旦出現(xiàn)數(shù)據(jù)丟失或破壞,可以迅速的從備份機(jī)上把數(shù)據(jù)恢復(fù)回來(lái)。
2、災(zāi)難發(fā)生后進(jìn)行迅速接管和逆向同步
當(dāng)主服務(wù)器出現(xiàn)意外宕機(jī)時(shí),備份機(jī)可以在一分鐘之內(nèi)接管主服務(wù)器的IP,提供對(duì)外的所有服務(wù),保證了核心業(yè)務(wù)連續(xù)性,可以提供365天7*24小時(shí)的業(yè)務(wù)不間斷的保護(hù)。
災(zāi)難發(fā)生后,原有系統(tǒng)必須盡快恢復(fù)。恢復(fù)時(shí)執(zhí)行與數(shù)據(jù)容災(zāi)復(fù)制相反的過(guò)程,即從災(zāi)備中心逆向同步到主數(shù)據(jù)中心,同步完成即可做應(yīng)用切換,整個(gè)系統(tǒng)恢復(fù)到原有狀態(tài)。
3、數(shù)據(jù)可進(jìn)行任意時(shí)間數(shù)據(jù)恢復(fù)
可按任意操作步數(shù)或時(shí)間點(diǎn)進(jìn)行數(shù)據(jù)快速恢復(fù),回到數(shù)據(jù)庫(kù)的任何狀態(tài),從而能夠找回誤刪或者損壞前的數(shù)據(jù)。在恢復(fù)的過(guò)程中不但保證了數(shù)據(jù)的完整型,而且能保證事件的完整性。解決了數(shù)據(jù)邏輯錯(cuò)誤。
4、數(shù)據(jù)的異地容災(zāi)
響應(yīng)《核電文件檔案管理要求》,對(duì)重要數(shù)據(jù)進(jìn)行異地容災(zāi),異地的容災(zāi)場(chǎng)地和生產(chǎn)中心需要不在同一個(gè)電網(wǎng)、不在同一個(gè)江河流域、不在同一個(gè)地震帶,相隔300公里以上。
公司簡(jiǎn)介 | 媒體優(yōu)勢(shì) | 廣告服務(wù) | 客戶寄語(yǔ) | DOIT歷程 | 誠(chéng)聘英才 | 聯(lián)系我們 | 會(huì)員注冊(cè) | 訂閱中心
Copyright © 2013 DOIT Media, All rights Reserved. 北京楚科信息技術(shù)有限公司 版權(quán)所有.