戴爾科技集團大中華區(qū)數(shù)據(jù)保護產(chǎn)品技術(shù)總監(jiān)李巖介紹數(shù)據(jù)保護難題的應(yīng)對方式。
提升效率首先能想到的還是消除重復(fù)數(shù)據(jù),比較高級的版本是常用在Avamar和Data Domain上的可變長消重(Variable-Length Deduplication)算法,它按照一定規(guī)則將文件打散成不同大小的數(shù)據(jù)塊后,記錄數(shù)據(jù)塊的哈希值,在較大的維度下,如果出現(xiàn)同樣哈希值的數(shù)據(jù)塊就觸發(fā)消重,以此來減少需要備份、傳輸和恢復(fù)的數(shù)據(jù)。
作為高級的數(shù)據(jù)消重技術(shù),可變長消重(Variable-Length Deduplication)的效率更高一些,可以大大減少實際需要備份的數(shù)據(jù)量,該技術(shù)現(xiàn)在是戴爾的專利技術(shù)。
提升效率還能想到的是直接提升性能。戴爾的直接備份技術(shù),可以把數(shù)據(jù)從數(shù)據(jù)庫(像Oracle、SQL Server)或者SAP等企業(yè)級核心應(yīng)用直接備份到備份存儲,避免了備份軟件,減少了數(shù)據(jù)傳輸量的同時,也減少了在備份軟件上的投入。
李巖介紹介紹說,在面對100TB左右的大型數(shù)據(jù)庫的時,直接備份技術(shù)相對于傳統(tǒng)備份方式,性能提升了20倍。
面對大量數(shù)據(jù),必須考慮的還有分層技術(shù),出于性能的考慮,需要將常用數(shù)據(jù)的放在更容易訪問的高性能存儲介質(zhì)上,出于成本的考慮,不常用的數(shù)據(jù)放在成本更低的大容量量存儲介質(zhì)上。
數(shù)據(jù)保護系統(tǒng)一般操作起來非常復(fù)雜,為了簡化復(fù)雜度,許多用戶都選擇了專有備份軟硬一體機(PBBA)方案,而且,與存儲市場不同的是,PBBA市場出現(xiàn)了戴爾這種坐擁市場半壁江山的玩家,這是市場成熟的標(biāo)志,說明PBBA在很大程度上解決了用戶在數(shù)據(jù)保護方面的多數(shù)需求。
但在李巖看來,這是不夠的,以上幾點只是滿足了原有數(shù)據(jù)基礎(chǔ)設(shè)施的數(shù)據(jù)保護需求,并不能很好地應(yīng)對新變化,比如,新平臺和各種新技術(shù)帶來的挑戰(zhàn),面向此類的保護需求被稱為是現(xiàn)代化的數(shù)據(jù)保護方案。
現(xiàn)代化數(shù)據(jù)保護應(yīng)對新變化
上面提到的解決方案都屬于傳統(tǒng)成熟數(shù)據(jù)保護的能力,現(xiàn)代化的數(shù)據(jù)保護方案其側(cè)重點與傳統(tǒng)數(shù)據(jù)保護有很大不同,兩者是相互補充的關(guān)系,兩者結(jié)合才能應(yīng)對新變化。
所謂現(xiàn)代化數(shù)據(jù)保護,首先就是要支持對云原生環(huán)境的保護,可以保護部署在Kubernetes容器上的應(yīng)用數(shù)據(jù)。
第二點是具備自主保護能力,所謂自主保護是指系統(tǒng)能自動檢測和自動保護工作負(fù)載,無論是在第一平臺還是第二平臺還是在第三平臺上,無論工作負(fù)載是在邊緣還是核心,數(shù)據(jù)保護系統(tǒng)能跟蹤并保護這些工作負(fù)載,與此同時,系統(tǒng)管理員只需進(jìn)行一部分操作。
第三點,業(yè)務(wù)服務(wù)彈性是指恢復(fù)階段,根據(jù)業(yè)務(wù)服務(wù)相關(guān)的軟硬件來自動編排恢復(fù)過程的能力,這些元素可能部署在本地、可能在云上,也可能兩者都有,不論應(yīng)用負(fù)載是傳統(tǒng)數(shù)據(jù)庫應(yīng)用還是虛擬機又或者是容器,無論是不是有Office365,都能基于此提供恢復(fù)策略,減少手動干預(yù)。
最后一點是數(shù)據(jù)服務(wù),其實主要是指怎么利用備份數(shù)據(jù)的能力, 能否 讓恢復(fù)過來的數(shù)據(jù)用于測試、開發(fā)或者生產(chǎn),能否在第二副本上挖掘出更多業(yè)務(wù)價值,也就是說,數(shù)據(jù)保護也要具備服務(wù)于業(yè)務(wù)的能力,能產(chǎn)出價值的能力。
這是戴爾對于現(xiàn)代化數(shù)據(jù)保護的看法,也基本涵蓋了數(shù)據(jù)保護最新的發(fā)展趨勢。
結(jié)合了傳統(tǒng)成熟與新的現(xiàn)代化的數(shù)據(jù)保護方案
戴爾將數(shù)據(jù)保護分為經(jīng)典成熟的數(shù)據(jù)保護和現(xiàn)代化的數(shù)據(jù)保護兩大類。許多傳統(tǒng)數(shù)據(jù)保護廠商大多仍停留在成熟的市場上,對新的現(xiàn)代化應(yīng)用部分涉獵較少。而許多新崛起的數(shù)據(jù)保護公司基本能力又只是構(gòu)建在現(xiàn)代化數(shù)據(jù)保護方面,像戴爾這樣兩部分都有涉及的并不多。
李巖表示,如今仍是以成熟市場為主,現(xiàn)代化數(shù)據(jù)保護的市場規(guī)模很小,但很快將發(fā)生巨大變化,作為企業(yè)IT市場有二十多年經(jīng)驗的老將,李巖認(rèn)為現(xiàn)代化數(shù)據(jù)保護很快將取代傳統(tǒng)成熟市場,成為市場主流。
在李巖看來,許多成熟市場的玩家對新平臺支持欠佳,一些數(shù)據(jù)保護廠商為了適應(yīng)現(xiàn)代化做的改變,往往只是在原有架構(gòu)上加入新東西,這會讓架構(gòu)體系變得更加臃腫且效率低下。同樣作為成熟市場玩家的戴爾則認(rèn)為,現(xiàn)代化的數(shù)據(jù)保護必須用現(xiàn)代化的工具開發(fā),要能快速迭代快速部署。
戴爾強調(diào)自己既有傳統(tǒng)市場的積累,在新的市場上也打開了正確的方式,作為數(shù)據(jù)保護市場最有發(fā)言權(quán)的廠商,作為市場上數(shù)據(jù)保護方案最齊全的廠商,戴爾給出了企業(yè)數(shù)據(jù)保護的參考性建議。
企業(yè)做數(shù)據(jù)保護的一點指導(dǎo)思路
企業(yè)如何做數(shù)據(jù)保護,哪些數(shù)據(jù)需要哪些保護要區(qū)別對待,不能胡子眉毛一把抓。
首先,要防范新聞上經(jīng)常報道的刪庫跑路事件,可以選擇容災(zāi)方案來應(yīng)對,戴爾建議60%的應(yīng)用要做容災(zāi),容災(zāi)方案除了可以防止刪庫跑路事件,還能防范各種意外,包括自然災(zāi)害還有硬件故障。
其次,大多是情況下,戴爾建議包括從邊緣、核心到云的所有企業(yè)應(yīng)用,都要做備份。有許多數(shù)據(jù),建議至少有一份拷貝,這是最基本的防范措施。
以上兩點大部分廠商也都能做到,但在防范比較高端的勒索軟件和黑客入侵方案方面,差別就比較大了。
從李巖的介紹中了解到,許多廠商是靠磁帶來隔離勒索軟件的,效果很差,問題很多,而戴爾提供的則是Cyber Recovery,Cyber Recovery非常特別,這是因為許多勒索病毒都非常狡猾。
勒索病毒通常都有潛伏期,并不是在攻入后就馬上動手,讓人崩潰的是,動手攻擊的時候還會有試探性的動作。比如,第一輪攻擊完成后,黑客掌握了更多信息,在未來某個時間還有可能來第二次更有針對性的攻擊。
李巖介紹說,有用戶在第一輪受到攻擊后用備份服務(wù)器做了恢復(fù),而在受到第二次攻擊中將備份服務(wù)器攻陷,所幸,該用戶使用了DataDomain,DataDomain先對備份系統(tǒng)做了恢復(fù),而后又對整個數(shù)據(jù)做了恢復(fù)。
這家用戶體驗到勒索病毒的威力之后,如今選擇用戴爾的Cyber Recovery來專門應(yīng)對勒索病毒,以此防范關(guān)鍵業(yè)務(wù)淪陷。
Cyber Recovery來自美國“避風(fēng)港”計劃,“避風(fēng)港”計劃是美國銀行家協(xié)會聯(lián)合9家金融機構(gòu)和協(xié)會成立的非盈利組織,它的目標(biāo)是防止金融行業(yè)數(shù)據(jù)受到威脅,保護美國作為金融帝國的地位,“避風(fēng)港”計劃制定了一系列標(biāo)準(zhǔn),而戴爾憑借Cyber Recovery成為目前唯一認(rèn)證的解決方案供應(yīng)商。
相比之下,依靠磁帶的方式雖然也可以防范勒索軟件,但受限于性能,很難在磁帶中查找“干凈的數(shù)據(jù)”,或者需要花很長時間找回并恢復(fù)數(shù)據(jù),但是這種等待時間是關(guān)鍵業(yè)務(wù)不能接受的。
擺脫混亂無序,構(gòu)建面向未來的數(shù)據(jù)保護架構(gòu)
戴爾數(shù)據(jù)保護產(chǎn)品家族產(chǎn)品很多也很全,堪比百科全書式的那種全,因為每一個產(chǎn)品技術(shù)都對應(yīng)一個時期的一個需求,這導(dǎo)致戴爾數(shù)據(jù)保護超全的產(chǎn)品線,在功能特性上甚至?xí)行┰S重復(fù),這恰巧說明了數(shù)據(jù)保護的復(fù)雜性。
不過,對于企業(yè)如何構(gòu)建數(shù)據(jù)保護方案,李巖也給出了一些有參考價值點的思路。他表示,數(shù)據(jù)保護應(yīng)該從下向上開始建,要建立一個統(tǒng)一的數(shù)據(jù)保護存儲池。
由于歷史原因,真實環(huán)境下的許多備份系統(tǒng)都是豎井式的,可能數(shù)據(jù)庫有一個備份系統(tǒng),虛擬機有一個備份系統(tǒng),NAS還有一個備份系統(tǒng),備份管理復(fù)雜度非常高,對于備份資產(chǎn)狀態(tài)缺乏全局洞察。
唯一比較合理的解決方案是建立一個統(tǒng)一的備份存儲層,然后在此基礎(chǔ)上做數(shù)據(jù)級容災(zāi),最后再做最高級的隔離備份Cyber Recovery。統(tǒng)一的備份存儲層一方面支持所有平臺的協(xié)議,一方面對接原有所有的備份軟件和應(yīng)用程序。
這樣一來,就能在兼顧現(xiàn)有的備份體系的同時,為未來把業(yè)務(wù)都過渡到統(tǒng)一數(shù)據(jù)保護體系打下基礎(chǔ)。
業(yè)務(wù)系統(tǒng)聚焦如何實現(xiàn)業(yè)務(wù)邏輯,聚焦如何優(yōu)化效率,而數(shù)據(jù)保護系統(tǒng)的職責(zé)是預(yù)防可能出現(xiàn)的數(shù)據(jù)丟失問題,系統(tǒng)業(yè)務(wù)連續(xù)性的問題,可以說,是數(shù)據(jù)保護保障了業(yè)務(wù)創(chuàng)新平臺的平穩(wěn)運行。
結(jié)語
從上文介紹中,相信大家都意識到了數(shù)據(jù)保護的許多特殊性,對于數(shù)據(jù)保護現(xiàn)在存在的問題,以及未來發(fā)展方向有了更新的認(rèn)識。
從李巖的介紹中了解到,即便是對于數(shù)據(jù)保護技術(shù)最熱衷的金融行業(yè)用戶,也有人心存僥幸心理,不過,因為時有發(fā)生但并不見諸報道的事故有很多,并沒有引起太多關(guān)注,而接下來,金融行業(yè)將是戴爾數(shù)據(jù)保護業(yè)務(wù)的重點市場。
數(shù)據(jù)保護需要技術(shù)產(chǎn)品,更需要見過大場面的經(jīng)驗,對于戴爾來說,作為久經(jīng)考驗的數(shù)據(jù)保護市場的頂級玩家,在戴爾眼里,最大的問題可能不是數(shù)據(jù)保護技術(shù)方案本身,而是用戶的僥幸心理。