以下為現(xiàn)場(chǎng)實(shí)錄:
今天這個(gè)會(huì)議我會(huì)先從數(shù)據(jù)保護(hù)這個(gè)角度來(lái)講,為什么呢?因?yàn)槲矣X(jué)得這幾年是IT去做演進(jìn)或者是變革時(shí)期一個(gè)非常關(guān)鍵的階段,在IT的演進(jìn)和變革當(dāng)中,數(shù)據(jù)顯得非常的重要,怎么能夠把你的數(shù)據(jù)在這種變化的階段,以一種新的方式,一種低成本、高效率的方式把它保護(hù)起來(lái),使你沒(méi)有后顧之憂去發(fā)展你的業(yè)務(wù)的時(shí)候,那這個(gè)解決方案顯得尤為重要,所以我們今天這個(gè)CIO活動(dòng)開(kāi)場(chǎng)就由我來(lái)講一下,新一代的數(shù)據(jù)保護(hù)的解決方案。
我在講數(shù)據(jù)保護(hù)解決方案之前,大家可以先來(lái)看一看數(shù)據(jù)中心的演變的趨勢(shì)。之前,我們傳統(tǒng)的數(shù)據(jù)中心都是以物理環(huán)境,或者物理級(jí)的組合搭建物理中心,虛擬化應(yīng)用的產(chǎn)生,讓大家意識(shí)到我要怎么樣去做資源的整合,去做虛擬化的部署。這種虛擬化的部署里面,可能又發(fā)展到說(shuō)我們要用標(biāo)準(zhǔn)化的部署的方式來(lái)應(yīng)對(duì)這種資源的整合。然后,后一步,可能就是從虛擬化到云計(jì)算,我相等可能目前有很多的企業(yè),或者是組織都已經(jīng)在考慮到云計(jì)算。那云計(jì)算帶來(lái)一個(gè)對(duì)IT的最大的影響是什么呢?就是意味著我們從一個(gè)技術(shù)支持的部門(mén),再轉(zhuǎn)向一種服務(wù)部門(mén)。在新的從支持部門(mén)向服務(wù)部門(mén)去轉(zhuǎn)化和演進(jìn)的過(guò)程當(dāng)中,對(duì)你現(xiàn)有的IT的架構(gòu),IT的存儲(chǔ)架構(gòu),或者你的部署,或者說(shuō)你的要求,都在改變,有可能你需要這種瞬間的響應(yīng),你要考慮你的成本,因?yàn)槌杀緵Q定你的服務(wù)水平和服務(wù)利潤(rùn)的非常重要的方面。另外一個(gè)方面,就是你如何面對(duì)IT轉(zhuǎn)向面向服務(wù)過(guò)程當(dāng)中出現(xiàn)的不可預(yù)測(cè)性,相應(yīng)的,我們就會(huì)有不同的技術(shù),或者是不同的方案,來(lái)幫助大家去應(yīng)對(duì)。最后,大家要是發(fā)展到共有云,所有私有云,現(xiàn)在大家談的比較多的。在現(xiàn)有的演進(jìn)的趨勢(shì)里面,作為IT的決策者,大家在考慮什么?關(guān)心什么?在想什么?我接下來(lái)會(huì)給大家分享一下我們有一個(gè)叫ESG的企業(yè)戰(zhàn)略調(diào)查機(jī)構(gòu)給大家做的調(diào)查數(shù)據(jù)和分析在這種演進(jìn)的過(guò)程當(dāng)中,他去拜訪了國(guó)外的600多個(gè)企業(yè)的IT決策者,大家可以做以下這些選項(xiàng),可以選三項(xiàng),從三項(xiàng)里面,他就問(wèn),在你未來(lái)12—18個(gè)月之間,你對(duì)貴公司的IT發(fā)展決策,哪三個(gè)因素是影響最大的?根據(jù)這個(gè)調(diào)查結(jié)果我們可以看到,42%的IT的決策者選擇了成本削減的舉措。另外還有33%的決策者選擇的是業(yè)務(wù)流程的改進(jìn)舉措。還有相應(yīng)的就是在安全和風(fēng)險(xiǎn)管理類(lèi)的業(yè)務(wù)措施的舉措??梢钥吹?,從這個(gè)調(diào)查里面我們會(huì)發(fā)現(xiàn),很多的CIO都在考慮什么?成本,第一考慮組織成本,第二就是改進(jìn)。從這個(gè)調(diào)查的反饋里面也可以看到,當(dāng)前我們數(shù)據(jù)中心也在面臨一些挑戰(zhàn),第一個(gè)挑戰(zhàn)是來(lái)自于數(shù)據(jù)的快速的增長(zhǎng),數(shù)據(jù)快速的增長(zhǎng)肯定會(huì)帶來(lái)你成本的無(wú)限制的增加,會(huì)面臨很多的決策者去面臨成本的壓力和怎么去解決。另外,這種數(shù)據(jù)的快速增長(zhǎng),就導(dǎo)致你的系統(tǒng)要有一個(gè)非常好的系統(tǒng)性能去應(yīng)對(duì)和處理這些數(shù)據(jù),我們還要考慮一些關(guān)于這種擴(kuò)展性的,我是不是就可以小規(guī)模起步,通過(guò)非常低成本的投入,通過(guò)先進(jìn)的架構(gòu),按我的需要做模樣和性能同步的提升,在可擴(kuò)展性上,也可以幫我降低一些成本,應(yīng)對(duì)以后未來(lái)不可預(yù)測(cè)要發(fā)生的這些事情呢?這些可能都是我們目前數(shù)據(jù)中心面對(duì)的一些挑戰(zhàn)。還有一些就是我們的網(wǎng)絡(luò)資源啊,包括我們對(duì)于數(shù)據(jù)生命周期的保護(hù),我產(chǎn)生這么多的數(shù)據(jù),哪些數(shù)據(jù)我需要把它放在我們比較昂貴的,需要快速響應(yīng)的主存上,有那些數(shù)據(jù)可以放在二級(jí)存儲(chǔ)上,是不是有些數(shù)據(jù)可以考慮資源備份的解決方案。對(duì)于高達(dá)幾十年的數(shù)據(jù)保留,我是不是可以考慮磁帶,做磁帶的存放。所有這些數(shù)據(jù),也是降低用戶成本的一種手段。
提到第一個(gè)挑戰(zhàn),數(shù)據(jù)中心的數(shù)據(jù)量的增長(zhǎng),但是這種增長(zhǎng)到底是一個(gè)什么樣的比例呢?這個(gè)ESG也去訪問(wèn)了一些企業(yè)IT的決策者,他發(fā)現(xiàn),每年大概有42%的人選的是每年數(shù)據(jù)量的增長(zhǎng)是在11%—20%,還有是選擇每年超過(guò)40%的有30%的人去選擇。從這個(gè)方面可以看到什么呢?數(shù)據(jù)量的快速的增長(zhǎng),是每一個(gè)企業(yè)或者大多數(shù)的企業(yè)都不得不去面對(duì)的一個(gè)問(wèn)題,要去解決的一個(gè)問(wèn)題。相應(yīng)的就是,我們存儲(chǔ)開(kāi)支該怎么辦?他就做另外一個(gè)調(diào)查,在你未來(lái)12—18個(gè)月之內(nèi),你的企業(yè)或者公司在下列哪些數(shù)據(jù)存儲(chǔ)的領(lǐng)域進(jìn)行重點(diǎn)投資呢?第一個(gè)選擇有36%的人是選擇的是備份和恢復(fù)的解決方案,要進(jìn)行重點(diǎn)的投資,第二個(gè),有24%的人選擇了異地災(zāi)難恢復(fù)的數(shù)據(jù)復(fù)制解決方案,另外還有23%的人考慮購(gòu)買(mǎi)新的SAN存儲(chǔ)系統(tǒng),有18%的人考慮投資數(shù)據(jù)削減技術(shù)。從這個(gè)上面可以看到,我們第一個(gè)作為IT的決策者,考慮是怎么樣把數(shù)據(jù)有效地去做備份和恢復(fù)。另外一個(gè)需要關(guān)注的是18%的人會(huì)考慮使用數(shù)據(jù)縮減技術(shù),也就是我們今天討論的數(shù)據(jù)刪除的技術(shù)。
談到數(shù)據(jù)保護(hù),他們又做了另外一個(gè)調(diào)查,在做數(shù)據(jù)保護(hù)里面,這個(gè)領(lǐng)域之內(nèi),貴公司現(xiàn)在面臨的主要的難題有哪些呢?有13%的決策者選擇了如何去滿足數(shù)據(jù)保護(hù)的容量要求,這很關(guān)鍵,因?yàn)槭裁?因?yàn)閿?shù)據(jù)的快速的增長(zhǎng),對(duì)備份來(lái)講帶來(lái)的壓力會(huì)更大,為什么呢?因?yàn)榇蠹叶贾?,備份?shí)際上它的數(shù)據(jù)量是冰山下的非常龐大的一角,你可能看到你的主存的數(shù)據(jù)只是冰山上冒出來(lái)的小山,但是備份是藏在海水里面非常龐大的一塊,可能是五倍,可能十倍于原來(lái)主存的數(shù)據(jù),所以你數(shù)據(jù)量快速的激增,帶來(lái)最讓大家頭疼的問(wèn)題,就是我的備份該怎么做?我的數(shù)據(jù)這么大的容量,我采取什么樣的解決方案,在我能夠承受的成本范圍之內(nèi)做備份。另外,這么大的數(shù)據(jù),我怎么能夠在我的備份窗口內(nèi)完成備份?而相應(yīng)的,因?yàn)槲覙I(yè)務(wù)的需要,我需要恢復(fù)的時(shí)間還在不斷的去縮小我要很快地把它恢復(fù)過(guò)來(lái),這些都是IT決策者比較頭疼的問(wèn)題。另外一個(gè),有7%的人在考慮什么?不能接受數(shù)據(jù)丟失和宕機(jī)時(shí)間。這是我第一次看到在調(diào)查里面出現(xiàn)的這個(gè)要求,因?yàn)閭鹘y(tǒng)的數(shù)據(jù)備份領(lǐng)域之內(nèi),大家都認(rèn)為備份是離線的數(shù)據(jù)保護(hù),這樣對(duì)宕機(jī)的時(shí)間要求就不會(huì)那么苛刻,如果停機(jī),大不了備份做不成,過(guò)一會(huì)重啟再做就行了,但是在新的數(shù)據(jù)中心或者IT架構(gòu)演變的過(guò)程中,大家對(duì)數(shù)據(jù)備份的宕機(jī)時(shí)間和它的可靠性,也提出了非常高的要求。
在這里面我們可以看到,根據(jù)剛才對(duì)IT決策者的幾個(gè)調(diào)查,發(fā)現(xiàn)大家在擔(dān)心什么?成本,對(duì)數(shù)據(jù)保護(hù)方案呢?容量節(jié)省。那如何去應(yīng)對(duì)呢?你可以看到,我們現(xiàn)在越來(lái)越多的重復(fù)數(shù)據(jù)刪除技術(shù)的應(yīng)用在我們的備份系統(tǒng)里面、備份軟件里面、備份的硬件設(shè)備里面,在不斷地會(huì)看到,怎么能看到呢?舉一個(gè)比較簡(jiǎn)單的例子,你可以看到,在目前主流的存儲(chǔ)廠商里面,或者服務(wù)器廠商里面,大家所有的備份系統(tǒng)里面的磁盤(pán)備份系統(tǒng),一定都備份了重復(fù)數(shù)據(jù)刪除功能,已經(jīng)是標(biāo)準(zhǔn)的行業(yè)都必須要具備的功能。但是可能大家部署這種重復(fù)數(shù)據(jù)刪除的方式和實(shí)現(xiàn)的方式會(huì)有些不同,我待會(huì)兒會(huì)給大家做一個(gè)詳細(xì)的介紹。那什么是重復(fù)數(shù)據(jù)刪除呢?是真的把數(shù)據(jù)刪掉了嗎?不是,它只是把備份過(guò)來(lái)的數(shù)據(jù)拆分成不同的塊,拆成塊以后,我在里面做比對(duì),我只保存一個(gè),另外那些領(lǐng)域的塊的東西我放在地圖里面,我可以找到它,通過(guò)這種方式,我可以實(shí)現(xiàn)容量的節(jié)省。因?yàn)閭浞莸牟呗院蛡浞莸谋Wo(hù)的機(jī)制,從它的備份策略上可以看到,我今天可能常見(jiàn)的備份策略,我每周做一次全備份,每天做一次增量。也就是說(shuō)我今天的數(shù)據(jù)明天要備、后天要備,大后天還要備,我備份至少三個(gè)月、半年、一年,甚至更長(zhǎng),你自己就可想而知,這里面重復(fù)的數(shù)據(jù)量有多大,通過(guò)重復(fù)數(shù)據(jù)刪除技術(shù),你可以感受到里面的冗余的數(shù)據(jù)塊,我可以知道這個(gè)東西在這兒,這就是重復(fù)技術(shù)刪除原理。在業(yè)內(nèi)比較標(biāo)準(zhǔn)的重復(fù)數(shù)據(jù)刪除的有效率是多少?20倍,是怎么來(lái)的?我們按照通常的備份策略,每周做一次全備份,每天做一次增量,連續(xù)八周下來(lái)去做,保留這個(gè)數(shù)據(jù)保存的周期,可以保存六周,它就可以實(shí)現(xiàn)20:1的重復(fù)數(shù)據(jù)刪除的效率,這是一個(gè)業(yè)界都認(rèn)為比較標(biāo)準(zhǔn)的重復(fù)數(shù)據(jù)刪除的算法。
所以說(shuō)在另外一個(gè)調(diào)查里面,IT使用者在考慮重復(fù)數(shù)數(shù)據(jù)刪除作為主要的因素考慮的時(shí)候,你認(rèn)為重復(fù)數(shù)據(jù)刪除的方案應(yīng)該具備哪些因素對(duì)你來(lái)說(shuō)是最重要的?發(fā)現(xiàn)又是成本,解決方案的成本,45%的人選擇解決方案的成本,37%的決策者選擇的是怎么樣能夠非常容易地部署它,并且使用它,33%的人選擇了我怎么樣能夠把它的備份和恢復(fù)的性能的影響,這是我考慮的一個(gè)很重要的因素。另外一個(gè),就是28%的人選擇了對(duì)備份流程現(xiàn)有的整合。
我們可以看到,目前因?yàn)槊恳患叶加凶约旱闹貜?fù)數(shù)據(jù)刪除的技術(shù),目前市場(chǎng)上有幾種主流的技術(shù),我大概做了一個(gè)總結(jié),第一種是備份軟件,就是我把重復(fù)數(shù)據(jù)刪除的技術(shù)和功能部署在備份軟件上,通過(guò)備份軟件做備份的時(shí)候,從備份軟件的角度我就開(kāi)始做重復(fù)數(shù)據(jù)刪除。第二種是VTL,就是虛擬帶庫(kù),我傳統(tǒng)的虛擬帶庫(kù)里面,除了做虛擬帶庫(kù),又加了額外的重復(fù)數(shù)據(jù)刪除的功能。還有網(wǎng)關(guān)的應(yīng)用,我給你一個(gè)重復(fù)數(shù)據(jù)刪除的網(wǎng)關(guān),你下面隨便你使用一個(gè)我要求,或者一個(gè)標(biāo)準(zhǔn)化的磁盤(pán)備份設(shè)備,你把它掛上去,你就可以做重復(fù)數(shù)據(jù)刪除了。另外一種,就是我給你提供一種非常靈活的部署的方式,但是也是在設(shè)備端,你可以基于一種NAS的方式去做重復(fù)數(shù)據(jù)刪除,也可以是VTL的數(shù)據(jù)做重復(fù)數(shù)據(jù)刪除,這是目前主流的四種重復(fù)數(shù)據(jù)刪除的方式。
哪種方式最好呢?老實(shí)說(shuō),我覺(jué)得沒(méi)有絕對(duì)的最好,因?yàn)檫@四種方式每一種方式都有各自的優(yōu)缺點(diǎn),關(guān)鍵是說(shuō)這四種方式里面,對(duì)你的環(huán)境來(lái)講,對(duì)你的需求來(lái)講,哪種方式會(huì)更適合你,那我們接下來(lái)可以看一下,這四種方式,或者說(shuō)從部署的方式做重復(fù)數(shù)據(jù)刪除,消除的時(shí)間上,或者各種方式上,那么它的優(yōu)缺點(diǎn)在什么地方?大家也可以對(duì)號(hào)入座一下,如果你采用重復(fù)數(shù)據(jù)刪除系統(tǒng)的話,這些優(yōu)缺點(diǎn)是不是也要考慮?哪種對(duì)你來(lái)講更重要,更有決策性。
第一,我們首先看重復(fù)數(shù)據(jù)刪除部署的方式,就是你在哪里做重復(fù)數(shù)據(jù)刪除?第一個(gè),應(yīng)用源端,你的服務(wù)器,你應(yīng)用的服務(wù)器,比如你一臺(tái)文件的服務(wù)器,你數(shù)據(jù)的服務(wù)器,就意味著什么呢?從所有的備份源端出來(lái)的數(shù)據(jù),就是經(jīng)過(guò)重復(fù)數(shù)據(jù)刪除的。第二種就是在被備份的起始端,我可以把重復(fù)數(shù)據(jù)備份在備份服務(wù)器上,我所有經(jīng)備份服務(wù)器讀出來(lái)的數(shù)據(jù),都是經(jīng)過(guò)備份服務(wù)器刪除的。還有一種,我不想在備份源端或者備份服務(wù)器端有任何的改變,或者任何性能的影響,是不是直接給我一個(gè)設(shè)備,這臺(tái)備份數(shù)據(jù)上就具備了重復(fù)數(shù)據(jù)刪除功能,我們把這個(gè)叫做目標(biāo)端的重復(fù)數(shù)據(jù)刪除。我今天把備份數(shù)據(jù)刪除備份在源端呢?經(jīng)過(guò)最開(kāi)始的地方,就可以把重復(fù)數(shù)據(jù)刪除了,帶來(lái)的好處,第一個(gè),重復(fù)數(shù)據(jù)刪除的效率很高,另外,備份窗口會(huì)節(jié)省。因?yàn)槟銖脑炊松弦呀?jīng)判別出來(lái)這個(gè)數(shù)據(jù)已經(jīng)開(kāi)始把它做了一個(gè)壓縮,或者做了數(shù)據(jù)縮減,就出來(lái),所以你備份到經(jīng)過(guò)網(wǎng)絡(luò)上的窗口都會(huì)變短,對(duì)你帶寬的要求,對(duì)你時(shí)間窗口的要求都會(huì)降低,這是備份源端的消除。不好的地方在哪呢?它有限制,你怎么去辨別說(shuō)我一天過(guò)來(lái)的備份服務(wù)器上的數(shù)據(jù)有這么多,如果我今天應(yīng)用源端上有一個(gè)非常龐大的系統(tǒng),我每天都要去掃描它,看它有沒(méi)有重復(fù)的進(jìn)來(lái),你掃描的時(shí)間一定會(huì)變得很長(zhǎng),所以在這種環(huán)境里面,大家更傾向于在一些小規(guī)模部署的時(shí)候,一臺(tái)服務(wù)器上的數(shù)據(jù)量,或者數(shù)據(jù)庫(kù)不要太大,你可以選擇這個(gè)方式。但是如果你的服務(wù)器上的數(shù)據(jù)額很高的話,我勸你不要選擇。但是在一些遠(yuǎn)程分支機(jī)構(gòu)里面,你的數(shù)據(jù)量很小,也不是很大,你采用這種方式,我只需要部署一個(gè)重復(fù)數(shù)據(jù)刪除的源端在上面,就可以實(shí)現(xiàn)源端節(jié)省數(shù)據(jù),這是一個(gè)非常經(jīng)濟(jì)的解決方案,來(lái)解決你的問(wèn)題。
另外一種方式,我今天說(shuō)我不想在我的備份服務(wù)器源端做任何的重復(fù)數(shù)據(jù)刪除,做一些可能會(huì)增大我服務(wù)器性能負(fù)荷的一些事情,我是不是可以把它備份在備份服務(wù)器端呢?也可以,你可以把它備份在備份服務(wù)器端,從這里出來(lái)的數(shù)據(jù),再把它備份到后面的設(shè)備上去。這種方式呢,目前來(lái)講,能夠做到這種方式的廠家并不是很多,HP可以做到。還有一種,就是用戶說(shuō)了,我這樣吧,我真的不想在我所有前端的備份的服務(wù)器上、應(yīng)用源上做任何的可能會(huì)增加我性能、增加我負(fù)荷的事情,你給我一個(gè)設(shè)備,這個(gè)設(shè)備自己去做重復(fù)數(shù)據(jù)刪除,也可以實(shí)現(xiàn)容量的節(jié)省,也可以實(shí)現(xiàn)低帶寬、異地的自動(dòng)化的災(zāi)難恢復(fù),這種最好的選擇就是把它提供一個(gè)重復(fù)數(shù)據(jù)刪除功能的備份的目標(biāo)設(shè)備,這一部分是基本上每一個(gè)硬件廠商都會(huì)去提供的。HP、IBM,還有其他的做備份服務(wù)器的。備份服務(wù)器部署在目標(biāo)端的一大好處,所有的前端刪除工作全由這臺(tái)服務(wù)器里刪,不會(huì)影響你的架構(gòu),而且對(duì)你的備份設(shè)備有更高的要求,你的可靠性怎么樣,你的恢復(fù)性能是否能夠應(yīng)付我這么大的數(shù)據(jù)量,提出的要求可能會(huì)更高。
這是剛討論完在什么位置刪,各有各的好處,另外,什么時(shí)候開(kāi)始刪?是我數(shù)據(jù)還沒(méi)有寫(xiě)入磁盤(pán)的時(shí)候,還是我把所有的數(shù)據(jù)都接到磁盤(pán)上以后再刪呢?這里面就分為兩種技術(shù),如果是說(shuō)我們?cè)谛袠I(yè)里面去定義它的話,如果說(shuō)我的數(shù)據(jù)在寫(xiě)磁盤(pán)之前就已經(jīng)刪除過(guò)的話,這種刪除我們叫做連線的重復(fù)數(shù)據(jù)刪除,或者叫在線的重復(fù)數(shù)據(jù)刪除,這是一種。另外一種,如果我把這個(gè)數(shù)據(jù)已經(jīng)寫(xiě)入到我的磁盤(pán)之后,備份系統(tǒng)之后,我再去做刪除的話,這叫什么?叫后期處理的重復(fù)數(shù)據(jù)刪除。我們看一看這兩種重復(fù)數(shù)據(jù)刪除技術(shù)的特性,如果你采用連線的重復(fù)數(shù)據(jù)刪除,你會(huì)怎么樣?它的過(guò)程會(huì)非常簡(jiǎn)單,所有的數(shù)據(jù)進(jìn)來(lái)的時(shí)候,就像有一個(gè)大漏斗,就是我先在上面有個(gè)過(guò)濾器,我把很多有益的數(shù)據(jù)塊過(guò)濾到唯一的,寫(xiě)到磁盤(pán)上,這樣寫(xiě)入的數(shù)據(jù)就非常少。這種好處是這個(gè)流程非常簡(jiǎn)單,對(duì)用戶來(lái)說(shuō),你不需要有任何的操作,因?yàn)橹貜?fù)數(shù)據(jù)刪除這件事情不需要你來(lái)掌控,所有的事情都是這臺(tái)設(shè)備自己自動(dòng)完成了,我接觸到這個(gè)數(shù)據(jù)之后,我就可以立即進(jìn)行復(fù)制,因?yàn)槲疫M(jìn)來(lái)的數(shù)據(jù)都做過(guò)重復(fù)數(shù)據(jù)刪除了,所以我馬上可以進(jìn)行復(fù)制。另外就是我所有的數(shù)據(jù)寫(xiě)在磁盤(pán)上了,非常簡(jiǎn)單,都是已經(jīng)進(jìn)行重復(fù)數(shù)據(jù)刪除過(guò)的唯一的數(shù)據(jù)塊和地圖,我恢復(fù)的時(shí)候,只要依據(jù)這個(gè)地圖,就可以把數(shù)據(jù)全部重新組裝回來(lái),非常簡(jiǎn)單,但是有可能在恢復(fù)的時(shí)候影響你的性能,因?yàn)橛幸粋€(gè)組裝,找尋數(shù)據(jù)塊和組裝的過(guò)程。
我們?cè)倏匆幌潞笃谔幚?,就是?xiě)到磁盤(pán)備份系統(tǒng)以后再做重復(fù)數(shù)據(jù)刪除,這種情況下很明顯,你先寫(xiě)進(jìn)磁盤(pán),再?gòu)拇疟P(pán)上把這個(gè)數(shù)據(jù)找到,再做重復(fù)數(shù)據(jù)刪除的動(dòng)作,再把它存下來(lái),又有I/O的發(fā)生,你會(huì)發(fā)現(xiàn)你的重復(fù)數(shù)據(jù)刪除變的很復(fù)雜,因?yàn)檫€有一個(gè)把數(shù)據(jù)接收下來(lái)的流程,還有一個(gè)流程做重復(fù)數(shù)據(jù)刪除去寫(xiě)的流程,之后這些工作都做完之后,還要復(fù)制到遠(yuǎn)程去,這里面規(guī)劃很重要,用戶需要根據(jù)自己窗口的特點(diǎn),怎么樣備份、去除,還有復(fù)制的三個(gè)窗口之間,能夠很好地隔離開(kāi)而不影響,這個(gè)對(duì)用戶來(lái)講,管理難度就加大。它的好處也有好處,因?yàn)槭裁?因?yàn)樗诖疟P(pán)系統(tǒng)上有一個(gè)完整的數(shù)據(jù)本,就是一個(gè)全本放在那兒,我先把數(shù)據(jù)全部都備份下來(lái)了,然后我再刪,所以我有一個(gè)完全的數(shù)據(jù)副本在上面,如果我恢復(fù)的時(shí)候,如果正好你今天恢復(fù)的數(shù)據(jù)正好是昨天備份的,這個(gè)數(shù)據(jù)馬上就抓過(guò)來(lái),不用再做數(shù)據(jù)重組,這是它的好處。但是它的成本相對(duì)比較貴,管理更復(fù)雜,越來(lái)越多的廠商在放棄這種技術(shù),轉(zhuǎn)而把重復(fù)數(shù)據(jù)刪除采用了連線的方式去做,比如說(shuō)像HP、IMM、MC,重復(fù)數(shù)據(jù)刪除的方式都采用這種方式。
在談到刪除的時(shí)候,還有一個(gè),因?yàn)樾阅芎苤匾?,恢?fù)的時(shí)候因?yàn)槟阋堰@個(gè)數(shù)據(jù)重組,根據(jù)地圖重組,抓回來(lái)的這個(gè)過(guò)程,你備份的時(shí)候需要把這個(gè)數(shù)據(jù)塊打散,再去比對(duì),再選唯一的,這里面的性能就是非常關(guān)鍵的因素,在重復(fù)數(shù)據(jù)刪除的目前的解決方案里面,我們又可以看到兩種,一種是單節(jié)點(diǎn)的重復(fù)數(shù)據(jù)刪除解決方案,一種是多節(jié)點(diǎn),什么是單節(jié)點(diǎn)的,就是第一代的重復(fù)數(shù)據(jù)刪除的特點(diǎn),他處理重復(fù)數(shù)據(jù)刪除工作的時(shí)候,只有一個(gè)控制器來(lái)做處理。這樣的話,你升級(jí)的時(shí)候就是一個(gè)很大的問(wèn)題,要不你采用一種網(wǎng)關(guān)的方式,我就不管你后面到底配什么樣的磁盤(pán),我就給你一個(gè)網(wǎng)關(guān),你后面的磁盤(pán)表現(xiàn)的性能跟我沒(méi)關(guān)系,你愛(ài)怎么做怎么做,對(duì)客戶不負(fù)責(zé)任。還有一種,我向你賣(mài)這臺(tái)設(shè)備的時(shí)候,我已經(jīng)針對(duì)控制節(jié)點(diǎn)所能夠處理的磁盤(pán)I/O,或者所能控制的磁盤(pán)限制能力,就已經(jīng)限制好你的磁盤(pán)能夠最大擴(kuò)展到多少啊!可能我在一個(gè)小規(guī)模的節(jié)點(diǎn)里面,內(nèi)存啊,CPU啊,或者什么比較少一些,相應(yīng)能夠掛的磁盤(pán)的空間也比較少,如果頭的控制能力大一些的時(shí)候,我就把后面給你配一個(gè)大一點(diǎn)的磁盤(pán)就能做了,這樣的話,對(duì)用戶來(lái)講,實(shí)際上是一件很不公平的事情。怎么講呢?如果我是小規(guī)模的應(yīng)用,這種方式是無(wú)可厚非的,絕對(duì)可以做,我也推薦去做,因?yàn)槌杀颈容^偏移,但是如果在數(shù)據(jù)中心級(jí)的應(yīng)用,每個(gè)用戶都面臨一種轉(zhuǎn)型,就是從傳統(tǒng)的IT支持部門(mén)逐漸向IT服務(wù)角色轉(zhuǎn)換的時(shí)候,這種對(duì)以后未來(lái)不可預(yù)知性,或者未來(lái)數(shù)據(jù)量增長(zhǎng)很大,我為了考慮到兩三年這種可能會(huì)發(fā)生的事情,我必須要在今天去投入的時(shí)候就要買(mǎi)一個(gè)非常昂貴的時(shí)候,哪怕這個(gè)設(shè)備今天只是存了40個(gè)T的數(shù)據(jù),但是我為此可能會(huì)為以后200T、300T的性能投資這個(gè)設(shè)備,我這個(gè)投入值得嗎?但是如果不投入的話,可能明年這個(gè)設(shè)備就已經(jīng)不能用了,我必須要新購(gòu)設(shè)備。這就是單節(jié)點(diǎn)的時(shí)候,給用戶造成很大的困惑。
相應(yīng)在用戶面臨的挑戰(zhàn)這種情況下,就對(duì)應(yīng)的有一種叫多節(jié)點(diǎn)的重復(fù)數(shù)據(jù)刪除技術(shù)的產(chǎn)生,首先我可以把多個(gè)節(jié)點(diǎn),也就是多個(gè)控制器的重復(fù)數(shù)據(jù)刪除的系統(tǒng)做一個(gè)整體的系統(tǒng)做管理,對(duì)用戶來(lái)講還是一臺(tái)設(shè)備。但是我多節(jié)點(diǎn)的架構(gòu),它可以更多的去線性做數(shù)據(jù)量的吞吐和重復(fù)數(shù)據(jù)刪除的工作,和容量的拓展,簡(jiǎn)單來(lái)講就是橫向擴(kuò)展。就是我可以通過(guò)多控制器的架構(gòu),從小規(guī)模起步,隨著未來(lái)兩年或者三年,或者你不可預(yù)測(cè)數(shù)據(jù)會(huì)漲到什么程度,我先從小規(guī)模,幾十個(gè)TB起,隨著數(shù)據(jù)增長(zhǎng)到200T的時(shí)候,我配備200個(gè)空間,但是我不會(huì)配備相應(yīng)的空間我會(huì)把處理200T的數(shù)據(jù)的性能給你。這樣用戶就可以非常放心的從目前小規(guī)模的配置起步,然后以后隨著你容量拓展的同時(shí),也幫你提升性能,同時(shí)還可以做到附帶均衡。這就是單節(jié)點(diǎn)和多節(jié)點(diǎn)技術(shù)的對(duì)比,實(shí)際上這也是第一代重復(fù)數(shù)據(jù)刪除和第二代重復(fù)數(shù)據(jù)刪除之間的非常大的區(qū)別。
所以在采用傳統(tǒng)的重復(fù)數(shù)據(jù)刪除技術(shù),第一代,大概是在北美市場(chǎng)1999年或者2000年初的時(shí)候就已經(jīng)產(chǎn)生的技術(shù),但是直到現(xiàn)在,大多數(shù)廠商依然在用這種重復(fù)數(shù)據(jù)刪除第一代的技術(shù),這種第一代的技術(shù),數(shù)據(jù)效率會(huì)非常低下,因?yàn)椴捎脝慰刂破鞯募軜?gòu),恢復(fù)的時(shí)候可能要從若干個(gè)數(shù)據(jù)塊里面去做地圖匹配,也沒(méi)有一些更好的優(yōu)化,那你的恢復(fù)性能,通常在第一段的恢復(fù)性能是一個(gè)最大的挑戰(zhàn),所以你經(jīng)??吹胶芏鄰S家發(fā)布一些白皮書(shū),或者一些數(shù)據(jù)的彩頁(yè)的時(shí)候,你只能看到數(shù)據(jù)恢復(fù)不知道是多少。還有,第一代技術(shù)兼容性非常差,大家可以看到,我們重復(fù)數(shù)據(jù)刪除部署的方式,可以備份在備份目標(biāo)段,應(yīng)用服務(wù)其段,在第一代中,這三種地方的部署方式是不兼容的,也就是說(shuō)很多第一代的技術(shù),我在備份源端采用的是一種重復(fù)數(shù)據(jù)刪除的技術(shù),在目標(biāo)端采用的是另外一種。你說(shuō)有沒(méi)有一種方式把備份源端的數(shù)據(jù)傳到數(shù)據(jù)中心去呢,目標(biāo)端上的設(shè)備?對(duì)不起,不能做,因?yàn)閮煞N技術(shù)不一樣,你必須怎么做呢?你把備份服務(wù)端的數(shù)據(jù)恢復(fù)過(guò)來(lái),還原,我再幫你把它送到數(shù)據(jù)中心,你再做重復(fù)數(shù)據(jù)刪除。這樣的話,你就對(duì)你的系統(tǒng)管理的效率非常差,而且你數(shù)據(jù)之間交換的時(shí)候必須有一個(gè)數(shù)據(jù)再重組、再還原的過(guò)程,帶來(lái)一個(gè)最大的問(wèn)題,網(wǎng)絡(luò)帶寬的要求會(huì)非常高。
現(xiàn)在在北美的一個(gè)市場(chǎng)上,大家在講重復(fù)數(shù)據(jù)刪除的時(shí)候,就已經(jīng)在講的是第二代重復(fù)數(shù)據(jù)刪除技術(shù)了,那第二代重復(fù)數(shù)據(jù)刪除技術(shù),就是下一代重復(fù)數(shù)據(jù)刪除技術(shù),它要解決的問(wèn)題就是第一代重復(fù)數(shù)據(jù)刪除所面臨的這些拓展性受限制啊,技術(shù)不兼容的問(wèn)題啊,部署方式非常的僵硬啊,所以在第二代的重復(fù)數(shù)據(jù)刪除里面,我們大家都可以看到,它具備以下幾個(gè)特征:第一,橫向擴(kuò)展。橫向擴(kuò)展簡(jiǎn)單來(lái)講,就是你的容量和性能可以同時(shí)去進(jìn)行擴(kuò)展,所以說(shuō)你的初始的投入就可以從非常便宜又經(jīng)濟(jì)的方式做投入,但是也有未來(lái)你不可預(yù)測(cè)的數(shù)據(jù)的快速的增長(zhǎng)啊,你需要大量的去處理的這個(gè)性能。第二,你重刪系統(tǒng)所具備的高性能。因?yàn)槟愕臄?shù)據(jù)增長(zhǎng)量很快,我本身去做備份這件事情,也要花費(fèi)我很多的服務(wù)器啊,以及網(wǎng)絡(luò)帶寬的占用啊,已經(jīng)負(fù)荷很大了,你在備份這件事情上要再多一層,再做重復(fù)數(shù)據(jù)刪除,所以性能往往是使重復(fù)數(shù)據(jù)刪除技術(shù)面臨非常大的挑戰(zhàn)。所以在第二代重復(fù)數(shù)據(jù)刪除技術(shù)里面,就要考慮性性能的提升和擴(kuò)展性上,給了非常好的解決的辦法。第三個(gè),可攜帶的重復(fù)數(shù)據(jù)刪除的引擎。什么叫可攜帶,很簡(jiǎn)單,就是重復(fù)數(shù)據(jù)刪除引擎非常容易部署,這就是一個(gè)引擎,可以部署在一個(gè)備份軟件里面,備份在應(yīng)用服務(wù)器的源端,也可以備份在目標(biāo)設(shè)備上,完成重復(fù)數(shù)據(jù)刪除這件事情,這也是第二代重復(fù)數(shù)據(jù)刪除技術(shù)要去做的。
另外,全域名的重復(fù)數(shù)據(jù)刪除,包括你部署方式的選擇,還有非常關(guān)鍵的,所有這些東西,你會(huì)發(fā)現(xiàn)第二代重復(fù)數(shù)據(jù)刪除在把你重復(fù)數(shù)據(jù)刪除這個(gè)領(lǐng)域不斷擴(kuò)大,規(guī)模不斷擴(kuò)大,在大規(guī)模的重復(fù)數(shù)據(jù)刪除的IT架構(gòu)下面,你怎么樣做到統(tǒng)一的、自動(dòng)化的透明的方式,對(duì)用戶來(lái)講也非常重要,這就是2.0第二代重復(fù)數(shù)據(jù)刪除技術(shù)所要具備的特點(diǎn)。那是不是還有第三代?有,但是現(xiàn)在還沒(méi)有開(kāi)始,我先講一下第三代的技術(shù)要走到什么程度,就是云。
我今天要給大家講一下惠普的重復(fù)數(shù)據(jù)刪除在數(shù)據(jù)領(lǐng)域保護(hù)里面的應(yīng)用和惠普在數(shù)據(jù)保護(hù)里面針對(duì)重復(fù)數(shù)據(jù)刪除的戰(zhàn)略。我們的重復(fù)數(shù)據(jù)刪除叫什么名字呢?叫StoreOnce,顧名思義,只存一次,很好地詮釋了重復(fù)數(shù)據(jù)刪除的定義,不是刪除,而是只存一次?;萜盏腟toreOnce有哪些特性呢?它是因?yàn)橐槍?duì)怎么去應(yīng)對(duì)第一代傳統(tǒng)的重復(fù)數(shù)據(jù)刪除遭遇的瓶頸,它為了解決它而應(yīng)運(yùn)而生。第一代的問(wèn)題剛才也提到過(guò),就是因?yàn)楫a(chǎn)品無(wú)序地去做擴(kuò)張,因?yàn)槟愕募軜?gòu)很僵硬,我只能做的是加設(shè)備,加設(shè)備,你技術(shù)不兼容性,就導(dǎo)致在你的IT架構(gòu)里面存在很多的獨(dú)立的重復(fù)數(shù)據(jù)刪除的孤島,我可能在虛擬化里面有一個(gè)孤島,在遠(yuǎn)程辦公室里面又有一個(gè)孤島,在數(shù)據(jù)中心又有一個(gè)孤島,這三個(gè)孤島之間怎么做通訊,對(duì)不起,沒(méi)有答案。所以說(shuō)它就到了一個(gè)結(jié)果,就是你的擴(kuò)展性很差,性能很差,而且最可怕的是單控制器的重復(fù)數(shù)據(jù)刪除帶來(lái)的這種風(fēng)險(xiǎn),一旦你在做備份的時(shí)候,這一個(gè)單節(jié)點(diǎn)發(fā)生的故障以后,你的備份作業(yè)就會(huì)停掉。如果在一些小規(guī)模的應(yīng)用里面,我覺(jué)得這個(gè)也是OK的,因?yàn)閺膩?lái)都是風(fēng)險(xiǎn)跟你的成本之間是互相要去平衡的。但是在數(shù)據(jù)中心的關(guān)鍵級(jí)的應(yīng)用里面,高可用性是用戶非常關(guān)注的特點(diǎn),你不能想象,在一個(gè)大型的數(shù)據(jù)中心里面,你今天做備份的時(shí)候,停機(jī)了,你第二天來(lái)的時(shí)候,發(fā)現(xiàn)昨天的備份沒(méi)有做,主存系統(tǒng)發(fā)生了問(wèn)題,數(shù)據(jù)從哪來(lái),怎么恢復(fù),沒(méi)有人知道,這是非常大的災(zāi)難。
所以我們惠普的StoreOnce作為第二代重復(fù)數(shù)據(jù)刪除技術(shù),它首先實(shí)現(xiàn)了第一個(gè),一個(gè)重復(fù)數(shù)據(jù)刪除引擎,就是說(shuō)我無(wú)論部署在我的應(yīng)用服務(wù)器源端,還是我的備份服務(wù)器端,還是目標(biāo)端的服務(wù)器上,只有一個(gè)引擎,就是StoreOnce,通過(guò)StoreOnce,我們就可以在任何位置實(shí)現(xiàn)重復(fù)數(shù)據(jù)刪除,而且去做數(shù)據(jù)塊在幾個(gè)不同的重復(fù)數(shù)據(jù)刪除的領(lǐng)域當(dāng)中去做數(shù)據(jù)塊的移動(dòng),就是只刪一次,數(shù)據(jù)塊在整個(gè)保護(hù)當(dāng)中也只流動(dòng)一個(gè)。同時(shí),它還提供了一種中央的管理方式,就是所有的重復(fù)數(shù)據(jù)刪除的設(shè)備,或者你的架構(gòu),都可以在一個(gè)管理界面里面去看得到,包括你的復(fù)制。另外一個(gè)非常重要的一點(diǎn),就是它實(shí)現(xiàn)了橫向擴(kuò)展的性能和容量,第二代重復(fù)數(shù)據(jù)刪除,StoreOnce,尤其是StoreOnce2.0,采用了面向未來(lái)設(shè)備的重復(fù)機(jī)構(gòu),我可以從小規(guī)模部署起步,在你容量拓展的同時(shí),提升你的性能,而且非常重要的一點(diǎn),這是行業(yè)目前唯一一個(gè)可以做到的,高可用性。我采用橫向擴(kuò)展的架構(gòu)呢,所以我總共配了四對(duì)八個(gè)控制器,最高,但是作為一個(gè)最初始的配置,送到用戶現(xiàn)場(chǎng)的時(shí)候,我面向數(shù)據(jù)中心這一塊應(yīng)用的時(shí)候,也是雙節(jié)點(diǎn)的控制器。在雙節(jié)點(diǎn)的控制器之間,如果說(shuō)你在備份工作的時(shí)候,因?yàn)榉N種原因,可能一個(gè)控制節(jié)點(diǎn)發(fā)生了問(wèn)題,我另外一個(gè)控制節(jié)點(diǎn)自動(dòng)把任務(wù)切過(guò)來(lái),自動(dòng)接管備份工作,所以你的備份業(yè)務(wù)是不會(huì)停機(jī)的,所以在面向應(yīng)用數(shù)據(jù)中心應(yīng)用的時(shí)候,不用擔(dān)心故障,這是StoreOnce2.0的好處。
我們具體來(lái)看一下,我說(shuō)了這么多,好像你剛才說(shuō)的也沒(méi)有橫向擴(kuò)展啊,性能很好啊,到底有沒(méi)有一個(gè)指標(biāo)啊?給大家一個(gè)概念,目前來(lái)講,我們StoreOnce支持B200在Catalyst的支持下,我們可以實(shí)現(xiàn)每小時(shí)高達(dá)100TB的備份性能,這是目前性能最高的,只有StoreOnce可以做到,每小時(shí)100個(gè)TB。如果我們考慮到前端什么都不用管,在備份服務(wù)器上,都不要部署任何的軟件的話,那你這臺(tái)設(shè)備,本機(jī)的性能能做到多少呢?一臺(tái)我們面向數(shù)據(jù)中心級(jí)的的話,每小時(shí)可以做到40個(gè)TB,就是純粹的單臺(tái)設(shè)備的性能可以達(dá)到40個(gè)TB,這也是目前業(yè)內(nèi)最快的。我剛才提到,第一代重復(fù)數(shù)據(jù)刪除里面有一個(gè)非常重要的問(wèn)題,就是它的恢復(fù)性能很低下,在第二代,StoreOnce第二代重復(fù)刪除技術(shù)里面,在這上面做了非常大的提升,我們通過(guò)惠普實(shí)驗(yàn)室的創(chuàng)新的算法和一些索引結(jié)構(gòu)上的調(diào)優(yōu),所以我的恢復(fù)性能也可以做到跟我的備份性能相等,就是可以做到每小時(shí)40TB,這也是目前業(yè)界最快的一臺(tái)做數(shù)據(jù)的重復(fù)備份設(shè)備。它還有一個(gè)非常大的,就是它是目前行業(yè)內(nèi)首款,也是一個(gè)獨(dú)有的高可用的特點(diǎn),它可以做到數(shù)據(jù)之間的故障節(jié)點(diǎn)的切換,自動(dòng)的切換,沒(méi)有單點(diǎn)故障。這種業(yè)務(wù)影響呢,我們可以說(shuō)一個(gè)大家比較容易感受的好處,如果你之前采用第一代重復(fù)數(shù)據(jù)刪除里面,就是業(yè)界最快的一款備份的設(shè)備,第一代的,StoreOnce2.0跟它的性能相比的話,我們每天可以在備份窗口上為你節(jié)省六個(gè)小時(shí),這六個(gè)小時(shí)你可以拿來(lái)做應(yīng)用,6個(gè)小時(shí)什么概念?我們正常的情況下每天是8小時(shí)的備份窗口,你通過(guò)采用StoreOnce2.0,就可以幫你節(jié)省6個(gè)小時(shí),你可以看到,這種性能上的提升和進(jìn)步有多么大!
第二個(gè),StoreOnce的特點(diǎn)就是靈活。首先,它可以實(shí)現(xiàn)任意位置的重復(fù)與消重,應(yīng)用服務(wù)段、備份服務(wù)器和目標(biāo)端,什么位置都可以。從災(zāi)備的考慮,因?yàn)楹芏嗫蛻裘鎸?duì)法規(guī)遵從,尤其金融業(yè)的客戶,我看到很多政府類(lèi)的客戶,也受到國(guó)家法規(guī)遵從的要求,必須有兩點(diǎn)災(zāi)備,異地災(zāi)備,在異地災(zāi)備里面,我們可以從數(shù)據(jù)中心到多個(gè)災(zāi)備站點(diǎn),這多個(gè)災(zāi)備站點(diǎn)里面的副本都是同步的。而且我們數(shù)據(jù)保護(hù)的策略應(yīng)該非常的靈活,你可以在任何時(shí)間,任意的位置去刪除,或者是去把它給并機(jī)到你已經(jīng)過(guò)期的數(shù)據(jù)。
另外一個(gè)就是簡(jiǎn)化。我們通過(guò)按需付費(fèi)的橫向擴(kuò)展,從小容量開(kāi)始,同步增加容量和性能??梢允鼓愕臄?shù)據(jù)中心擯棄傳統(tǒng)的叉車(chē)式升級(jí)的困境。而這所有的工作,我們可以通過(guò)備份臺(tái)實(shí)現(xiàn),聯(lián)合重復(fù)數(shù)據(jù)刪除,就是一個(gè)重復(fù)數(shù)據(jù)刪除,唯一的重復(fù)數(shù)據(jù)刪除的算法,僅在你的整個(gè)企業(yè)的IT架構(gòu)里面移動(dòng)消重的數(shù)據(jù),只存一次,移動(dòng)來(lái)的都是唯一的更新的數(shù)據(jù)塊。我們從數(shù)據(jù)中心,可以管理到遠(yuǎn)程站點(diǎn)的所有的數(shù)據(jù)保護(hù)。對(duì)我們面向數(shù)據(jù)中心級(jí)的B6200來(lái)講,它可以支持384個(gè)遠(yuǎn)程站點(diǎn)的數(shù)據(jù),這個(gè)目前來(lái)講,也只有惠普StoreOnce可以做到,可以你可以看到,越來(lái)越多的全球的大企業(yè),在把惠普StoreOnce作為他們數(shù)據(jù)保護(hù)和數(shù)據(jù)存設(shè)備,這也是一個(gè)很重要的原因。
這是目前來(lái)講HPStoreOnce產(chǎn)品家族線涵蓋點(diǎn)非常全面,這個(gè)成本也是從小到大,我們可以把StoreOnce部署在我們的備份軟件里面,實(shí)現(xiàn)應(yīng)用源端的重復(fù)數(shù)據(jù)消重,也可以備份在備份服務(wù)器端,部署在DP上,我們也一樣可以做到。在一些ROBO的環(huán)境里面,如果用戶既需要本地的用戶保護(hù),又想把數(shù)據(jù)復(fù)制到數(shù)據(jù)中心,我們有StoreOnce2500小規(guī)模、小配置的作為本地的數(shù)據(jù)備份。面對(duì)中小型企業(yè),或者小型數(shù)據(jù)中心的時(shí)候,我們會(huì)有StoreOnce41XX系統(tǒng)的產(chǎn)品,面對(duì)一些數(shù)據(jù)中心和稍微大的企業(yè)的話,我們有StoreOnce43XX的產(chǎn)品來(lái)幫助大家去解決這個(gè)問(wèn)題,相對(duì)來(lái)講,它的成本也會(huì)比較便宜。最右邊這一款,很高的話,這個(gè)是我們專(zhuān)門(mén)為大型的數(shù)據(jù)中心去設(shè)計(jì),去滿足這種關(guān)鍵業(yè)務(wù)系統(tǒng)備份的磁盤(pán)備份設(shè)備,StoreOnceB6200,它可以每小時(shí)達(dá)到100個(gè)TB每小時(shí)業(yè)界最快的性能,同時(shí)也是行業(yè)內(nèi)第一款可以做到自動(dòng)化的磁盤(pán)設(shè)備。所以說(shuō)HP為大家提供了一個(gè)非常完整的,從軟件到硬件,從低成本到高成本,從滿足現(xiàn)在的和滿足未來(lái)的所有的這些數(shù)據(jù)保護(hù)的方案,我們已經(jīng)全部都涵蓋了,基本上你可以在HP找到你想要的東西。
這張圖是我們StoreOnce,是我們面向大型企業(yè)的數(shù)據(jù)中心,面向關(guān)鍵應(yīng)用系統(tǒng)的一塊備份設(shè)備,有業(yè)界最快的備份和恢復(fù)性能,為用戶可以提供端到端的數(shù)據(jù)保護(hù),而它的備份的容量可以高達(dá)768TB,這是重刪之后的,而且它有靈活的部署的方式。這么大的設(shè)備,還有包括所有的StoreOnce的設(shè)備,在IT架構(gòu)里面,我們都可以通過(guò)單一的控制臺(tái)來(lái)做其中的管理,它的備份速度可以實(shí)現(xiàn)每小時(shí)100TB,恢復(fù)每小時(shí)400TB,它有高達(dá)75%的性價(jià)比,所以如果你們采購(gòu)StoreOnce這種設(shè)備的話,相信對(duì)大家現(xiàn)在、未來(lái),還有成本上的節(jié)省,都會(huì)給大家一個(gè)非常好的解決方案,也是別人無(wú)可替代的。
這是一個(gè)我們事例,你可以看到,在這邊,如果有一個(gè)節(jié)點(diǎn)壞掉的話,另外一個(gè)節(jié)點(diǎn)會(huì)自動(dòng)接管。為什么會(huì)這么強(qiáng)大呢?我經(jīng)常去跟用戶講B6200,我講StoreOnce,用戶第一反應(yīng)就是你們?cè)趺幢葎e人強(qiáng)這么多呢,你們是不是有虛構(gòu)的嫌疑?我說(shuō)我剛才講的所有的指標(biāo),都是在惠普上標(biāo)準(zhǔn)的官方網(wǎng)站上可以看得到的。它為什么能夠?qū)崿F(xiàn)這么卓越的性能和特性呢?首先,這個(gè)技術(shù)是由HP實(shí)驗(yàn)室自己去創(chuàng)新的,不是我們收購(gòu),或者是我們?nèi)EM別人的,這是HP自己研發(fā)的一款產(chǎn)品。在這里,大概有涉及到了HP的專(zhuān)利技術(shù)有高達(dá)50多個(gè)專(zhuān)利技術(shù),就是在重復(fù)數(shù)據(jù)刪除里面有50多個(gè),這是很驚人的。因?yàn)槲覀儚牡诙_(kāi)始起步,基于第一代之上,有50多個(gè)專(zhuān)利,你可以看到,有非常大的改進(jìn)。包括我們技術(shù)索引的架構(gòu),可以節(jié)省內(nèi)存和IO的需求,也就是說(shuō)你做重復(fù)數(shù)據(jù)刪除的時(shí)候,你重復(fù)數(shù)據(jù)刪除的性能可能要依托于I/O的性能,今天在實(shí)現(xiàn)同等性能之下,我可以比競(jìng)爭(zhēng)對(duì)手采用更少的內(nèi)存,采用更少的磁盤(pán)I/O,所以說(shuō)我的性價(jià)比可以實(shí)現(xiàn)競(jìng)爭(zhēng)對(duì)手的75%,這也是很重要的一個(gè)原因。另外就是它的快速恢復(fù)。
剛才講了一些行業(yè)的數(shù)據(jù)保護(hù)方面的一些趨勢(shì),一些比較泛泛的行業(yè)內(nèi)大家去看,真的如果是采用了HP的數(shù)據(jù)保護(hù)的解決方案,對(duì)用戶的業(yè)務(wù)來(lái)講,對(duì)你的數(shù)據(jù)保護(hù)的數(shù)據(jù)來(lái)講,能夠解決哪些問(wèn)題呢?我們先來(lái)看一下,現(xiàn)在數(shù)據(jù)保護(hù)方面面臨的幾個(gè)主要的挑戰(zhàn),數(shù)據(jù)快速的增長(zhǎng),帶來(lái)了很多的問(wèn)題,第一個(gè),你的數(shù)據(jù)備份窗口是不是八個(gè)小時(shí)窗口,你可以在八個(gè)小時(shí)窗口可以完成備份,第二個(gè),你的業(yè)務(wù)部門(mén)在不斷向你提出更高的RPO的需求,你是不是能夠在他的要求的范圍內(nèi)快速把數(shù)據(jù)恢復(fù),相應(yīng)他業(yè)務(wù)的需要。第三個(gè),我們商業(yè)的規(guī)模在不斷擴(kuò)大,尤其可以看到,中國(guó)的企業(yè)更多的在國(guó)外設(shè)置分支機(jī)構(gòu)和廠,這些分支機(jī)構(gòu)和遠(yuǎn)程辦公室的數(shù)據(jù)怎么保護(hù),怎么上收上來(lái),這個(gè)問(wèn)題怎么解決?另外一個(gè),災(zāi)難恢復(fù)的工作怎么做?因?yàn)樵絹?lái)越多的法規(guī),行業(yè)的要求,包括上市公司硬性的規(guī)定,金融行業(yè)強(qiáng)制的數(shù)據(jù)保護(hù)的要求,你在這種情況下,怎么做你的災(zāi)備,這些都是我們數(shù)據(jù)保護(hù)面臨的四個(gè)主要的挑戰(zhàn)。
所以我們又回到EST的調(diào)查里面,在2012IT投資優(yōu)先級(jí)排序里面,IT決策者又一次把關(guān)注點(diǎn)在數(shù)據(jù)保護(hù)上,因?yàn)榇蠹揖褪菙?shù)據(jù)增長(zhǎng)和IT投入上做一個(gè)最佳的平衡點(diǎn),你怎么樣節(jié)省IT成本的前提下,能夠應(yīng)對(duì)你的數(shù)據(jù)的大量的增長(zhǎng)?所以你可以看到,在六個(gè)最受關(guān)注項(xiàng)里面,有四個(gè)都是跟數(shù)據(jù)保護(hù)有關(guān)的,改善災(zāi)難恢復(fù),管理數(shù)據(jù)增長(zhǎng),增強(qiáng)信息的安全,改進(jìn)業(yè)務(wù)連續(xù)性和災(zāi)難恢復(fù)。通過(guò)HP新一代數(shù)據(jù)保護(hù)解決方案,我們可以幫助用戶滿足備份窗口,滿足40%的數(shù)據(jù)增長(zhǎng),還有用于管理的數(shù)據(jù)保護(hù)的員工的人數(shù)卻沒(méi)有增加,而你的IT是持平,或者很多的部門(mén)是在不斷的下降。StoreOnce通過(guò)它無(wú)以倫比的備份速度,縮短你的備份窗口每天高達(dá)6小時(shí)。
這邊有一個(gè)StoreOnce的成功案例,這是一個(gè)大學(xué)的成功案例,它采用了右邊的是用戶的評(píng)語(yǔ),我就不再多講了。大家可以看一下幾個(gè)關(guān)注點(diǎn),通過(guò)使用StoreOnce,他的備份的性能、備份速度比之前快了10倍,它服務(wù)器的停機(jī)時(shí)間減少了80%,它需要備份的容量節(jié)省到1/15,也就是說(shuō)在我們做調(diào)查的時(shí)候,他的重復(fù)數(shù)據(jù)刪除的效率應(yīng)該是在15倍左右。而對(duì)他來(lái)講,他的服務(wù)器的增長(zhǎng)已經(jīng)增長(zhǎng)了5倍,但是他相應(yīng)的IT管理人員只有兩個(gè)人就可以管理這些服務(wù)器增長(zhǎng)造成的數(shù)據(jù)的處理和日常的管理工作。所以說(shuō)這樣IT人員就可以多了2.5倍的時(shí)間不是做維護(hù),而是做一些IT的戰(zhàn)略的計(jì)劃。
通過(guò)StoreOnce,我們可以去幫助用戶滿足快速恢復(fù)的服務(wù)級(jí)別的協(xié)議,就是快速恢復(fù)的SLA,因?yàn)橄到y(tǒng)規(guī)模在不斷擴(kuò)大,所以更多的數(shù)據(jù)需要在很短的時(shí)間內(nèi)做恢復(fù),而一個(gè)很可笑的事情是什么呢?大多數(shù)目前的備份廠商不注重恢復(fù),只會(huì)給你講我備份能夠做到多快,我可以把你的備份怎么樣,所有的焦點(diǎn)都集中在備份上,很少有人講我的恢復(fù)是什么,我的恢復(fù)能做到什么,我可以幫助怎么樣優(yōu)化你的恢復(fù)的流程,很少有人這樣講。StoreOnce提供了非??焖俚幕謴?fù)的速度,我們?nèi)€的產(chǎn)品,基本上恢復(fù)速度和備份速度是非常接近的,在B6200里面,你可以看到,恢復(fù)速度和備份速度是一樣的,所以可以高達(dá)40TB/小時(shí)的速度恢復(fù)數(shù)據(jù)。只有HP公開(kāi)了恢復(fù)性能,其他都沒(méi)有公開(kāi)恢復(fù)性能,我們彩頁(yè)上都是備份性能可以做到多少,恢復(fù)性能可以做到,兩個(gè)指標(biāo)在上面。我們HP可以提供節(jié)點(diǎn)自動(dòng)重啟的功能,確保你的恢復(fù)一定可以做,另外我們有單點(diǎn)故障,確保你的系統(tǒng)一直在可用的狀況下。所以我們和我們最接近的競(jìng)爭(zhēng)對(duì)手相比,他的優(yōu)勢(shì)也高達(dá)75%。
這是比較看重恢復(fù)的用戶的案例,這是一個(gè)包裝公司,通過(guò)它使用StoreOnce的時(shí)候,它恢復(fù)它一些圖形設(shè)計(jì)的數(shù)據(jù),它說(shuō)它以前必須先恢復(fù)一個(gè)完整的備份和所有的增量備份,這個(gè)大概要花費(fèi)多長(zhǎng)時(shí)間呢?一周的時(shí)間,才可以把這個(gè)設(shè)備恢復(fù)到可用的狀況,用StoreOnce備份的時(shí)候,將這個(gè)數(shù)據(jù)回回?cái)?shù)據(jù)中心的時(shí)候,恢復(fù)只需要幾分鐘,減少了12倍,數(shù)據(jù)恢復(fù)提高了5恩倍,這樣給圖形設(shè)計(jì)工程師每個(gè)月增加20個(gè)小時(shí)的生產(chǎn)力,減少了容量的采購(gòu),而且也不需要部署額外的系統(tǒng)增加容量,部署在StoreOnce上面就可以做容量的擴(kuò)展,所以很好地幫助優(yōu)化存儲(chǔ)的成本。
第三個(gè),也是一直以來(lái)在數(shù)據(jù)保護(hù)領(lǐng)域大家都面臨的問(wèn)題,就是災(zāi)難恢復(fù)的問(wèn)題。講這個(gè)之前,我不知道在座各位的災(zāi)難恢復(fù)目前是怎么去做的。我之前一直在賣(mài)備份,備份實(shí)際磁帶技術(shù)已經(jīng)用了很多年了,幾十年了,在一些大量的金融機(jī)構(gòu)里面,采用災(zāi)難恢復(fù)的要求,都是通過(guò)磁帶運(yùn)輸?shù)姆绞饺プ龅模褪前堰@個(gè)磁帶在本地備份完,然后通過(guò)人工方式把它運(yùn)輸?shù)疆惖厝?,這樣的話,我就保證我的數(shù)據(jù)有兩地的存放,可以應(yīng)對(duì)我這種政策性強(qiáng)制的要求。在這種情況下,就帶來(lái)兩個(gè)問(wèn)題,第一個(gè),你可能在運(yùn)輸?shù)倪^(guò)程當(dāng)中造成你的數(shù)據(jù)丟失,這個(gè)我想在花旗銀行啊,還有美國(guó)銀行里面,經(jīng)常隔兩年會(huì)看到這種案例,在運(yùn)輸過(guò)程丟失了,大量的信用卡的數(shù)據(jù)被暴露了,帶來(lái)什么什么樣的損失,這個(gè)實(shí)際上就是一些傳統(tǒng)的用磁帶性數(shù)據(jù)災(zāi)難恢復(fù)的時(shí)候面臨的問(wèn)題。有些就說(shuō),為什么不通過(guò)一種自動(dòng)化復(fù)制的方式,把磁帶的方式復(fù)制到異地去呢?是技術(shù)不可行嗎?技術(shù)是可行的,備份軟件都支持,為什么不采用呢?就是它的備份軟件帶寬要求過(guò)高。要求30到40TB,如果要一個(gè)網(wǎng)絡(luò)帶寬傳輸?shù)脑?,你算一算要多長(zhǎng)時(shí)間,而且一定有要求,你通過(guò)傳統(tǒng)的以太網(wǎng)傳輸?shù)脑?,這項(xiàng)工作是根本不可能實(shí)現(xiàn)的,所以你看到,很多的傳統(tǒng)的災(zāi)難恢復(fù)的策略,還都是采用運(yùn)輸磁帶的方式。
通過(guò)StoreOnce重復(fù)刪除的技術(shù),我們可以幫助用戶解決傳統(tǒng)的問(wèn)題,它可以基于低帶寬,就是基本上可以用現(xiàn)有的以太網(wǎng)的帶寬就完成數(shù)據(jù)復(fù)制,為什么呢?因?yàn)槲覀兊臄?shù)據(jù)復(fù)制是基于重復(fù)性刪除的,我每天在網(wǎng)絡(luò)上去復(fù)制的數(shù)據(jù),并不是說(shuō)真正把每天產(chǎn)生的幾十個(gè)TB的數(shù)據(jù)全部復(fù)制到對(duì)方去,而是只傳輸唯一的改變的數(shù)據(jù)塊,部署的時(shí)候,可能在本地有一個(gè)已經(jīng)經(jīng)過(guò)處理的磁盤(pán)的部署方式,在異地有一個(gè)災(zāi)備設(shè)備去做,我只部署兩臺(tái)設(shè)備之間的差異量,這樣的話,每天要傳的數(shù)據(jù)很少,至少會(huì)減少10倍左右,所以你會(huì)看到,大量的StoreOnce的災(zāi)難恢復(fù)的解決方案,都是基于已有的網(wǎng)絡(luò)的以太網(wǎng)的帶寬,4M、6M、10M,就可以幫助解決異地災(zāi)難恢復(fù)的問(wèn)題。
這里面又有一個(gè)異地災(zāi)難恢復(fù)的廣告公司的成功案例,他現(xiàn)在每天只需要花幾分鐘管理這個(gè)流程,而在過(guò)去,可能要需要一天的時(shí)間。對(duì)于遠(yuǎn)程分支機(jī)構(gòu)的保護(hù),實(shí)際上遠(yuǎn)程分支機(jī)構(gòu)是我們最近通過(guò)調(diào)查,包括ESG的調(diào)查,會(huì)發(fā)現(xiàn),越來(lái)越多的企業(yè)當(dāng)中的數(shù)據(jù)都產(chǎn)生在從遠(yuǎn)程分支機(jī)構(gòu)產(chǎn)生,有高達(dá)50%,甚至我以前看過(guò)一個(gè)調(diào)查,高達(dá)80%的數(shù)據(jù)都是分支機(jī)構(gòu)產(chǎn)生的。但是在分支機(jī)構(gòu)產(chǎn)生大量的數(shù)據(jù),實(shí)際有一個(gè)很大的問(wèn)題,大家都知道,在分支機(jī)構(gòu)里面的IT的部署是非常少的,所以他沒(méi)有辦法提供專(zhuān)業(yè)的IT保護(hù),所以說(shuō)造成你備份啊,或者你做災(zāi)難恢復(fù)的副本都不可靠,而且經(jīng)常備份操作是沒(méi)有辦法成功的,而且你也沒(méi)有辦法去檢查他。
通過(guò)StoreOnce這種解決方案,我們就可以為復(fù)制機(jī)構(gòu)提供非常強(qiáng)大的保護(hù),大家看這個(gè)圖就比較簡(jiǎn)單,這個(gè)圖的左側(cè)就是分支機(jī)構(gòu)的數(shù)據(jù)或者部署方式,可以由大型的,中型的或者小型的,你可以通過(guò)這種方式,你可能只需要部署一個(gè)StoreOnce軟件,部署在服務(wù)器上,走低帶寬的方式,就可以部署到數(shù)據(jù)中心的大型的設(shè)備上。在這兩種方式下面,你都可以發(fā)現(xiàn)在本地不用部署硬件設(shè)備,就只部署一個(gè)軟件就可以了。如果他說(shuō)我需要本地的數(shù)據(jù)保護(hù)我就可能怎么樣呢?它通過(guò)本地部署一臺(tái)可以重復(fù)利用刪除的數(shù)據(jù),把它部署在這個(gè)設(shè)備上,經(jīng)過(guò)重復(fù)數(shù)據(jù)山刪除之后,把它復(fù)制到數(shù)據(jù)中心來(lái)。所以你可以通過(guò)StoreOnce的解決方案,幫助客戶應(yīng)對(duì)各種需求的遠(yuǎn)程數(shù)據(jù)的保護(hù),通過(guò)這一個(gè)解決方案,全部都涵蓋掉了,所以說(shuō)它非常的經(jīng)濟(jì)。
這是一個(gè)在國(guó)外的ROBO的案例,在瑞士、愛(ài)爾蘭、法國(guó)、捷克、西班牙,他們的帶寬最寬的才10M而已,通過(guò)這個(gè)帶寬,在他們國(guó)家部署一臺(tái)ROBO的設(shè)備,把它全部復(fù)制到在英國(guó)的數(shù)據(jù)中心去,英國(guó)部署兩臺(tái)StoreOnce備份系統(tǒng)。對(duì)于長(zhǎng)期的,可能高達(dá)數(shù)十年十年的數(shù)據(jù)備份,把它規(guī)整到我們硬件的磁帶庫(kù)里面,這是一個(gè)非常典型的ROBO的案例。
所以通過(guò)數(shù)據(jù)保護(hù),HP可以幫你去節(jié)省時(shí)間和金錢(qián)。我覺(jué)得這個(gè)經(jīng)常會(huì)是一句空話,因?yàn)槲覀兘?jīng)常會(huì)說(shuō),省錢(qián)省時(shí)間,可能大大小小的廣告都有,但是,我相信通過(guò)我剛才給大家的對(duì)于我們StoreOnce新一代數(shù)據(jù)保護(hù)方案的介紹,你就會(huì)知道,我們的時(shí)間和金錢(qián)的節(jié)省,都有非常多的事實(shí)和數(shù)據(jù)去做支撐。
在這邊,想給大家講一下,我講這么多新一代的數(shù)據(jù)保護(hù),全是在講磁盤(pán)的數(shù)據(jù)保護(hù)的解決方案,大家是不是會(huì)有一個(gè)問(wèn)題,那是不是意味著磁帶就消亡了?是不是磁帶真的就不需要了?答案肯定是不是的,那只是說(shuō)不可避免的是說(shuō),磁帶在你整個(gè)數(shù)據(jù)保護(hù)的架構(gòu)里面,能夠起到的作用在逐漸的被削弱,你會(huì)看到,大量的主要的磁盤(pán)備份工作在開(kāi)始由磁盤(pán)來(lái)承擔(dān),但是磁帶庫(kù),或者磁帶這種解決方案,依然在你的數(shù)據(jù)中心里面是不可替代的一個(gè)解決方案。