更新之后的惠普StoreOnce B6200備份系統(tǒng)規(guī)格(部分)

惠普StoreOnce B6200是此次爭論的焦點之一。筆者曾經(jīng)對該產(chǎn)品做過比較詳細的介紹。如今它在新加入的StoreOnce Catalyst(催化劑)軟件配合下滿配8個節(jié)點的最大重復數(shù)據(jù)刪除備份速度可達100TB/小時,不使用StoreOnce Catalyst的情況下也由之前的28TB/小時提升到40TB/小時。

需要注意的是,B6200的數(shù)據(jù)恢復速度為40TB/小時,此時StoreOnce Catalyst是幫不上忙的。同時這款產(chǎn)品還加入了對Symantec OST(Open Storage Technology)的支持。

StoreOnce Catalyst技術的工作原理和EMC DD Boost比較類似,如下圖:

惠普在新聞稿中表示:“HP StoreOnce Catalyst軟件讓客戶能夠在數(shù)據(jù)傳輸至中央HP StoreOnce備份系統(tǒng)之前,在應用服務器或備份服務器上刪除重復數(shù)據(jù)。這種方式提高了靈活性,能夠幫助客戶降低帶寬成本并提高備份吞吐量??蛻艨衫肏P Data Protector 7軟件、Symantec NetBackup或Symantec Backup Exec來管理其HP StoreOnce Catalyst環(huán)境中的重復數(shù)據(jù)刪除以及數(shù)據(jù)移動。獨立軟件供應商(ISV)可通過HP StoreOnce Catalyst開放軟件開發(fā)工具包,從而實現(xiàn)同樣的控制水平。”

上圖顯示了當前可以支持StoreOnce Catalyst API的兩種備份軟件——惠普本次發(fā)布的自家最新版本Data Protector 7和賽門鐵克NetBackup(據(jù)了解Backup Exec即將加入支持)。在左邊的備份服務器上,HP DP7的介質(zhì)代理中包含了Catalyst API,可以選擇在這里進行部分的去重;而右邊則是在NetBackup介質(zhì)服務器的OST API基礎上,加入了一個Catalyst插件,同樣可以進行預處理去重。Catalyst指令和數(shù)據(jù)在備份服務器和B6200系統(tǒng)之間傳輸。

我們可以想象,StoreOnce Catalyst很可能是受到了EMC DD Boost的啟發(fā),因為DD Boost一開始只支持賽門鐵克的備份軟件,可以說相當于OST的一個增強;后來才移植到被EMC收購來的(Legato)Netwoker,以及Avamar源端重復數(shù)據(jù)刪除解決方案上?;萜赵谕粫r間準備好了Catalyst針對賽門鐵克的插件和Data Protector 7,基本上就是沿著前者的路線走。

重復數(shù)據(jù)刪除競爭白熱化:軟硬結(jié)合成關鍵

EMC DD Boost支持的軟硬件、操作系統(tǒng)和網(wǎng)絡連接列表

經(jīng)過EMC World 2012上的發(fā)布,我們看到DD Boost又新加入了Quest vRanger虛擬機備份軟件、Oracle RMAN和Greenplum數(shù)據(jù)庫的支持。盡管EMC沒有像惠普那樣宣布開放DD Boost的API,但他們也力求兼容更多的軟件。不過筆者認為,另外兩家主要的備份軟件——IBM TSM(Tivoli Storage Manager)和CommVault Simpana可能不會輕易與EMC合作,雖然Data Domain的市場占有率遙遙領先,但別忘了EMC自己還有Netwoker和Avamar正是二者的競爭對手。而且IBM還要推他們的 ProtecTIER虛擬磁帶庫產(chǎn)品(如今也支持賽門鐵克OST了);CommVault則像很多備份軟件那樣有自己的源端/介質(zhì)服務器上的重復數(shù)據(jù)刪除 選項。

重復數(shù)據(jù)刪除競爭白熱化:軟硬結(jié)合成關鍵

上文中已經(jīng)提到過關于DD Boost和RMAN的集成,其價值就是在不使用第三方備份軟件的情況下,直接通過RMAN對Oracle數(shù)據(jù)庫進行備份也能享受到DD Boost預處理重復數(shù)據(jù)刪除的好處。

而惠普存儲事業(yè)部的產(chǎn)品營銷總監(jiān)Sean Kenney則回應道:“RMAN本身不是一個備份應用程序,我們覺得在備份軟件之外備份Oracle沒有多少價值,這樣不能利用備份應用程序的目錄和存儲管理優(yōu)勢。”

可以說每家公司的說法站在自己角度上都有一定的道理,總之競爭帶來了技術的豐富和進步,用戶會根據(jù)自己的情況來選擇。接下來我們看看幾款產(chǎn)品的橫向?qū)Ρ龋?/p>

五款重復數(shù)據(jù)刪除系統(tǒng)大比拼

重復數(shù)據(jù)刪除競爭白熱化:軟硬結(jié)合成關鍵

上表來自我們從惠普網(wǎng)站上下載的StoreOnce B6200實驗室驗證報告,因此其中部分規(guī)格僅供參考

首先,我們看到了包括HP B6200、SEPATON(S2100-ES2)、EMC DD990、FaconStor(飛康VTL)和IBM TS7650G VTL網(wǎng)關在內(nèi)的五款產(chǎn)品。它們都支持虛擬磁帶庫功能;SEPATON不支持NFS和CIFS標準文件協(xié)議但聽說有這個計劃,飛康另有一款FDS文件級重復數(shù)據(jù)刪除產(chǎn)品,IBM 7650G則在最近加入了對CIFS的支持(暫時還沒有NFS)。在去重卸載方面,惠普和EMC分別憑借StoreOnce Catalyst和DD Boost處于領先,賽門鐵克OST的支持已經(jīng)成為了標準功能。

接下來的最大可用容量(這里是物理容量,而不是可保存重復數(shù)據(jù)刪除之前的原始數(shù)據(jù)量),最大支持8個節(jié)點的SEPATON以1.6PB處于領先,而同樣8節(jié)點(4對高可用)的惠普B6200卻落在了最后。這里列出EMC DD990支持的570TB,在添加Extended Retention軟件選項之后,可以提高到1.3PB(570TB至1.3PB之間為歸檔層)。

在節(jié)點數(shù)量方面,筆者覺得應該和性能、高可用性(HA)一同分析。EMC DD990由于是單節(jié)點的系統(tǒng)而不支持Active/Active Failover(故障切換),至于SEPATON、飛康和TS7650G的“FC only”,可能指的是它們通過光纖通道連接后端的存儲陣列,比如SEPATON搭配了HDS(日立數(shù)據(jù)系統(tǒng))的AMS2100,飛康和IBM本身就是軟件或者網(wǎng)關的形式,自然就不限型號了。而B6200則是封閉的系統(tǒng),前端的2U服務器節(jié)點與后端陣列之間通過SAS來連接。

重復數(shù)據(jù)刪除競爭白熱化:軟硬結(jié)合成關鍵

惠普StoreOnce B6200備份邏輯設計示意圖(雙節(jié)點HA對)

根據(jù)上圖,每個VTL/NAS仿真的B6200節(jié)點3.5TB/小時的讀/寫速度是初始發(fā)布時的數(shù)值,本次更新后應該提升到了5TB/小時,使用StoreOnce Catalyst當然就更快了。每個節(jié)點的64TB可用物理存儲,則是通過6Gb/s SAS連接后端的P2000磁盤陣列控制器來實現(xiàn)的,兩個B6200節(jié)點同時也連接到屬于另一個節(jié)點的P2000陣列,另外節(jié)點間應該還有雙10GbE(萬兆以太網(wǎng))通信用于故障偵測和元數(shù)據(jù)同步。當一個節(jié)點出現(xiàn)問題時,HP Autonomic Restart(自動重啟)功能通過將備份重定向至另一節(jié)點,無需手動干預即可防止備份失敗。另外,StoreOnce B6200的P2000存儲也是通過雙控制器各自2條SAS鏈路分別連接到前端服務器。

可以看出,每一款高可用的重復數(shù)據(jù)刪除系統(tǒng),都是采用盤/控分離的設計,也就是前端處理去重的服務器節(jié)點,連接外部控制器的后端存儲系統(tǒng),如此才能實現(xiàn)HA。而EMC Data Domain在硬件上則相當一臺高配置的存儲服務器,這就是它目前仍不支持高可用的原因。由于DD990的出現(xiàn),在性能和容量上全面被超越從而在產(chǎn)品線中消失的GDA(Global Deduplication Array,全局重復數(shù)據(jù)刪除陣列),其雙節(jié)點設計也是以犧牲可用性為代價的。

當筆者問及EMC怎樣看待用戶對重復數(shù)據(jù)刪除產(chǎn)品節(jié)點級別高可用的需求時,EMC大中華區(qū)副總裁、備份與恢復系統(tǒng)部總經(jīng)理陳滿恒先生表示:“這個我們會向公司總部反映,并且已經(jīng)遇到用戶有這方面的要求。”

再來看性能。在單節(jié)點的比較中,EMC DD990以31TB/小時遙遙領先;而到了系統(tǒng)最大性能,惠普B6200和SEPATON S2100-ES2都有8倍的提升。值得注意的是,上表列出的數(shù)字沒有達到惠普宣稱的100TB/小時(對應單節(jié)點12.5TB/小時)。還有就是 SEPATON的重復數(shù)據(jù)刪除為后處理(post-processing),而惠普、EMC DD和IBM ProtecTIER都是線內(nèi)(in-line)去重,因此SEPATON最近一次備份的恢復速度與數(shù)據(jù)初始備份(而不是延后的重復數(shù)據(jù)刪除處理過程)的 速度同為43.2TB/s?;萜盏恼麄€系統(tǒng),應該看成是由4對節(jié)點各自單獨的重復數(shù)據(jù)刪除索引,四個單獨的命名空間組合而成的單一命名空間;而 SEPATON則是跨ES2集群的全局重復數(shù)據(jù)刪除池。

重復數(shù)據(jù)刪除競爭白熱化:軟硬結(jié)合成關鍵

我們在此補充一點,IBM TS7650G ProtecTIER重復數(shù)據(jù)刪除網(wǎng)關最近更新后的性能,提高到了9TB/小時,比上表中的雙節(jié)點7.2TB/小時有所提升。雖然TS7650G的型號名稱長期不變,但其硬件是在不斷升級的,如今使用了四顆10核心的Intel Xeon(至強)E7-4860(總共40核)。而其持續(xù)恢復性能比備份性能還要高(3200MB/s vs. 2500MB/s),達到了11.4TB/小時。

Data Domain擴展選項:備份歸檔一體化?

重復數(shù)據(jù)刪除競爭白熱化:軟硬結(jié)合成關鍵

Data Domain產(chǎn)品線規(guī)格,之前筆者曾經(jīng)列出過這個表格的英文版本

關于DD990的性能提升,EMC資深技術顧問靳揚在回答筆者提出的問題時表示:“簡單說就是我們的性能提升是依靠Data Domain的算法,這個叫SISR的算法是收購過來的,我們還在發(fā)展,加上結(jié)合CPU的處理能力,通過這兩方面來進行提升。我們的提升不是依靠磁盤的性能,而是依靠快速發(fā)展的多核CPU的性能。”

我們還不確定DD990的硬件平臺采用的是Xeon E5還是E7,但根據(jù)之前的判斷,應該是這兩者之一。

從上表中我們還看到,DD990的邏輯容量分為2檔——5.7-28.5PB(對應570TB可用物理容量,分別計算10-50倍的去重比)和13-65PB(對應1.3PB可用物理容量)。這兩個可用物理容量點我們在前文中曾經(jīng)提到過,涉及一個Extended Retention軟件選項。

重復數(shù)據(jù)刪除競爭白熱化:軟硬結(jié)合成關鍵

注意上圖中的“活動層”和“保留層”,它們在物理上是相對獨立的

ChinaByte比特網(wǎng):我覺得65PB這個邏輯容量比較大,這兩個不同的層之間,(重復數(shù)據(jù)刪除)索引是不是分開做的?

靳揚:不是,是統(tǒng)一的單一命名空間,你可以理解歸檔層的關鍵是你可以把它搬走,需要在線就在線,不需要在線就不在線,是一層一層歸檔的。備份這個層面是570TB,也就是活動層的最大容量是570TB,之外到1.3個PB之間是歸檔層。

重復數(shù)據(jù)刪除競爭白熱化:軟硬結(jié)合成關鍵

以上摘自Data Domain擴展盤架規(guī)格表

可以看出DD990默認情況下(只有備份層)支持最多30個ES30擴展盤架,而添加Extended Retention軟件選項之后增加到56個。通過ES30上面的SAS擴展器,表明它就是一個JBOD級連擴展的方式,那么DD990的存儲服務器硬件上應該可以支持不只一塊SAS RAID卡。如果不出意外的話,備份層和歸檔層所包含的擴展盤架估計是連接在不同的RAID卡上面,這樣才適合根據(jù)需要來離線。

同理,數(shù)據(jù)從備份層到歸檔層需要一個在物理硬盤RAID間移動的過程。

如上圖,在數(shù)據(jù)中心和遠程災難恢復站點的Data Domain系統(tǒng)之間,由于Retention Tier(保留層,也就是歸檔層)中都是不活動的“冷數(shù)據(jù)”,因此當有一個保留單元(擴展盤架)故障時,用戶不再需要沿著廣域網(wǎng)的復制路徑反向恢復,而是只要將DR站點中對應的單個保留單元運輸?shù)缴a(chǎn)數(shù)據(jù)中心就可以了。根據(jù)我們的理解,這就是Data Domain離線歸檔的好處之一。

分享到

wangzhen

相關推薦