DELL DR4000
但這并未意味著DELL DR4000就毫無(wú)潛力可挖。就DR4000自身而言,重復(fù)數(shù)據(jù)刪除技術(shù)是其核心(與大多數(shù)D2D磁盤備份系統(tǒng)一樣,DR4000也是采用的標(biāo)準(zhǔn)X86架構(gòu)服務(wù)器為硬件平臺(tái)),其集成的Ocarina技術(shù)到底有什么優(yōu)勢(shì),能夠?yàn)镈R4000帶來(lái)哪些優(yōu)勢(shì)?DR4000在戴爾的D2D磁盤備份系統(tǒng)產(chǎn)品線中又占有什么地位?DR4000除了是D2D磁盤備份系統(tǒng)之外,還蘊(yùn)藏著哪些戴爾對(duì)Ocarina和DR產(chǎn)品線的期待?
為解答這些問(wèn)題,在DR4000正式在中國(guó)發(fā)布之前,DOSTOR采訪了戴爾亞太及日本地區(qū)產(chǎn)品市場(chǎng)部高級(jí)產(chǎn)品經(jīng)理林佑聲和戴爾大中華區(qū)消費(fèi)及中小企業(yè)市場(chǎng)部高級(jí)產(chǎn)品經(jīng)理馬軼霏,了解了戴爾推出DR4000的臺(tái)前幕后。
戴爾涉足D2D:DR4000初覽
作為一款D2D磁盤備份系統(tǒng),重復(fù)數(shù)據(jù)刪除技術(shù)是DR4000的標(biāo)配:DR4000的有效存儲(chǔ)容量共有35TB、70TB和130TB三種,支持在線重復(fù)數(shù)據(jù)刪除(inline deduplication)和壓縮、重刪數(shù)據(jù)復(fù)制(deduplicated replication)、高級(jí)數(shù)據(jù)保護(hù)和不中斷部署,當(dāng)然,與主流備份軟件應(yīng)用的認(rèn)證已經(jīng)基本都通過(guò)了。
而作為戴爾第一款D2D磁盤備份系統(tǒng),戴爾給出的DR4000禮包當(dāng)然不僅僅是這些,據(jù)林佑聲表示,DR4000中提供了完整的、無(wú)所不含的軟件許可模式——“值得一提的是,DR4000的軟件模式跟EqualLogic一樣,買了硬件設(shè)備以后,里面的軟件,OMC的功能、升級(jí)的功能都是全部包含的。”(事實(shí)上,在戴爾英文官網(wǎng)上,DR4000的正式名稱是:Dell DR4000 deduplication and compression backup appliance,Appliance顯然頗有深意。)
林佑聲表示,戴爾為DR4000提供了與EqualLogic相同的“軟硬件打包”的產(chǎn)品形態(tài)。戴爾支持客戶在無(wú)需支付額外許可費(fèi)用的前提下充分利用DR4000當(dāng)前及未來(lái)的所有產(chǎn)品功能,進(jìn)而隨著時(shí)間的推移逐步降低存儲(chǔ)成本。
PowerEdge R510是DR4000的硬件基礎(chǔ),作為一款支持英特爾至強(qiáng)5500處理器的雙插槽2U服務(wù)器,R510最大提供32GB內(nèi)存,能夠?yàn)镈R4000的在線重復(fù)數(shù)據(jù)刪除(inline deduplication)提供強(qiáng)勁的性能,而林佑聲表示,DR4000雖然目前沒有發(fā)布橫向擴(kuò)展的功能,但是在未來(lái),DR4000的升級(jí)很可能將包括橫向擴(kuò)展的能力——當(dāng)然,我們也不能夠排除DR4000未來(lái)推出更高端型號(hào)的可能,從DELL EqualLogic的4100產(chǎn)品線和6100產(chǎn)品線的發(fā)布情況來(lái)看,未來(lái)的產(chǎn)品被稱作DR6000的可能性極大。
DR4000的基本硬件規(guī)格
作為一款D2D磁盤備份系統(tǒng),其核心當(dāng)然是備份與恢復(fù)功能,當(dāng)然,基于IP連接的DR4000同樣可以支持遠(yuǎn)程備份恢復(fù)和災(zāi)難恢復(fù)等功能,我們都知道,壓縮和重復(fù)數(shù)據(jù)刪除都是減小備份數(shù)據(jù)集的有效技術(shù),因此結(jié)合了重復(fù)數(shù)據(jù)刪除技術(shù)的D2D磁盤備份系統(tǒng)是企業(yè)數(shù)據(jù)備份與恢復(fù)的良好載體。
據(jù)戴爾方面表示,DR4000擁有15:1的重復(fù)數(shù)據(jù)刪除比率,但林佑聲也表示,正如業(yè)界所普遍認(rèn)可的,重復(fù)數(shù)據(jù)刪除比率是一個(gè)比較彈性的話題,自然還是與需要重刪的數(shù)據(jù)有關(guān),但他表示,由于Ocarina的強(qiáng)勁技術(shù),“DR4000的效果要比很多人想象的好”——這部分內(nèi)容我們會(huì)在后面看到,現(xiàn)在還是繼續(xù)看看DR4000本身。
林佑聲表示,戴爾對(duì)于DR4000的功能,除了在中小企業(yè)和大型企業(yè)遠(yuǎn)程辦公室進(jìn)行數(shù)據(jù)備份與恢復(fù),由于戴爾為DR4000的完全套裝的許可授權(quán)中提供了遠(yuǎn)程復(fù)制軟件,因此“支持三臺(tái)DR4000設(shè)備的同步與數(shù)據(jù)的復(fù)制”,而且三臺(tái)設(shè)備之間的復(fù)制與同步都是可以“遠(yuǎn)程實(shí)現(xiàn)的”。戴爾大中華區(qū)消費(fèi)及中小企業(yè)市場(chǎng)部高級(jí)產(chǎn)品經(jīng)理馬軼霏認(rèn)為,DR4000的遠(yuǎn)程同步與數(shù)據(jù)復(fù)制功能的提供,讓DR4000不僅限于辦公室或數(shù)據(jù)中心內(nèi)的應(yīng)用,而是可以實(shí)現(xiàn)“B2B2C”——Business(業(yè)務(wù)部門或遠(yuǎn)程辦公室) to Business to Center(數(shù)據(jù)中心)——的功能,從而滿足多地中心和分中心的數(shù)據(jù)保護(hù)。不過(guò),由于DR4000只是初始版本,還只能支持三臺(tái)設(shè)備,據(jù)林佑聲講,未來(lái)幾個(gè)季度,戴爾“還會(huì)有容量和功能上的更新”。
從競(jìng)爭(zhēng)角度來(lái)看,DataDomain的DD160有一個(gè)標(biāo)準(zhǔn)的40TB邏輯容量,而DD620提供83TB的邏輯容量。在Boost的幫助下,利用Symantec的OST來(lái)用媒介服務(wù)器預(yù)先處理備份數(shù)據(jù)流,160的數(shù)據(jù)吞吐率為1.1TB/小時(shí),如果不用Boost的話,速率是667GB/小時(shí)。620使用Boost的話,速度可以達(dá)到2.4TB/小時(shí),如果不使用Boost的話,速度是1.1TB/小時(shí)。所有的軟件功能已經(jīng)包含在基礎(chǔ)價(jià)格內(nèi)。
Quantum的DXi4500針對(duì)的是中小企業(yè)客戶,它在NAS(網(wǎng)絡(luò)附加存儲(chǔ))和賽門鐵克OpenStorage(OST)上的重復(fù)數(shù)據(jù)刪除速度都可以達(dá)到1.4TB/小時(shí)。DXi4510擁有2TB容量,而DXi4601的容量在4TB與12TB之間。
戴爾DR4000的速度比沒有使用Boost的DD160更快,速度相當(dāng)于使用Boost的DD160和未使用Boost的DD620。DR4000沒有DXi5400那么快,不過(guò)它的基礎(chǔ)容量比4510更大,相當(dāng)于4601產(chǎn)品。
總的來(lái)說(shuō),戴爾將不斷擴(kuò)展DR4000產(chǎn)品(或是產(chǎn)品家族)的范圍,提高速度和容量,覆蓋規(guī)模更大的企業(yè)的要求,而且毫無(wú)疑問(wèn)的是,支持遠(yuǎn)程辦公室和分支辦公室。此外,進(jìn)一步的功能將通過(guò)固件升級(jí)來(lái)添加,這樣現(xiàn)有用戶就不用進(jìn)行跳躍式升級(jí)來(lái)獲得額外功能。
DR4000及其后續(xù)產(chǎn)品在整合災(zāi)難恢復(fù)、無(wú)需重建的數(shù)據(jù)遷移、WAN(廣域網(wǎng))優(yōu)化功能上也應(yīng)該會(huì)有更多建樹,以及多到1的復(fù)制功能也不需用戶花費(fèi)很高的費(fèi)用。DR4000還將有更多的ISV和合作伙伴整合,我們并不排除DR4000在Appliance方向上的進(jìn)一步發(fā)展。
DR4000的靈魂:Ocarina重復(fù)數(shù)據(jù)刪除
重復(fù)數(shù)據(jù)刪除技術(shù)是D2D磁盤備份系統(tǒng)的靈魂所在,這一技術(shù)剛剛推出的時(shí)候,被認(rèn)為主流是后處理技術(shù)——限于當(dāng)時(shí)的處理器性能——這也無(wú)可非議,而在線處理(inline)被認(rèn)為只屬于大中型企業(yè)或是具有一定規(guī)模和高性能的系統(tǒng)的用戶,但隨著多核處理器性能的不斷攀升,無(wú)論是DataDomain還是昆騰都開始涉足中小企業(yè)及遠(yuǎn)程辦公室的D2D重復(fù)數(shù)據(jù)刪除磁盤備份系統(tǒng)。
這一技術(shù)的實(shí)現(xiàn)原理無(wú)需多言——對(duì)于大多數(shù)企業(yè)來(lái)說(shuō)重刪原理并不是那么重要——但DR4000在線處理(inline)的方式很顯然更適合中小型企業(yè):后處理方式仍然需要至少等同于多次全備份的存儲(chǔ)容量,而在線處理卻可以有更小的基礎(chǔ)容量可以選擇。而對(duì)于在線處理可能造成的網(wǎng)絡(luò)負(fù)載壓力瞬時(shí)過(guò)大的問(wèn)題,對(duì)于DR4000所覆蓋的用戶群體來(lái)說(shuō)或許并不存在,畢竟其面對(duì)的用戶的數(shù)據(jù)量不大,以太網(wǎng)的網(wǎng)絡(luò)速度也能夠達(dá)到10Gb,同時(shí),磁盤備份系統(tǒng)多核處理器的在線處理性能也能夠達(dá)到很高的水平。
對(duì)于戴爾的DR4000來(lái)說(shuō),在重復(fù)數(shù)據(jù)刪除技術(shù)領(lǐng)域最大的用戶疑問(wèn)或許是這樣的:戴爾的重刪技術(shù)和DataDomain、昆騰有什么不同(在線處理技術(shù)上DataDomain和昆騰采用的技術(shù)是相同)?戴爾又能夠在看起來(lái)業(yè)已成熟的重復(fù)數(shù)據(jù)刪除技術(shù)上有什么新的花樣?
回答這個(gè)問(wèn)題,核心就在于Ocarina,它是戴爾DR4000的重復(fù)數(shù)據(jù)刪除技術(shù)的靈魂,也是DR4000的靈魂,未來(lái)或許也會(huì)成為戴爾存儲(chǔ)的靈魂。
Ocarina成立于2007年,戴爾于2010年7月將其收歸旗下,在收購(gòu)時(shí),Ocarina公司CEO Murli Thirumale表示:“Ocarina是不同的,是遠(yuǎn)遠(yuǎn)領(lǐng)先于其他供應(yīng)商的。”林佑聲表示,Ocarina最大的特點(diǎn),是“其對(duì)非結(jié)構(gòu)化數(shù)據(jù)的處理能力。”
“我們非常希望從非結(jié)構(gòu)化數(shù)據(jù)方面,能夠提供給用戶更優(yōu)秀的產(chǎn)品,比如說(shuō)我們基于EqualLogic的FS7500和PowerVault NX3500,Ocarina也是如此,都是面向非結(jié)構(gòu)化數(shù)據(jù)的橫向擴(kuò)展架構(gòu)的產(chǎn)品。”林佑聲表示,Ocarina最大的特點(diǎn),是對(duì)非結(jié)構(gòu)化數(shù)據(jù)——不僅僅是文檔和郵件——而是對(duì)于視頻、圖像和WEB上的非結(jié)構(gòu)化文檔,“都會(huì)提供不同處理方式下的壓縮以及重復(fù)數(shù)據(jù)刪除的能力”,因此可以幫助用戶達(dá)到更好的非結(jié)構(gòu)化數(shù)據(jù)的數(shù)據(jù)保護(hù)需求。
Ocarina的重點(diǎn)在于對(duì)非結(jié)構(gòu)化數(shù)據(jù),尤其是視頻和圖像的處理能力,這對(duì)于戴爾正在將結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),塊存儲(chǔ)和文件存儲(chǔ)系統(tǒng)整合形成流動(dòng)數(shù)據(jù)解決方案,在流動(dòng)數(shù)據(jù)、大數(shù)據(jù)、互聯(lián)網(wǎng)市場(chǎng)上獲得優(yōu)勢(shì)至關(guān)重要——總的來(lái)說(shuō),重復(fù)數(shù)據(jù)刪除在絕大多數(shù)情況下,都是面向塊數(shù)據(jù)——結(jié)構(gòu)化數(shù)據(jù)的,非結(jié)構(gòu)化數(shù)據(jù)則主要是文件級(jí)的重復(fù)數(shù)據(jù)刪除,而Ocarina正在突破這一界限。
雖然有關(guān)Ocarina技術(shù)的相關(guān)資料較少,但從公開獲得的資料來(lái)看,Ocarina技術(shù)具有內(nèi)容識(shí)別(content-aware)功能,因此它在處理JPEG文件方面特別有效,除此以外,Ocarina主要面向3個(gè)類型的數(shù)據(jù):
•Microsoft Office files (Powerpoint, Word, Excel)
•Images and Video (JPEG, MPEG, tiff, GIF, PNG,)
•Compound Documents (email, html, web pages, PDF, ZIP, RAR, TAR)
據(jù)Ocarina一位工程師向DOSTOR介紹,Ocarina能夠“對(duì)給出的文件以結(jié)構(gòu)化的理解并使用100種不同算法來(lái)去處理”,而如果這一文件類型對(duì)于Ocarina是全新的,Ocarina會(huì)去推斷信息的結(jié)構(gòu)和內(nèi)容性質(zhì),選擇最有效的數(shù)據(jù)壓縮或是重刪算法。
而在被收購(gòu)以前,Ocarina的數(shù)據(jù)精簡(jiǎn)技術(shù)被稱為“Ocarina ECOsystem數(shù)據(jù)處理系統(tǒng)”,核心的組成部分不僅包括內(nèi)容感知的數(shù)據(jù)壓縮與重復(fù)數(shù)據(jù)刪除算法,還包括為需要壓縮和重刪的數(shù)據(jù)制定最優(yōu)運(yùn)行時(shí)間效率的神經(jīng)網(wǎng)絡(luò)模型。據(jù)上述工程師表示,Ocarina的設(shè)計(jì)初衷是“將數(shù)據(jù)作為一產(chǎn)品來(lái)消費(fèi),重復(fù)數(shù)據(jù)刪除的磁盤備份系統(tǒng)是有關(guān)數(shù)據(jù)的消費(fèi)方式,而不是存儲(chǔ)方式。”即,DR4000的重點(diǎn)在于對(duì)數(shù)據(jù)的處理,而不是保存。也就是說(shuō),戴爾肯定為DR4000選擇了一個(gè)合理重刪比,而非過(guò)度重刪和壓縮——雖然所需要的磁盤容量大幅減少——但重刪數(shù)據(jù)在需要恢復(fù)時(shí)容易因此而出現(xiàn)的重建數(shù)據(jù)時(shí)間過(guò)長(zhǎng)的問(wèn)題。
戴爾流動(dòng)數(shù)據(jù)架構(gòu)重要一環(huán):D2D磁盤備份
DR4000除了以最簡(jiǎn)單的方式使用——作為一個(gè)中間的D2D短期備份區(qū)域,從DR4000的名稱上,實(shí)際上我們還能看出“DR”兩字所代表的是Data Replication或是Disaster Recovery,據(jù)馬軼霏表示,戴爾確實(shí)對(duì)DR4000有兩方面的考慮:一是Data Replication,DR4000有足夠的性能——在某些應(yīng)用環(huán)境下——可能做數(shù)據(jù)復(fù)制甚至是當(dāng)作二級(jí)存儲(chǔ)使用;二是災(zāi)難恢復(fù)Disaster Recovery,這一功能與數(shù)據(jù)復(fù)制都是對(duì)現(xiàn)有戴爾流動(dòng)數(shù)據(jù)解決方案的有益補(bǔ)充,讓其擁有了遠(yuǎn)程數(shù)據(jù)復(fù)制和災(zāi)難恢復(fù)的能力——企業(yè)不可能租用昂貴的光纖鏈路,DR4000基于IP技術(shù)通過(guò)以太網(wǎng)實(shí)現(xiàn)了更低成本的遠(yuǎn)程災(zāi)備。
而無(wú)論是否局限在備份存儲(chǔ)系統(tǒng)上,文件級(jí)重復(fù)數(shù)據(jù)刪除技術(shù)都是非常成熟的,但是塊級(jí)重復(fù)數(shù)據(jù)刪除,尤其是在線快存儲(chǔ)系統(tǒng)的重復(fù)數(shù)據(jù)刪除,其實(shí)還走在起步階段。而戴爾一直宣稱將會(huì)在在線主存儲(chǔ)系統(tǒng)上使用重復(fù)數(shù)據(jù)刪除系統(tǒng)。
DR4000管理界面
對(duì)于戴爾來(lái)說(shuō),在整個(gè)流動(dòng)數(shù)據(jù)解決方案架構(gòu)中,實(shí)現(xiàn)統(tǒng)一化的塊重復(fù)數(shù)據(jù)刪除是困難的。
不同的戴爾存儲(chǔ)平臺(tái)上的數(shù)據(jù)模塊的大小是不同的。在EqualLogic系統(tǒng)中,一個(gè)數(shù)據(jù)塊的大小是15MB,而在Compellent系統(tǒng)中,數(shù)據(jù)模塊的大小是不確定的。64位StorageCenter O/S將在模塊水平上跟蹤數(shù)據(jù)。一個(gè)數(shù)據(jù)塊并非一個(gè)完整的文件,存儲(chǔ)操作系統(tǒng)從原則上可以查出哪些文件是由哪些塊組成的。將文件分割存儲(chǔ)在磁盤中會(huì)增加數(shù)據(jù)的碎片程度。主存儲(chǔ)器的塊級(jí)重復(fù)數(shù)據(jù)刪除功能必須能夠解決這個(gè)問(wèn)題。當(dāng)然,塊越大,在其中發(fā)現(xiàn)重復(fù)數(shù)據(jù)的概率越高。
正如我們所知,你會(huì)從頁(yè)面上讀取數(shù)據(jù),對(duì)數(shù)據(jù)進(jìn)行重復(fù)數(shù)據(jù)刪除處理,然后將數(shù)據(jù)作為一個(gè)連續(xù)的數(shù)據(jù)流重新寫回磁盤,而一旦新的重復(fù)數(shù)據(jù)刪除檢測(cè)算法和空間恢復(fù)算法被開發(fā)出來(lái),戴爾就可以將它整合到EqualLogic 和Compellent的操作系統(tǒng)之中。這樣一來(lái),戴爾不僅在全系列存儲(chǔ)系統(tǒng)上實(shí)現(xiàn)了重復(fù)數(shù)據(jù)刪除,在某種意義上,當(dāng)數(shù)據(jù)進(jìn)入類似DR4000這樣的D2D磁盤備份系統(tǒng)之后,戴爾也統(tǒng)一了其多個(gè)主存儲(chǔ)系統(tǒng)后端備份恢復(fù)數(shù)據(jù)的結(jié)構(gòu)。
這對(duì)于戴爾來(lái)說(shuō)——如果以上想法得到實(shí)現(xiàn)——將會(huì)是顯著受益的:戴爾現(xiàn)在擁有復(fù)雜且全面的產(chǎn)品線,而戴爾存儲(chǔ)的核心價(jià)值觀就是“流動(dòng)數(shù)據(jù)”——數(shù)據(jù)只有被更格式化的、標(biāo)準(zhǔn)化的存儲(chǔ)起來(lái),才有可能順暢的流動(dòng)起來(lái),而DR4000及其后續(xù)產(chǎn)品則完成了這一工作:讓數(shù)據(jù)統(tǒng)一化、格式化和標(biāo)準(zhǔn)化,增強(qiáng)了戴爾流動(dòng)數(shù)據(jù)架構(gòu)的價(jià)值。
而據(jù)戴爾的工程師介紹,在2011年發(fā)布的戴爾流動(dòng)數(shù)據(jù)規(guī)劃中,實(shí)際上已經(jīng)包含了重復(fù)數(shù)據(jù)刪除技術(shù)和戴爾可擴(kuò)展文件系統(tǒng),并且會(huì)考慮應(yīng)用在各個(gè)環(huán)節(jié)上,以及不同的設(shè)備上,也就是說(shuō),戴爾不僅會(huì)擴(kuò)大統(tǒng)一存儲(chǔ)和文件存儲(chǔ)的產(chǎn)品線,同樣會(huì)將重復(fù)數(shù)據(jù)刪除加入到主存儲(chǔ)等其他區(qū)域,更重要的是重復(fù)數(shù)據(jù)刪除對(duì)數(shù)據(jù)的“格式化”作用將在戴爾得到體現(xiàn)——無(wú)論是私有云、公有云還是傳統(tǒng)的數(shù)據(jù)中心,重復(fù)數(shù)據(jù)刪除之后的數(shù)據(jù),未來(lái)甚至有可能在不同的存儲(chǔ)系統(tǒng)之間彼此互相傳輸。
馬軼霏表示,戴爾已經(jīng)看到,具有重復(fù)數(shù)據(jù)刪除技術(shù)的D2D磁盤備份系統(tǒng),能夠提供更好可訪問(wèn)性和可靠性以及“規(guī)范化的格式”,更理想的是對(duì)數(shù)據(jù)增長(zhǎng)有帶來(lái)的成本增長(zhǎng)所控制。因此,戴爾會(huì)在流動(dòng)數(shù)據(jù)一環(huán)中逐步加強(qiáng)這一部分的實(shí)力:“現(xiàn)在DR4000的發(fā)布只是這個(gè)產(chǎn)品系列的第一個(gè)產(chǎn)品,也是一個(gè)重復(fù)數(shù)據(jù)刪除市場(chǎng)的入門級(jí)產(chǎn)品,但是使用的技術(shù)和算法是先進(jìn)的,和未來(lái)我們將要推出的更高端產(chǎn)品一樣的。這樣的技術(shù)我們要逐步加載到整個(gè)系統(tǒng)的各個(gè)環(huán)節(jié),我們的愿景是客戶今后能夠以重復(fù)數(shù)據(jù)刪除之后的文件格式通過(guò)文件存儲(chǔ)系統(tǒng)接口直接傳送到云端。”