從SPC-1測(cè)試報(bào)告中截選出每款存儲(chǔ)系統(tǒng)相對(duì)重要(所占大頭)的部件參考價(jià)格,其中沒(méi)有包含服務(wù)。筆者感覺(jué)最“給力”的Oracle Sun ZFS 7420c,其實(shí)就是2臺(tái)定制的Sun Fire X4470服務(wù)器,每控制器配置4顆Intel Xeon X7550八核心2.0GHz CPU,一共128條8GB 1066MHz DDR3內(nèi)存(每控制器512GB),8個(gè)2.5英寸512GB SATA SSD讀閃存加速(可能是eMLC或者M(jìn)LC NAND)和8個(gè)3.5英寸SLC SAS-1 SSD寫(xiě)閃存加速(容量和具體用途我們將在下文交代)。

上表中的部分內(nèi)容和名詞,到了介紹對(duì)應(yīng)產(chǎn)品時(shí)自然會(huì)具體解釋。當(dāng)然筆者在本文還有很多想要和大家交流的地方,比如說(shuō)通過(guò)SPC-1測(cè)試報(bào)告中的結(jié)構(gòu) 圖和配置信息,來(lái)簡(jiǎn)單分析每一款存儲(chǔ)系統(tǒng)的硬件設(shè)計(jì)。我們也會(huì)補(bǔ)充其它方面的資料,結(jié)合筆者以前積累的經(jīng)驗(yàn)。其中部分內(nèi)容在存儲(chǔ)行業(yè)資深人士看來(lái)可能有些 班門(mén)弄斧,某種程度上帶有一定產(chǎn)品技術(shù)普及的目的。

另外,最近我也收到了來(lái)自一些同行中肯的意見(jiàn)反饋:比如SPC-1結(jié)果無(wú)法全面反映出存儲(chǔ)系統(tǒng)各種配置下的性能、以及附帶/支持的軟件功能等價(jià)值。 因此,筆者在比較不同型號(hào)陣列時(shí),也會(huì)相應(yīng)的提到統(tǒng)一存儲(chǔ)、自動(dòng)分層存儲(chǔ)、SSD緩存、存儲(chǔ)虛擬化、Scale-out橫向擴(kuò)展、壓縮/重復(fù)數(shù)據(jù)刪除等方 面的高級(jí)技術(shù)特性。希望能夠讓讀者對(duì)產(chǎn)品有一個(gè)更全面了解。

我們?cè)?jīng)提到了空間利用率與每驅(qū)動(dòng)器IOPS之間的微妙關(guān)系,而“每驅(qū)動(dòng)器IOPS×空間利用率×2”是一個(gè)僅供參考的數(shù)字,其目的是排除未用存儲(chǔ)容量(短擊硬盤(pán)?)對(duì)性能測(cè)試可能帶來(lái)的影響。

在后面的幾頁(yè)中,筆者將分別討論5款各具特點(diǎn)的中端存儲(chǔ)系統(tǒng)。涉及的話題包括x86架構(gòu)控制器、存儲(chǔ)虛擬化技術(shù)的不同形式、自動(dòng)分層存儲(chǔ)應(yīng)用現(xiàn)狀分析、形形色色的SSD緩存加速等。

NetApp FAS3270:統(tǒng)一存儲(chǔ)+FlashCache

NetApp FAS3270A運(yùn)行SPC-1測(cè)試配置的參考示意圖

NetApp FAS系列統(tǒng)一存儲(chǔ)和V系列網(wǎng)關(guān)都能同時(shí)提供SAN和NAS文件協(xié)議訪問(wèn)的支持,曾經(jīng)有一段時(shí)間NetApp幾乎就是NAS的代名詞,IBM OEM自NetApp的N系列產(chǎn)品幾乎就是當(dāng)作NAS來(lái)賣(mài)。還有人認(rèn)為NetApp在WAFL文件系統(tǒng)的基礎(chǔ)上“模擬”塊存儲(chǔ)設(shè)備,其效率可能不如純粹的 SAN陣列。不過(guò)從FAS3270A的SPC-1測(cè)試結(jié)果來(lái)看,如今對(duì)于NetApp中端存儲(chǔ)系統(tǒng)的這種顧慮基本可以打消了。

其實(shí)任何RAID陣列的數(shù)據(jù)分塊(Stripe)方式,應(yīng)該都需要有基本的元數(shù)據(jù)或者映射表,文件系統(tǒng)的索引也屬于這種形式。在此借用一位業(yè)內(nèi)朋友的話:“當(dāng)LUN從樹(shù)上下來(lái)開(kāi)始直立行走的時(shí)候,才發(fā)現(xiàn)其實(shí)文件系統(tǒng)早就變成人了。”

NetApp FAS3270A SPC-1測(cè)試配置

如上圖,NetApp FAS3270A統(tǒng)一存儲(chǔ)系統(tǒng)的2個(gè)控制器位于單一的3U機(jī)箱內(nèi),還有一種2個(gè)兩個(gè)機(jī)箱各安裝一個(gè)控制器和IOXM(I/O擴(kuò)展模塊)的HA配置形式。每個(gè)控制器帶有16GB內(nèi)存(總共32GB)、6MB二級(jí)緩存的CPU、512GB FlashCache閃存卡(一共1024GB,用于讀緩存),運(yùn)行NetApp FAS/V系列產(chǎn)品通用的Data ONTAP 8.0.1版本操作系統(tǒng)。

NetApp FAS3270A的控制器機(jī)箱的2種配置方式:上面那個(gè)為3U機(jī)箱內(nèi)安裝一個(gè)控制器和IOXM,實(shí)現(xiàn)HA配置需要再增加一個(gè)機(jī)箱;下面的圖在一個(gè)機(jī)箱中實(shí)現(xiàn)了2個(gè)控制器的HA配置,但沒(méi)有I/O擴(kuò)展模塊。

FAS3270A分別使用2條6Gb SAS后端連接(miniSAS x4,帶寬2.4GB/s)訪問(wèn)后端級(jí)聯(lián)的5臺(tái)DS3424驅(qū)動(dòng)器架(擴(kuò)展柜)–每個(gè)DS4243里滿配24塊3.5英寸300GB 15K RPM高轉(zhuǎn)速SAS硬盤(pán)。控制器前端則各有2個(gè)4Gb/s光纖通道接口(可選8Gb FC)經(jīng)過(guò)2臺(tái)博科300 FC交換機(jī)的冗余存儲(chǔ)網(wǎng)絡(luò)配置連接到2臺(tái)服務(wù)器。

NetApp Flash Cache (PAM II) PCIe閃存卡,硬件上類(lèi)似于Fusion-io,安裝在外置存儲(chǔ)系統(tǒng)中使其具備服務(wù)器主機(jī)共享的讀緩存加速功能。Fusion-io的“PCIe SSD”雖然可以實(shí)現(xiàn)更低的訪問(wèn)延時(shí),不過(guò)被其收購(gòu)的ioTurbine軟件(以及由它組成的ioCache方案)是在一臺(tái)服務(wù)器的Windows虛擬機(jī)之間共享SSD緩存。

FAS3270A使用120個(gè)驅(qū)動(dòng)器的SPC IOPS測(cè)試結(jié)果為68,034.63,不知繼續(xù)增加驅(qū)動(dòng)器數(shù)量性能會(huì)有什么樣的提升(最多支持960個(gè)),當(dāng)然也有人關(guān)注EMC CLARiiON CX4-960/VNX的這個(gè)方面。NetApp高容量利用率的RAID DP(雙校驗(yàn)盤(pán),類(lèi)似于RAID 6)卻能夠達(dá)到本次測(cè)試最高的每驅(qū)動(dòng)器IOPS效率,我們認(rèn)為除了WAFL(Write Anywhere File Layout,寫(xiě)任意文件布局)文件系統(tǒng)重定向隨機(jī)寫(xiě)操作之外,F(xiàn)lash Cache對(duì)于隨機(jī)讀的貢獻(xiàn)應(yīng)該最大,當(dāng)然也因此帶來(lái)了成本的上升。

注:據(jù)了解NetApp現(xiàn)在出貨的高端產(chǎn)品FAS6200系列,應(yīng)該是免費(fèi)贈(zèng)送512GB的PAM II閃存卡。

盡管NetApp官方資料中并沒(méi)有公布其陣列使用的CPU型號(hào),但是通過(guò)《2011存儲(chǔ)Benchmark盤(pán)點(diǎn),意義何在?》一文提到的 SPECsfs2008網(wǎng)絡(luò)文件系統(tǒng)IOPS測(cè)試報(bào)告,我們查詢到FAS3270使用了Intel Xeon E5240雙核處理器,每控制器2顆(一共4顆),這與上面SPC-1配置中的6MB L2 Cache是一致的。

FAS3270在NetApp FAS3200系列中規(guī)格最高,作為一款在2010年下半年發(fā)布的產(chǎn)品,仍然使用至強(qiáng)5400平臺(tái)似乎有點(diǎn)陳舊,而且2顆Xeon 5200系列CPU的性能才相當(dāng)于一顆5400四核處理器。相對(duì)于FAS6200系列使用的Xeon 5500平臺(tái)相比,F(xiàn)AS3200更像是在FAS3100基礎(chǔ)上的一個(gè)小幅升級(jí)。另一方面,也可以看出相比那些用于計(jì)算的服務(wù)器來(lái)說(shuō),存儲(chǔ)系統(tǒng)對(duì)CPU的要求并不是很高。

IBM V7000:虛擬化、自動(dòng)分層存儲(chǔ)普及難?

IBM Storwize V7000運(yùn)行SPC-1測(cè)試配置的參考示意圖

Storwize V7000 Unified是IBM這款產(chǎn)品現(xiàn)在的正式名稱(chēng),因?yàn)樵谌ツ?0月增加了可選的File Module(文件模塊)即NAS網(wǎng)關(guān)之后,V7000也成為一款統(tǒng)一存儲(chǔ)。

上圖給我們的第一感覺(jué)有點(diǎn)抽象,看起來(lái)是2個(gè)Storwize V7000節(jié)點(diǎn)(其實(shí)就是2個(gè)控制器,見(jiàn)下文說(shuō)明),各自通過(guò)2條6Gb SAS(同樣是miniSAS x4)與后端10個(gè)包含24塊硬盤(pán)的單元連接;前端使用每節(jié)點(diǎn)4個(gè)8Gb/s FC接口經(jīng)由2個(gè)光纖通道交換機(jī)連接到2塊雙端口FC HBA卡。而圖片下方的文字解釋有點(diǎn)容易讓人產(chǎn)生誤解。

IBM Storwize V7000 SPC-1測(cè)試配置

這里的雙節(jié)點(diǎn)集群,指的是V7000控制機(jī)箱中的兩個(gè)控制器,每個(gè)控制器帶有8GB內(nèi)存/緩存。Storwize V7000上面的8Gb/s光纖通道接口既可以連接主機(jī),也可以(經(jīng)過(guò)FC交換機(jī))連接其它存儲(chǔ)系統(tǒng),因?yàn)閂7000的軟件系統(tǒng)使用了SVC SAN存儲(chǔ)虛擬化核心代碼。因此該產(chǎn)品是一款具備存儲(chǔ)虛擬化功能的FC+iSCSI陣列。

9個(gè)驅(qū)動(dòng)器擴(kuò)展機(jī)箱與控制機(jī)箱之間的連接方式見(jiàn)下圖:

Storwize V7000增加擴(kuò)展柜按照右側(cè)一列文字從1到9的順序,下方5個(gè)由藍(lán)色示意線級(jí)聯(lián)的擴(kuò)展柜屬于SAS Chain(鏈路) 1,控制機(jī)箱和上面使用綠色示意線級(jí)聯(lián)的4個(gè)擴(kuò)展柜屬于SAS Chain 2,SPC-1測(cè)試配置的每個(gè)機(jī)箱中都裝滿了2.5英寸300GB 10K RPM SAS驅(qū)動(dòng)器。

IBM Storwize V7000控制器結(jié)構(gòu)示意圖

上圖是IBM V7000單個(gè)控制器的結(jié)構(gòu)示意圖,其中使用了一顆代號(hào)為Jasper Forest的Intel Xeon C5500/3500系列四核2.1GHz CPU(應(yīng)該是實(shí)際頻率2.13GHz的Intel Xeon EC3539)。

IBM Storwize V7000軟件模塊示意圖

Storwize V7000號(hào)稱(chēng)集IBM存儲(chǔ)技術(shù)之大成。上面綠色部分為來(lái)自SVC(SAN Volume Controller)已有的I/O堆棧,并在二款產(chǎn)品之間通用;藍(lán)色部分為來(lái)自DS8000 DA Adapter的RAID代碼;粉色部分包括針對(duì)V7000硬件組件編寫(xiě)的新Firmware,以及從XIV“Scale-out網(wǎng)格存儲(chǔ)”移植過(guò)來(lái)的圖形用戶界面。

當(dāng)然還有最初應(yīng)用在IBM System Storage DS8700高端陣列上的Easy Tier自動(dòng)分層存儲(chǔ)技術(shù)。V7000目前支持SSD和HDD兩個(gè)性能層級(jí),也就是說(shuō)如果有不同轉(zhuǎn)速的機(jī)械硬盤(pán)都會(huì)被當(dāng)作同一個(gè)分層來(lái)處理,而現(xiàn)在 DS8800的Easy Tier已經(jīng)可以支持3個(gè)分層。

本文涉及的5款產(chǎn)品中,IBM V7000是唯一支持自動(dòng)分層存儲(chǔ)的。同樣屬于將熱點(diǎn)數(shù)據(jù)放在固態(tài)存儲(chǔ)上優(yōu)化性能并節(jié)約成本的技術(shù),我們看到SSD緩存技術(shù)應(yīng)用越來(lái)越多,而自動(dòng)分層存儲(chǔ) 技術(shù)的應(yīng)用似乎沒(méi)有當(dāng)初預(yù)料的那樣多。究其原因,筆者認(rèn)為首先是閃存存儲(chǔ)技術(shù)還不完全成熟,特別是由其自身結(jié)構(gòu)帶來(lái)的寫(xiě)入性能和壽命問(wèn)題,SLC NAND的情況相對(duì)好一些,eMLC和MLC現(xiàn)階段主要適合于以隨機(jī)讀為主的應(yīng)用。其次是實(shí)現(xiàn)的復(fù)雜度,SSD作為緩存不基本需要用戶進(jìn)行設(shè)置就能實(shí)現(xiàn)比 較理想的效果,自動(dòng)分層則必須有一個(gè)數(shù)據(jù)遷移策略,并允許用戶對(duì)其規(guī)則進(jìn)行定制;而且讀緩存在閃存單元失效的情況下也不會(huì)丟失數(shù)據(jù),而自動(dòng)分層存儲(chǔ)則需要 考慮SSD模塊的冗余高可用,現(xiàn)在流行的RAID 1(10)保護(hù)方式又使其邏輯容量減半。

還有一點(diǎn),就是存儲(chǔ)系統(tǒng)的定位和處理能力。我們?cè)谶@里暫時(shí)先不談全閃存陣列,當(dāng)前的高端陣列IBM DS8800、EMC Symmetrix VMAX、HDS VSP和惠普3PAR都有各家的自動(dòng)分層存儲(chǔ)功能,這個(gè)前提是存儲(chǔ)系統(tǒng)能夠發(fā)揮出一定數(shù)量SSD的性能,而且購(gòu)買(mǎi)相應(yīng)設(shè)備的用戶愿意支付這個(gè)成本。以自動(dòng) 分層存儲(chǔ)技術(shù)見(jiàn)長(zhǎng)的Compellent就不是推薦所有的用戶選擇SSD,在不同轉(zhuǎn)速驅(qū)動(dòng)器、RAID級(jí)別甚至硬盤(pán)內(nèi)/外圈分層都有各自的應(yīng)用價(jià)值。 3PAR V800配置1,920塊HDD創(chuàng)造45萬(wàn)SPC-1 IOPS紀(jì)錄并不讓我感到意外,因?yàn)橐郧八麄兪且患冶容^務(wù)實(shí)的公司,在宣傳自動(dòng)分層存儲(chǔ)技術(shù)時(shí)并沒(méi)有一味強(qiáng)調(diào)性能,而是在同樣性能水平降低30%的成本。 這仍是絕大多數(shù)傳統(tǒng)磁盤(pán)陣列的現(xiàn)狀。

IBM Storwize V7000 Unified統(tǒng)一存儲(chǔ)組成示意圖

V7000 Unified的NAS網(wǎng)關(guān)“基于GPFS近20年在分布式文件領(lǐng)域的技術(shù)”,可以說(shuō)相當(dāng)于在SONAS基礎(chǔ)上簡(jiǎn)化而來(lái)。這一對(duì)File Module(文件模塊)中是不包含寫(xiě)緩存的,這樣的好處是不需要像戴爾EqualLogic FS7500等統(tǒng)一存儲(chǔ)那樣使用UPS或者電池等來(lái)保護(hù)DRAM中的數(shù)據(jù),另外在Active/Active雙節(jié)點(diǎn)高可用的實(shí)現(xiàn)上省去了對(duì)寫(xiě)緩存進(jìn)行一致性鏡像。缺點(diǎn)是文件系統(tǒng)服務(wù)器不對(duì)寫(xiě)入數(shù)據(jù)進(jìn)行緩存加速處理。

Storwize V7000發(fā)布時(shí)支持240個(gè)驅(qū)動(dòng)器(加入雙節(jié)點(diǎn)集群功能之后一共480塊盤(pán)),SPC-1 IOPS測(cè)試在中端陣列中沒(méi)有明顯的亮點(diǎn),不過(guò)這款產(chǎn)品集成的功能還是比較豐富的。

Pillar Axiom 600:緩存/RAID分離式Scale-out

Pillar Data Systems在被Oracle收購(gòu)之前是一家由甲骨文CEO Larry Elison持有的私人公司,如今其產(chǎn)品線仍然保持著和Sun ZFS 7000系列相對(duì)獨(dú)立的特點(diǎn),因此本文也將對(duì)它們單獨(dú)進(jìn)行分析。

Pillar Axiom 600 Series 3運(yùn)行SPC-1測(cè)試配置的參考示意圖

上圖說(shuō)明中的2個(gè)Pillar Axiom Slammer控制器,與兩個(gè)機(jī)柜中間的4個(gè)控制器機(jī)箱似乎有點(diǎn)矛盾?而通過(guò)來(lái)自不同控制器節(jié)點(diǎn)的8個(gè)8Gb/s FC連接到光纖通道交換機(jī),卻只使用服務(wù)器上的一塊雙端口HBA卡運(yùn)行測(cè)試負(fù)載,恰恰是Scale-out橫向擴(kuò)展存儲(chǔ)系統(tǒng)特征的表現(xiàn)(實(shí)際應(yīng)用往往會(huì)連接不只一臺(tái)服務(wù)器)。

Pillar Axiom 600 Series 3測(cè)試配置

這里的QLogic QLA2462 8Gb FC HBA又一次出現(xiàn)了筆誤(應(yīng)該是QLA2562,前面那張圖是正確的)。Pillar Axiom 600的雙控制器(即Slammer)被稱(chēng)為active/active data mover,每控制器24GB緩存一共48GB.測(cè)試系統(tǒng)分別有8個(gè)8Gb/s FC和8個(gè)4Gb/s FC接口用于前、后端連接(總共各有16個(gè)),經(jīng)過(guò)配置的所有驅(qū)動(dòng)器都可以被每一個(gè)控制器上的每一個(gè)后端連接訪問(wèn)。

“FC RAID Brick”是Pillar Axiom 600專(zhuān)用的陣列驅(qū)動(dòng)器擴(kuò)展柜,根據(jù)名稱(chēng)可以看出底層的RAID功能在它上面實(shí)現(xiàn),而不僅僅是簡(jiǎn)單的JBOD連接。除了2U 12盤(pán)位的FC Brick之外,還有2U 13盤(pán)位的

SATA Brick和SSD Brick(其中都包含一個(gè)熱備盤(pán))可選。每個(gè)Brick兩個(gè)“RAID adapter”指的就是雙活動(dòng)配置的RAID控制器(注意:這個(gè)與Slammer控制器不同)。26個(gè)FC Brick滿配一共312個(gè)300GB 15K RPM驅(qū)動(dòng)器是一種優(yōu)化的配置,具體原因我們稍后就會(huì)交待。

Pillar Axiom Slammer規(guī)格表

Pillar Axiom的Slammer一共有四種版本:SAN(4/8Gb FC主機(jī)接口)、iSCSI(1GbE主機(jī)接口)、NAS(1/10GbE主機(jī)接口)和iSCSI Combo(1GbE + 4/8Gb FC主機(jī)接口)。我們理解NAS Slammer的功能就像帶有文件系統(tǒng)NAS網(wǎng)關(guān),而另外3款則與IBM SVC那樣的(存儲(chǔ)虛擬化)卷管理器有相似之處,為什么這樣說(shuō)呢?

Pillar Axiom 600能夠支持4個(gè)Slammer橫向擴(kuò)展,即最多8個(gè)存儲(chǔ)控制器單元。根據(jù)每控制器24GB緩存容量判斷應(yīng)該是Intel Xeon 5500/5600系列4核處理器(3或6通道內(nèi)存?)。Slammer一共有6個(gè)10/100Mb以太網(wǎng)接口用于和Pilot管理節(jié)點(diǎn)的通信;26個(gè) 2Gb或4Gb FC接口針對(duì)Brick后端連接,應(yīng)該也包括Slammer之間的通信。

Pillar Axiom 600在一個(gè)系統(tǒng)中最多支持64個(gè)Brick,也就是他們所說(shuō)的128個(gè)可以獨(dú)立并發(fā)工作的RAID控制器。在SPC-1測(cè)試中配置26個(gè)Brick,估 計(jì)是為了與Slammer的26個(gè)后端連接相對(duì)應(yīng),超出這個(gè)數(shù)量之后帶寬理論上無(wú)法增加。不過(guò)筆者覺(jué)得,繼續(xù)增加硬盤(pán)應(yīng)該是可以提高IOPS性能的。

上圖為以點(diǎn)對(duì)點(diǎn)方式互連的Pillar分布式RAID,與傳統(tǒng)的雙RAID控制器通過(guò)菊花鏈形式級(jí)連JBOD擴(kuò)展柜的對(duì)比示意圖。Pillar的 RAID功能在后端的每個(gè)Brick上實(shí)現(xiàn),因此前端的Slammer主要負(fù)責(zé)存儲(chǔ)池/文件系統(tǒng))的緩存加速;而傳統(tǒng)雙控制器陣列的緩存和RAID功能都 要在控制器上進(jìn)行。按照這個(gè)原理,Pillar的成本和性能應(yīng)該會(huì)更高,而且Slammer和Brick都屬于Scale-out擴(kuò)展方式。那為什么 Axiom 600 Series 3在SPC-1測(cè)試中表現(xiàn)一般呢?

第一種可能:前面的測(cè)試配置參考示意圖,以及配置表中的前/后端各16個(gè)FC連接(使用了其中8個(gè)),應(yīng)該表示該存儲(chǔ)系統(tǒng)配置了最多數(shù)量的4個(gè) Slammer(8個(gè)控制器單元);而2個(gè)Slammer Controller和48GB total緩存的文字說(shuō)明好像只有一個(gè)Slammer;本文第一頁(yè)的價(jià)格表中又是2個(gè)8Gb FC SAN Slammer.到底應(yīng)該以哪個(gè)為準(zhǔn)呢?

第二種可能:即優(yōu)化不足。Pillar沒(méi)有提到為Slammer搭配了UPS等斷電數(shù)據(jù)保護(hù)組件,那么也許它們的Cache只是讀緩存,寫(xiě)入數(shù)據(jù)時(shí)經(jīng)過(guò)Slammer到Brick反而會(huì)增加延時(shí)。當(dāng)然這只是我們的一種推測(cè)。

IBM SVC(SAN卷控制器)6節(jié)點(diǎn)集群 + 2套DS8700運(yùn)行SPC-1測(cè)試配置的參考示意圖

使用6個(gè)IBM SVC存儲(chǔ)虛擬化節(jié)點(diǎn)(3對(duì)高可用)在2套滿配1024塊硬盤(pán)的DS8700陣列前端,運(yùn)行SPC-1測(cè)試結(jié)果達(dá)到曾經(jīng)創(chuàng)紀(jì)錄的38萬(wàn)IOPS,而在只是將SVC減少到4個(gè)節(jié)點(diǎn)其它都不變的情況下,性能就下降到31.5萬(wàn)SPC-1 IOPS.SVC對(duì)性能提升的秘訣就在于緩存,而且每個(gè)節(jié)點(diǎn)捆綁一臺(tái)UPS能夠保護(hù)寫(xiě)緩存中的數(shù)據(jù)在斷電時(shí)不會(huì)丟失。

根據(jù)上圖中的連接情況,數(shù)據(jù)從DS8700經(jīng)過(guò)FC交換機(jī)到達(dá)SVC之后,還要再次經(jīng)過(guò)FC交換機(jī)才能到達(dá)服務(wù)器主機(jī),存儲(chǔ)網(wǎng)絡(luò)結(jié)構(gòu)會(huì)比沒(méi)有SVC時(shí)更為復(fù)雜。這是因?yàn)镾VC上的光纖通道接口兼具連接前端主機(jī)和后端被虛擬化陣列的功能。

相比之下,盡管Pillar Axiom 600的Slammer和Brick之間也需要交換機(jī),但Slammer的前后端FC卻是獨(dú)立的,Slammer、Brick分別有點(diǎn)像存儲(chǔ)虛擬化設(shè)備及其后端連接的陣列,只是二者是專(zhuān)門(mén)打包在一起的產(chǎn)品,增加Slammer就像增加SVC節(jié)點(diǎn)那樣來(lái)提高性能。

Pillar Axiom 600現(xiàn)在屬于Oracle的存儲(chǔ)產(chǎn)品線的一員,再加上他們以前的淵源,具備專(zhuān)門(mén)針對(duì)Oracle數(shù)據(jù)庫(kù)的混合列式壓縮(Hybrid Columnar Compression)功能不足為奇。理論上說(shuō),在上面運(yùn)行這種應(yīng)用能夠比其它廠商的產(chǎn)品節(jié)約空間,同時(shí)可能提升性能,后面會(huì)介紹到的Sun ZFS 7420統(tǒng)一存儲(chǔ)也是如此。

華賽S5600T:高性價(jià)比的x86雙控陣列

華為賽門(mén)鐵克Oceanspace S5600T運(yùn)行SPC-1測(cè)試配置的參考示意圖

華為賽門(mén)鐵克Oceanspace S5600T測(cè)試配置

華賽S5600T應(yīng)該屬于Intel Xeon服務(wù)器平臺(tái)的雙控制器存儲(chǔ)系統(tǒng)。其實(shí)本文前面談到的NetApp FAS3270也是如此,與IBM Storwize V7000之類(lèi)采用SBB Form Factor結(jié)構(gòu)設(shè)計(jì)的陣列相比,由于控制器的空間較大,因此可以選擇功耗高一些的CPU,而且內(nèi)存容量處于明顯優(yōu)勢(shì)。

S5600T配置252個(gè)驅(qū)動(dòng)器的SPC-1 IOPS測(cè)試結(jié)果為102,471.66,而華賽另一款定位更高的中端陣列S6800T配置368個(gè)驅(qū)動(dòng)器(都不是滿配)的SPC-1 IOPS為150,061.17。在沒(méi)有使用SSD緩存的情況下就實(shí)現(xiàn)了較高的每驅(qū)動(dòng)器IOPS,可能與DRAM緩存算法的優(yōu)化有關(guān)。

華賽S5600T的特點(diǎn)大致包括TurboModule高密度I/O模塊及熱插拔設(shè)計(jì)(PCIe擴(kuò)展卡)、TurboBoost三級(jí)性能加速技術(shù) –包括Intel CPU睿頻加速和SmartCache動(dòng)態(tài)數(shù)據(jù)緩存技術(shù)(使用自家的SSD)等??傊畱?yīng)該有不少人承認(rèn)華為系公司不缺乏技術(shù),但價(jià)格或許才是他們真正的殺手锏。

Sun ZFS 7420c:至強(qiáng)7500、1TB內(nèi)存、SSD緩存

Oracle Sun ZFS Storage 7420c運(yùn)行SPC-1測(cè)試配置的參考示意圖

Oracle Sun ZFS Storage 7420c測(cè)試配置

Sun ZFS 7420的一大亮點(diǎn)是每控制器配置了512GB的大容量緩存/內(nèi)存,遠(yuǎn)遠(yuǎn)超過(guò)本次對(duì)比的另外4款中端陣列。該統(tǒng)一存儲(chǔ)運(yùn)行了Solaris ZFS文件系統(tǒng),并使用8個(gè)512GB SSD作為讀緩存,還有8個(gè)73GB相對(duì)小容量的寫(xiě)緩存SSD應(yīng)該是用于文件系統(tǒng)的ZIL(ZFS intent log)日志。

參與SPC-1測(cè)試的7420是Oracle Sun ZFS Storage Appliance系列產(chǎn)品中定位最高的一款,除了剛剛提到過(guò)的內(nèi)存容量,每控制器支持四顆6核1.86GHz或者8核2.0GHz Intel Xeon處理器一看就是至強(qiáng)7500系列。如此高的硬件配置讓我們有些驚訝,有這個(gè)必要嗎?

經(jīng)過(guò)對(duì)5款產(chǎn)品的分析,可以發(fā)現(xiàn)Intel Xeon平臺(tái)控制器、前端主機(jī)接口使用8Gb/s FC和后端通過(guò)6Gb/s SAS連接驅(qū)動(dòng)器已經(jīng)成為主流。除了NetApp FAS3270控制器板載的光纖通道接口仍為4Gb/s(可選8Gb/s FC HBA卡),Pillar Axiom 600的RAID功能位于后端的Brick上屬于例外。

我們?cè)倏纯碨un ZFS統(tǒng)一存儲(chǔ)的軟件特性。文件訪問(wèn)協(xié)議支持NFS v2/v3/v4(pNFS)和CIFS等,塊存儲(chǔ)協(xié)議除了iSCSI和光纖通道之外,還有不多見(jiàn)的IP over Infiniband和RDMA over Infiniband。Oracle使用ZFS文件系統(tǒng)提供了4種級(jí)別的數(shù)據(jù)壓縮和Inline(線內(nèi))塊級(jí)重復(fù)數(shù)據(jù)刪除。強(qiáng)大的CPU計(jì)算能力和大容量?jī)?nèi)存用于數(shù)據(jù)比對(duì)的歷史緩沖區(qū),在未來(lái)出現(xiàn)的支持壓縮/去重等主存儲(chǔ)數(shù)據(jù)精簡(jiǎn)技術(shù)的設(shè)備中可能會(huì)成為一種趨勢(shì)。

在這個(gè)示意圖的最右端,Sun ZFS 7420c的SPC-1測(cè)試配置有34,811GB的未用存儲(chǔ)容量,因此其空間利用率(即總ASU容量在物理容量中所占比例)僅有28.22%。這應(yīng)該與ZFS文件系統(tǒng)無(wú)關(guān),而可能是人為(短擊硬盤(pán))提高IOPS性能所致。

Sun ZFS 7420c在如此“堆硬件”的情況下,使用280個(gè)驅(qū)動(dòng)器運(yùn)行SPC-1測(cè)試結(jié)果為137,066.20 IOPS.盡管其每驅(qū)動(dòng)器IOPS僅次于NetApp FAS3270A在本次對(duì)比中位居第二,不過(guò)考慮到磁盤(pán)鏡像之后的空間利用率僅有28.22%(華賽S5600T為45.38%),這個(gè)性能效率數(shù)字或許又打了一定的折扣??磥?lái)存儲(chǔ)系統(tǒng)的緩存也不見(jiàn)得是越大越好,尤其是像Sun 7420這樣內(nèi)存容量已經(jīng)達(dá)到高端陣列水平的產(chǎn)品。

分享到

wangzhen

相關(guān)推薦