“如果NVMe硬盤標(biāo)準(zhǔn)在OCP里得以建立,那受益的群體不僅僅是互聯(lián)網(wǎng)企業(yè)客戶,還有傳統(tǒng)企業(yè)客戶,乃至存儲(chǔ)系統(tǒng)供應(yīng)商。”在當(dāng)天召開的主論壇上,希捷中國區(qū)產(chǎn)品經(jīng)理劉嘉如是說。
超大規(guī)模數(shù)據(jù)架構(gòu)的演進(jìn)方向
在大規(guī)模數(shù)據(jù)架構(gòu)的演進(jìn)方向方面,劉嘉針對(duì)優(yōu)化QoS以及性能、存儲(chǔ)與計(jì)算分離,以及Composable Open Data Center架構(gòu)進(jìn)行了探討以及希捷在這些方面的實(shí)踐。
針對(duì)計(jì)算和存儲(chǔ)分離這個(gè)話題,劉嘉在主題演講表示,計(jì)算存儲(chǔ)分離,即把CPU、GPU從存儲(chǔ)完全獨(dú)立出來,這是當(dāng)下全球CSP應(yīng)用的一個(gè)方向,目的是為了應(yīng)對(duì)硬盤容量越來越大的情況下提升存儲(chǔ)密度的問題。
當(dāng)數(shù)據(jù)量發(fā)展到一定程度,越來越多的用戶在做數(shù)據(jù)湖、數(shù)據(jù)倉的時(shí)候就會(huì)考慮把存儲(chǔ)單獨(dú)出來,一方面降低TCO,另一方面,對(duì)存儲(chǔ)的優(yōu)化也更有針對(duì)性,包括散熱、振動(dòng)。劉嘉認(rèn)為,超大規(guī)模數(shù)據(jù)架構(gòu)上將會(huì)向著存算分離,以及Composable Data Center這個(gè)架構(gòu)方向去發(fā)展。
Composable Open Data Center架構(gòu)誕生的背景是容器技術(shù)不斷地普及,對(duì)計(jì)算和存儲(chǔ)資源產(chǎn)生更加細(xì)?;慕怦詈弦?,與現(xiàn)有硬件基礎(chǔ)架構(gòu)之間產(chǎn)生的矛盾。其技術(shù)優(yōu)勢(shì)在于可以對(duì)所有的計(jì)算和存儲(chǔ)資源做解耦合,用統(tǒng)一的管理接口與容器的接口去做調(diào)度,提升靈活性,其背后有兩個(gè)連接的技術(shù)提供支撐,之一就是為人熟知的NVMe Over Fabric——它能夠以100微秒的延遲去連接存儲(chǔ)設(shè)備。
目前市場(chǎng)上還只是對(duì)存儲(chǔ)和計(jì)算做一些簡(jiǎn)單的分離,尚無法對(duì)CPU、內(nèi)存、FPGA、GPU做完全的解耦合和顆?;?。未來當(dāng)PCIe Gen5得到普及后,最新的CXL和Gen-Z技術(shù)將通過把連接的延遲從微秒級(jí)降到納秒級(jí),對(duì)諸如CPU與內(nèi)存這樣的計(jì)算資源做解耦合,朝高性能和高存儲(chǔ)方向再邁進(jìn)。
2020年底,希捷已經(jīng)交付20TB熱輔助磁記錄技術(shù)(HAMR)硬盤產(chǎn)品給到業(yè)內(nèi)領(lǐng)先的OEM與云計(jì)算用戶,進(jìn)行測(cè)試與試用。
雙碳話題:踐行社會(huì)責(zé)任
碳達(dá)峰、碳中和是今年的政府工作報(bào)告中提出的年度重要任務(wù)之一,也是“十四五”規(guī)劃和2030/2060應(yīng)對(duì)排放的重要目標(biāo)。作為一個(gè)全球領(lǐng)先的科技企業(yè),希捷正在承擔(dān)起這樣的社會(huì)責(zé)任。
數(shù)據(jù)中心的TCO分成采購成本與運(yùn)維成本兩部分,在運(yùn)維成本中又有一部分跟服務(wù)器的功耗,包括數(shù)據(jù)中心的PUE密切相關(guān)。
早在四、五年前,希捷就跟重要的合作伙伴一起探討和落實(shí)進(jìn)一步降低排放的舉措。例如,將之前得到了廣泛使用的空氣硬盤以功耗比更優(yōu)秀的氦氣硬盤來替代,如一塊16TB的氦氣硬盤,就會(huì)比之前的兩塊8TB能耗更低,這其實(shí)就達(dá)成降碳目標(biāo)的做法。而研發(fā)采用雙磁臂技術(shù)和熱輔助磁記錄技術(shù)的硬盤,當(dāng)容量可以做到50TB,也就是能夠替代三塊16TB容量的硬盤,這就意味著在降碳的同時(shí)實(shí)現(xiàn)性能和容量的兼得。
此外,液冷的技術(shù)也得到了越來越多企業(yè)的關(guān)注,越來越多的廠商正在把這個(gè)技術(shù)以一種更低的成本落地。
談到機(jī)械硬盤,有兩個(gè)話題無法回避。
一是與固態(tài)盤的市場(chǎng)競(jìng)爭(zhēng)問題。從存儲(chǔ)系統(tǒng)市場(chǎng)的角度,業(yè)界的發(fā)展方向是從全硬盤的陣列逐漸過渡到混合陣列,并且有向全閃陣列發(fā)展過渡的趨勢(shì)。很多人認(rèn)為閃存盤因?yàn)樽x寫速度等方面的優(yōu)勢(shì)會(huì)逐漸取代傳統(tǒng)磁盤,但實(shí)際上二者近年來始終都在高速成長,希捷也同時(shí)提供了這兩方面的產(chǎn)品。
針對(duì)實(shí)時(shí)分析的場(chǎng)景需求,固態(tài)硬盤的確更合適一些。但并不是所有采用固態(tài)硬盤的做法就是最優(yōu)的方案。劉嘉認(rèn)為,在大部分場(chǎng)合,企業(yè)盡量都把數(shù)據(jù)存下來展開大數(shù)據(jù)的離線分析等工作,尤其是業(yè)務(wù)對(duì)性能和及時(shí)度、有效度要求并不那么高的情況下,機(jī)械硬盤其實(shí)具備更好的TCO。
那么,機(jī)械硬盤與閃存盤優(yōu)勢(shì)結(jié)合,會(huì)不會(huì)取得1+1>2的效果呢?答案是否定的。
在超大規(guī)模的數(shù)據(jù)架構(gòu)方面,90%的數(shù)據(jù)量仍然還會(huì)依托到硬盤上,原因不外乎是硬盤整體的TCO優(yōu)勢(shì)與數(shù)據(jù)耐寫度、數(shù)據(jù)存儲(chǔ)壽命的優(yōu)勢(shì)。所以很多客戶除了在嘗試新的閃存技術(shù)以外,也在嘗試新的硬盤技術(shù),比如上面提到的雙磁臂技術(shù)就可能大幅度提升硬盤的性能。采用硬盤展開冷存類的業(yè)務(wù)也是另外一種嘗試。
在劉嘉看來,存儲(chǔ)市場(chǎng)始終是一個(gè)動(dòng)態(tài)發(fā)展的過程,短期內(nèi)市場(chǎng)還將維持以傳統(tǒng)機(jī)械硬盤應(yīng)用為主的局面。
系統(tǒng)智能性的優(yōu)化實(shí)踐
系統(tǒng)智能性的最佳實(shí)踐,是希捷在OCP具有引領(lǐng)地位的另一個(gè)項(xiàng)目。
希捷正在與浪潮等服務(wù)器廠商一起探索在硬盤磁道密度不斷增加的同時(shí),化解類似于風(fēng)扇、機(jī)箱等高頻噪聲和機(jī)械振動(dòng)給硬盤在性能方面帶來的影響。據(jù)介紹,希捷的對(duì)策,除了在初期跟服務(wù)器廠商聯(lián)合對(duì)機(jī)箱進(jìn)行設(shè)計(jì),還把Surrogate Acoustic Drive等技術(shù)置于服務(wù)器中,通過驅(qū)動(dòng)麥克風(fēng)捕捉到噪聲的振動(dòng),實(shí)現(xiàn)對(duì)服務(wù)器的設(shè)計(jì)的優(yōu)化。
優(yōu)化后的數(shù)據(jù)顯示,硬盤的性能能達(dá)到了100%。
對(duì)微軟數(shù)據(jù)中心的JBOD部署模式和Facebook數(shù)據(jù)中心服務(wù)器機(jī)箱的設(shè)計(jì),是OCP落地的兩個(gè)非常成功案例。包括微軟,美國所有大型CSP都通過JBOD/JBOF方式部署磁盤,通過計(jì)算和存儲(chǔ)分離,確保最大的資源利用率與提供最佳的TCO;而在Facebook,通過對(duì)機(jī)架和機(jī)箱進(jìn)行優(yōu)化,實(shí)現(xiàn)了最佳的散熱管理,降低了噪聲和振動(dòng)的影響,并提升了硬盤性能和存儲(chǔ)容量。
此外希捷還提供相關(guān)的硬件和測(cè)試套件,以提升自己在相關(guān)領(lǐng)域的領(lǐng)導(dǎo)能力。