閃存峰會參會心得篇
美國閃存峰會一些熱點分享:
一、CXL。內(nèi)存互聯(lián)的標準技術(shù),今年閃存峰會最熱的一個詞就是CXL。所有的廠家都在談,而且有專門的分論壇,很多廠商推出了相應的產(chǎn)品。
三星在會場上推出內(nèi)存語義(Memory-semantic)SSD,可以直接有CXL的接口,做閃存或內(nèi)存用。這個會議上廠商都在談全面轉(zhuǎn)向CXL的話題。但我問了很多分析師,也和很多業(yè)內(nèi)人士做了交流,大家都認為CXL還處于早期階段,真正在企業(yè)里普遍使用估計要等3到5年。
因為CXL要真正發(fā)揮其優(yōu)勢,可能需要PCle 5.0,看現(xiàn)在的存儲里都是PCle 4.0,PCle 5.0很少,包括存儲節(jié)點,支持PCle 5.0的也很少,而且這個標準出來也不是特別久,雖然很熱,但我覺得離大家真正用上還有一段時間。
第二個熱點是英特爾傲騰的問題。正好開會前一兩天英特爾宣布不再繼續(xù)投入傲騰技術(shù)。當然現(xiàn)在還可以買到傲騰,市場上也有庫存,但以后不會再有新一代傲騰技術(shù)。這對整個SCM產(chǎn)業(yè)有很大的影響,因為傲騰發(fā)售量占比最大,相當于其它所有的存儲級內(nèi)存的總和。如果它不做了,市場走向會如何?
這也是一些初創(chuàng)企業(yè)從傲騰轉(zhuǎn)向CXL,CXL變得很熱門的原因之一。這個轉(zhuǎn)向還有點早,因為整個CXL生態(tài)還沒有到來。轉(zhuǎn)向沒問題,但真正交付時會發(fā)現(xiàn)傲騰生態(tài)發(fā)展已經(jīng)快十年,是很成熟的技術(shù),生產(chǎn)交付已成體系,而CXL很新,交付一些項目時會比較麻煩。
作為存儲用戶,尤其企業(yè)存儲而言,我們特別需要SCM這層,因為普通的SSD在性能上相差還是太遠,傲騰SCM很好地補全了這個空隙。新的SCM如何選品,基本包括三個可選項,三星的Z-SSD,但是PCIe插卡的形態(tài),我們喜歡盤的形態(tài)。這次峰會上三星也沒有展出這樣的產(chǎn)品,我覺得它不是特別主推,可能未來會轉(zhuǎn)向CXL。
東芝有現(xiàn)成的盤形態(tài)存儲級內(nèi)存,用的是XL–FLASH,雖然相比傲騰有差距,但比普通閃存快很多。東芝在展會上也推出了很多軟件補丁做加速。另外在展臺上大普威基于自己的主控+XL–FLASH顆粒也推出了存儲級內(nèi)存。
第三個熱點是PCle 5.0/EDSFF。E3.S未來可能取代U.2。因為CXL很火,但CXL真正發(fā)揮其性能需要到PCle 5.0。并且PCle 5.0的形態(tài)也在發(fā)生變化,現(xiàn)在用的PCle 4.0最通用接口是U.2,但PCle 5.0會有新的接口——EDSFF,這種新的接口非常流行,而且有很多中規(guī)格。
個人覺得E3.S規(guī)格跟U.2的規(guī)格很接近,長度寬度比較接近,對服務器的設(shè)計改動會比較少,從存儲的角度考慮,E3.S可能會平滑地替代U.2的SSD接口。其他接口可能會在大型數(shù)據(jù)中心使用,一般的企業(yè)級數(shù)據(jù)中心不是很通用的產(chǎn)品。
第四,QLC/PLC,企業(yè)市場預計明年加速。閃存和硬盤成本預計5年內(nèi)還是會有3-5倍的差距。閃存比硬盤便宜不太可能,但可以更便宜,推出QLC理論上可以做得更便宜。
但基于QLC的消費級盤很多,企業(yè)級盤少,目前市場上能買到的有一家——Solidigm。這家企業(yè)在會場上也發(fā)布了PLC的盤,這也是未來的趨勢。
三星推出了PB級SSD,說支持QLC,但展品寫的是TLC,可能QLC是在路標里?,F(xiàn)在市場上QLC企業(yè)級盤很難選,首先國內(nèi)支持QLC的只有XSKY這一家,因為在存儲上要做很多優(yōu)化。國外有很多,如VAST DATA。由于市場上企業(yè)級的QLC盤選擇不多,它的價格沒有下來,成本沒優(yōu)勢,市場發(fā)售量就起不來,現(xiàn)在最大的問題是市場上可供貨的,支持QLC企業(yè)盤的產(chǎn)品太少。
第四是SmartNIC/DPU/計算型存儲。SmartNIC/DPU/計算型存儲在會議上爭議很大。計算型存儲有很多形式——盤式和卡式,卡式是一個存儲節(jié)點+一塊計算卡,盤式是在SSD上集成ARM CPU,每塊盤都有計算能力。但目前市場并不大,競爭力減弱,未來計算型存儲也會有一些標準,我個人沒有看得特別清楚這個市場。
首先我更傾向于用一個存儲節(jié)點+一塊計算卡,成本更低一些,如果每個盤上都有一個CPU成本太高,而且很難找到很多場景把每個SSD盤上的計算功能都用上,這是我比較困惑的地方,但未來標準化以后可能會是大市場。
第五是鎧俠正在推出的軟件定義閃存概念,還有以太網(wǎng)接口的SSD。個人持保留態(tài)度,成功可能性不大。因為十幾年前以太口在硬盤上做過一次,基本上就是很小眾的市場。而閃存變成以太口也可能是同樣的命運,可能以后也會標準化,有標準會好一點。
軟件定義閃存的架構(gòu)創(chuàng)新
高端存儲變得閃存化,但其架構(gòu)沒有太大變化,我從軟件定義方面談一談企業(yè)對全閃的架構(gòu)創(chuàng)新。第一個廠商是VAST DATA,還沒有進中國,它的產(chǎn)品架構(gòu)做得比較好,就是用SCM做緩存,下面用QLC做真正的數(shù)據(jù)落盤,把成本降得很低。
VAST DATA支持很長的糾刪碼,支持200+4,相當于得盤率很高。還有重刪壓縮技術(shù),通過整體架構(gòu)的改良,把成本降下來,號稱第一家能做到綜合成本比硬盤便宜的廠商。不過產(chǎn)品只適合大客戶,小用戶買它不行,比如糾刪碼很長的優(yōu)勢,200+4,最少200多個盤,小項目只買三個節(jié)點,產(chǎn)品性價比肯定上不去,這是做閃存的創(chuàng)新。
第二是閃存文件方面的創(chuàng)新公司——Weka,其最大的特點是NVMe優(yōu)化做得很好,而且把對象存儲納入進來作為一個整體,數(shù)據(jù)在上面流動,把綜合成本降下來。它不通過QLC降成本,是通過接對象存儲在后端進行分層,對用戶透明,來把整體成本降下來。
第三是做塊存儲的廠商——以色列公司Lightsbit,采用NVMe-OF分離的架構(gòu)來做的,支持的協(xié)議是(NVMe/TCP),NVMe/TCP本來很小眾,本來只它一家,現(xiàn)在已經(jīng)成為一個國際標準,主流廠商現(xiàn)在都支持,比如VMware、EMC。所以NVMe/TCP已經(jīng)成為一個主流技術(shù)。
第四個我認為是未來閃存變革的方向——VMware在不久推出的vSAN8新品,把原來的全閃架構(gòu)全變了,之前是一層緩存一層SSD,就算把硬盤換成SSD,緩存層也必須有,時延上做得不是特別好,就很難支持高性能應用。
推出vSAN8以后,它變成了單層架構(gòu),緩存層沒了,數(shù)據(jù)從計算節(jié)點下來直接落到NVMe盤上,NVMe點對點通信很快,也不占CPU資源,時延會降到最低,充分發(fā)揮NVMe閃存的優(yōu)勢。
我認為這是未來的方向,目前還沒有看到太多產(chǎn)品往這方面走,因為很多的傳統(tǒng)閃存都是兩層架構(gòu),vSAN做出了一個榜樣,現(xiàn)在已知國內(nèi)一些廠家已經(jīng)在做這方面的產(chǎn)品,可能明年會看到國內(nèi)廠商推出單層架構(gòu)存儲產(chǎn)品。
閃存對信創(chuàng)存儲的思考
從技術(shù)層面來看,我的觀點是如果信創(chuàng)存儲用軟件定義存儲的方式做是比較好的思路。原因有兩點,因為我給金融信創(chuàng)實驗室做培訓,他們金融信創(chuàng)實驗室有信創(chuàng)的服務器,也做了很多的測試和應用,生態(tài)很完善,鯤鵬、麒麟、統(tǒng)信,服務器的生態(tài)目前是整個IT生態(tài)里最成熟的一塊,如果存儲的話,軟件定義的話,基于服務器上面再跑軟件變成存儲,自然而然就成為信創(chuàng)存儲,用起來更簡單一些。
這次可以利用底層成熟的硬件生態(tài),構(gòu)建信創(chuàng)存儲的關(guān)鍵。而且信創(chuàng)存儲也是目前很好的方向,目前在高德納技術(shù)曲線中也是唯一的變革性技術(shù)。
第二個特點是軟件定義存儲可以兼容現(xiàn)在的服務器。信創(chuàng)的CPU供貨總是有一點不確定性,畢竟會受到國外的一些影響,如果用軟件定義存儲的方式,擴容選品會自由一些。分布式架構(gòu)還有一個好處,個人感覺目前所有的信創(chuàng)服務器相比X86服務器的性能和穩(wěn)定性上略有差距,這不得不承認,但其整個存儲架構(gòu)是穩(wěn)定的,也會屏蔽掉一些信創(chuàng)底層硬件不太穩(wěn)定的問題。
從周邊產(chǎn)品來看,介質(zhì)方面,信創(chuàng)存儲介質(zhì)怎么選,硬盤沒法選,目前所有的硬盤廠商只有三家,西數(shù)、希捷,還有東芝,國產(chǎn)廠家沒有做硬盤的,而且大家公認硬盤市場不是未來的方向。如果要做信創(chuàng)存儲的話,讓存儲程度更徹底,硬盤就不能用了,只能用閃存。
閃存剛才講還是太貴了,比硬盤貴3-5倍,希望它能適配最新的便宜的介質(zhì),比如剛才說的QLC/PLC,聽說大普威明年也會推出新的國產(chǎn)QLC企業(yè)級SSD,國產(chǎn)的QLC盤有了,可能會把成本降下來。
冷存儲怎么辦?沒有硬盤,可以直接跳過用藍光,如果大的,需要長期存儲的數(shù)據(jù)可以存在藍光上,國產(chǎn)廠商也可以選擇。走全閃加藍光方向構(gòu)造一個全信創(chuàng)的存儲。
存儲網(wǎng)絡方面,現(xiàn)在看到以后存儲的網(wǎng)絡肯定是NVMe -OF,但下面的底層技術(shù)還是傳統(tǒng)技術(shù),以太網(wǎng)或者infiniband、FC,很多廠商都會習慣用FC或者infiniband,但這兩者國內(nèi)都沒有投入,以太網(wǎng)方面,在信創(chuàng)市場,華為、新華三等很多廠商都是以太網(wǎng)支撐的,而以太支撐NVMe就要兩個技術(shù),一個是NVMe/TCP,第二個是RoCE,前者優(yōu)先考慮,因為對交換機沒有要求。如果你要RoCE,雖然性能比較好,但要用數(shù)據(jù)中心交換機,目前來看成本有點高。
總結(jié)
1、如果信創(chuàng)存儲選型,可以優(yōu)先考慮SDS形態(tài),但有些場景SDS不適合,比如金融客戶,后臺系統(tǒng)可能不需要很大的擴展性,但需要高穩(wěn)定性,個人不建議用軟件定義存儲,還是用傳統(tǒng)的存儲,比如華為、宏杉都有信創(chuàng)的高端全閃存儲。
2、SDS的全閃,我個人認為未來單層架構(gòu)是未來創(chuàng)新方向。
3、信創(chuàng)產(chǎn)品的介質(zhì)肯定要優(yōu)先考慮閃存,因為硬盤沒有信創(chuàng)的產(chǎn)品,所以需要這些廠商加大對QLC/PLC的適配。
4、存儲的網(wǎng)絡優(yōu)先選擇以太網(wǎng)。
5、信創(chuàng)不是一個封閉的環(huán)境,要安全跟封閉不是等同的關(guān)系,大家應該有一個開放的心態(tài)。未來信創(chuàng)在全球可能IT是兩極市場,一個是以美國為首的西方國家,有些是以中國為首的東方國家,信創(chuàng)以后也要追求商業(yè)化的成功,不可能只有國內(nèi)用,肯定也要走出去,生態(tài)上要和全球的IT融合。
(該速記整理未經(jīng)本人審閱)