從這個(gè)圖表中可以了解企業(yè)在存儲選型中的幾個(gè)關(guān)鍵常識:
1,隨著容量提升,總體性能會有所增加;
2,最佳總體性能通常出現(xiàn)在最高或次高容量SKU中;
3,隨著容量增加,單位容量(每TB)性能會有所下降。
對于硬盤而言,同一代的產(chǎn)品則基本上不存在常識1和2的情況,在轉(zhuǎn)速、單盤密度相同的情況下,能同時(shí)讀寫的只有1組磁頭和1面盤片,因此盤片數(shù)量對性能沒有什么影響。1
而SSD的NAND介質(zhì)可以同時(shí)多通道訪問,更多的顆??梢蕴岣卟⑿行阅埽ǔWR1),直到遇到控制器的通道數(shù)和接口上限(常識2)。
最關(guān)鍵的認(rèn)知就是常識3,而且極具普適性。從硬盤時(shí)代到SSD當(dāng)家的當(dāng)下,只要是對性能有明確要求的場景,服務(wù)器們都采取了用較小容量、較多數(shù)量的盤來獲取較高的性能的思路。以上一篇曾經(jīng)提到的2.5英寸高速硬盤為例,其中最大容量的型號完全沒法與同時(shí)期的3.5英寸硬盤比容量,連十分之一都沒有,但可以通過數(shù)倍的安裝數(shù)量來獲取更高的總體IOPS。
為了優(yōu)化硬盤的單位容量性能,還產(chǎn)生了一種“過度配置”的策略,就是不充分利用硬盤的容量,譬如僅使用一半。其中的原因一方面是盡量部署更多的硬盤,另一方面是因?yàn)橛脖P內(nèi)外圈的訪問速度落差較大,讓數(shù)據(jù)安排在較外圈可以獲得相對高的吞吐量。
如果再把單位容量成本考慮進(jìn)來,通過多塊硬盤提升性能就更不劃算了。因?yàn)橛脖P的定價(jià)與容量的關(guān)系是非線性的,而SSD的定價(jià)與容量之比基本穩(wěn)定。換句話說就是,兩塊較小的SSD的總價(jià),與一塊容量翻倍的SSD的單價(jià)差不多;而兩塊較小容量的硬盤的總價(jià)通常高于一塊大容量的硬盤。這也是硬盤放棄性能競爭而專注于改善容量價(jià)格比的關(guān)鍵經(jīng)濟(jì)原因,使用大量小容量的硬盤在企業(yè)級存儲/數(shù)據(jù)中心當(dāng)中會付出過多的采購成本、機(jī)架空間、能耗的代價(jià)。
與時(shí)俱進(jìn)與逆水行舟
前面對于SSD單位容量性能的比較強(qiáng)調(diào)限于“同代”。SSD的代際提升是非常迅猛的,而且這種高速發(fā)展的勢頭已經(jīng)持續(xù)了十幾年。以目前Solidigm新一代的D7-PS1010為例,它各個(gè)容量點(diǎn)的性能相對同容量的D7-P5520都是翻倍的。
D7-PS1010在同代內(nèi)的單位容量性能也符合遞減的規(guī)律,但跨代相比時(shí),多數(shù)指標(biāo)能夠保持了“以一當(dāng)二”優(yōu)勢。這種優(yōu)勢源于接口帶寬(PCIe總線)、主控性能、NAND介質(zhì)性能的全面提高。單純從接口帶寬的發(fā)展速度看,PCIe接口大致保持了三年左右翻倍的勢頭,過去十年內(nèi)完成了PCIe 3.0、4.0、5.0的普及,業(yè)內(nèi)正在為PCIe 6.0平臺進(jìn)入市場做準(zhǔn)備。
相較于NVMe SSD的快速迭代,硬盤的接口速度已經(jīng)停滯,常用的SATA 6Gb/s和SAS 12Gb/s都已經(jīng)沿用了超過10年時(shí)間,從未成為硬盤性能發(fā)揮的瓶頸。在決定硬盤性能和容量最關(guān)鍵的指標(biāo)單碟密度方面,3.5英寸1TB單碟的硬盤是2011年發(fā)布,1.6TB單碟是2017年發(fā)布,3TB單碟則是2025年才進(jìn)入市場,相應(yīng)的最大傳速率只是從250MB/s左右提升到290MB/s左右。以30TB硬盤計(jì),每TB傳輸率不到10MB/s,IOPS甚至低于10。
SSD的創(chuàng)新與需求細(xì)分
SSD在快速發(fā)展的過程當(dāng)中,并不是簡單的新舊替代,而是針對不同的用戶需求有所側(cè)重,從而逐步擴(kuò)大了應(yīng)用場景的范圍。
譬如Solidigm D7-PS1010使用PCIe 5.0接口,適合最新的服務(wù)器平臺,面向工作負(fù)載繁重、算力飽和且昂貴的場景,典型的如AI服務(wù)器。而對于負(fù)載比較傳統(tǒng)、處理器內(nèi)核數(shù)不太多的主流服務(wù)器,則更喜歡PCIe 4.0 SSD,如Solidigm D7-P5520。
針對寫入強(qiáng)度的差異,同一代的SSD至少也會分為讀寫均衡型(標(biāo)準(zhǔn)耐用度)和寫密集型(增強(qiáng)耐用度),分別對應(yīng)1和3的DWPD參數(shù),譬如D7-P5520與D7-P5620,或D7-PS1010與D7-PS1030的關(guān)系。增強(qiáng)耐用度的SSD通常用于更新頻繁的數(shù)據(jù)庫、索引盤等用途。
如果要求更高的寫入強(qiáng)度、更低的寫入時(shí)延,部份SSD廠商還會提供SLC SSD,譬如Solidigm D7-P5810。這類SSD可以作為緩存/緩沖盤使用,甚至可以部分替代系統(tǒng)內(nèi)存。
隨著用戶逐步認(rèn)識到多數(shù)應(yīng)用是讀多寫少,QLC SSD的接受度也在不斷提高,典型的使用場景包括CDN、超融合、大數(shù)據(jù),以及AI訓(xùn)練數(shù)據(jù)集等。尤其是數(shù)據(jù)量大、功耗預(yù)算緊張的AI集群,非常樂于使用Solidigm D5-P5336為代表的超大容量的QLC SSD構(gòu)建容量層以替代傳統(tǒng)的硬盤陣列。
如果對主流的NVMe SSD進(jìn)行粗略的劃分,在線存儲部分至少可以根據(jù)不同NAND介質(zhì)的性能特點(diǎn)分成三層,分別對應(yīng)SLC、TLC、QLC SSD。
實(shí)際上,根據(jù)前面的介紹,TLC SSD內(nèi)部依然可以做細(xì)分,分為高性能的PCIe 5.0 SSD和高性價(jià)比的PCIe 4.0 SSD。QLC SSD其實(shí)也會有所細(xì)分,譬如成本略高、兼容性更好、性能較好的Solidigm?D5-P5430可以部分替代PCIe 4.0 TLC SSD,還有容量更高、成本略低的D5-P5336用于對吞吐量和存儲密度有較高要求的容量層。
QLC SSD需要更多創(chuàng)新
Solidigm D5-P5336這類超大容量SSD目前最熱衷的使用場景是AI集群的全閃存儲節(jié)點(diǎn)。這種SSD即使用上百TB的容量做分母,其每TB性能仍遠(yuǎn)高于硬盤。
以122.88TB為例,每TB順序讀性能是30TB硬盤的5倍以上,隨機(jī)讀IOPS是上千倍。如果使用容量較小的型號,單位容量性能還會有數(shù)以倍計(jì)的提升。這背后還代表了一個(gè)企業(yè)級用戶特別在意的問題:可預(yù)期性能。SSD的可預(yù)期性能仍有很大的浮動(dòng)空間,如果希望獲得較高的可預(yù)期性能,付出的成本可控。而硬盤的可預(yù)期性能處于下滑趨勢中,適合其存儲的數(shù)據(jù)會越來越“冷”。即使用混閃來改善硬盤存儲的性能問題,但還是無法從根本上解決預(yù)期性能問題——一旦數(shù)據(jù)沒有被緩存命中,僅有個(gè)位數(shù)的IOPS會帶來嚴(yán)重的響應(yīng)延遲。
針對混閃下限逐步降低且難以預(yù)期的性能,業(yè)內(nèi)在推動(dòng)QLC單層存儲方案解決溫存儲問題,面臨的主要障礙還是QLC SSD的單位容量成本明顯高于硬盤??紤]到QLC存儲節(jié)點(diǎn)可以消除過度配置(硬盤有效容量無法充分利用、緩存盤不貢獻(xiàn)可用容量),以及更積極地使用數(shù)據(jù)縮減、數(shù)據(jù)放置技術(shù),QLC存儲的單位容量成本并沒有想象中那么高。
除了通過架構(gòu)設(shè)計(jì)和提升運(yùn)維水平精打細(xì)算,SSD本身的單位存儲物理成本還需要進(jìn)一步下降。在PLC技術(shù)進(jìn)入市場之前,QLC?SSD還有優(yōu)化成本的空間——畢竟QLC SSD的性能依舊相對硬盤有數(shù)量級的優(yōu)勢,如果我們允許可預(yù)期性能下浮,還是有機(jī)會獲得降本空間的。
譬如從網(wǎng)絡(luò)基礎(chǔ)設(shè)施角度看,數(shù)據(jù)中心、企業(yè)內(nèi)的主流網(wǎng)絡(luò)是25~100G,一兩塊SSD就能夠跑滿整個(gè)網(wǎng)絡(luò)帶寬,配置更多的SSD只是擴(kuò)展了容量,性能則完全浪費(fèi)。在當(dāng)前主流QLC SSD與硬盤之間,規(guī)劃一種目標(biāo)性能、功耗低于前者,但單位容量性能仍明顯高于后者的SSD,更適合承擔(dān)主流近線存儲場景的任務(wù)。近線SSD只需要提供當(dāng)前主流SSD幾分之一甚至十分之一的性能,都不會在當(dāng)前主流網(wǎng)絡(luò)設(shè)施內(nèi)出現(xiàn)性能瓶頸,但可預(yù)測性能依舊優(yōu)于硬盤陣列甚至混閃幾個(gè)數(shù)量級。
近線SSD概念的出現(xiàn),改善了目前主流QLC SSD全閃陣列與混閃陣列之間成本落差過大的問題,并徹底解決混閃在部分溫存儲場景中性能不足的窘境,構(gòu)建出新的存儲分層圖景。近線存儲場景消耗的存儲空間巨大,也為SSD的未來發(fā)展提供了更廣闊的天地。在后繼的文章中,我們將對近線SSD的潛在優(yōu)化方向做一些分析。當(dāng)下我們審視近線SSD還難免帶有許多現(xiàn)有SSD產(chǎn)品特征的影子,把它作為QLC SSD擴(kuò)展使用場景的一種努力。在巨大的市場潛力之下,未來的近線SSD很有可能走出一條相對獨(dú)立發(fā)展的路線,優(yōu)化的主控、特化的NAND介質(zhì)等等。