將容量從61TB提升到了122TB并不是簡(jiǎn)單的疊加。Solidigm亞太區(qū)銷售副總裁倪錦峰表示,這一容量需要將一整張晶圓上的所有存儲(chǔ)芯片封裝進(jìn)一塊SSD,對(duì)SSD架構(gòu)設(shè)計(jì)、芯片制造、封裝測(cè)試以及可靠性驗(yàn)證都提出了更高要求。

SSD廠商生產(chǎn)這么大容量的硬盤,任何環(huán)節(jié)的疏漏就可能影響幾周的產(chǎn)能,造成巨大損失。對(duì)用戶而言,任何小小的質(zhì)量問(wèn)題,都可能會(huì)對(duì)數(shù)據(jù)中心的故障切換和數(shù)據(jù)重建帶來(lái)巨大挑戰(zhàn)。因此,確保產(chǎn)品的高可靠性非常重要。

為什么迫切需要這么大的企業(yè)級(jí)SSD?

作為全球一線SSD大廠,Solidigm無(wú)需炫技來(lái)證明自己,之所以做這么大容量,是因?yàn)橛蟹浅F惹械膶?shí)際需求,需求正是來(lái)自于AI技術(shù)浪潮。很多人可能想不到,大容量SSD甚至在一定程度上關(guān)系到AI能否正常落地。

AI在全球范圍內(nèi)掀起了新一輪算力基礎(chǔ)設(shè)施的建設(shè)浪潮,數(shù)據(jù)中心里有了更多帶有AI加速器的服務(wù)器,這些服務(wù)器給數(shù)據(jù)中心的電力供應(yīng)和機(jī)房空間都帶來(lái)了很大壓力,為了緩解壓力,很多數(shù)據(jù)中心都在用大容量SSD替換HDD硬盤。

具體而言,是用高密度的QLC SSD替代原來(lái)TLC和HDD混合存儲(chǔ)方案。QLC SSD較低的能耗需求為AI服務(wù)器騰出了寶貴的電力預(yù)算。在一些地區(qū),數(shù)據(jù)中心建設(shè)計(jì)劃因?yàn)楣╇姴蛔愣粩R置,QLC SSD在電力有限的場(chǎng)景下就顯得更為重要。

與此同時(shí),高密度的QLC還能大幅減少機(jī)房空間占用。減少機(jī)房空間占用就意味著能存下原本存不下的數(shù)據(jù)。Digital Realty在歐洲的一項(xiàng)調(diào)查證實(shí),缺乏足夠的存儲(chǔ)空間來(lái)存放AI所需的海量數(shù)據(jù)集,被企業(yè)列為影響AI落地的頭號(hào)挑戰(zhàn)。

Ocient是一家數(shù)據(jù)分析解決方案服務(wù)商,原來(lái)搭建一套4.41PB的存儲(chǔ)系統(tǒng)大概需要10個(gè)機(jī)架的HDD存儲(chǔ),最大功耗超過(guò)202千瓦。而采用基于Solidigm QLC SSD的高密度存儲(chǔ)方案后,機(jī)架位減少了70%以上,功耗降低了77%以上。

簡(jiǎn)而言之一句話,大容量QLC SSD在節(jié)省電力預(yù)算和節(jié)省空間占用方面的價(jià)值,給AI技術(shù)戰(zhàn)略的實(shí)施帶來(lái)了影響。非常多的企業(yè)迫切需要大容量SSD,以致于61.44TB的Solidigm D5-P5536成為市場(chǎng)上的香餑餑。

SSD可以針對(duì)AI工作負(fù)載進(jìn)行優(yōu)化

SSD除了可以緩解數(shù)據(jù)中心供電和空間壓力以外,還能針對(duì)AI工作負(fù)載的數(shù)據(jù)存儲(chǔ)需求提供非常有價(jià)值的優(yōu)化。

上圖展示的是AI計(jì)算集群在不同階段的數(shù)據(jù)存儲(chǔ)需求。數(shù)據(jù)攝取階段需要較高的順序?qū)懭胄阅?,而歸檔階段則對(duì)隨機(jī)寫入性能要求高。此時(shí),大容量的Solidigm D5-P5336 QLC SSD都能很好地勝任。

在模型訓(xùn)練階段,此時(shí)的GPU需要計(jì)算大量的用于訓(xùn)練的數(shù)據(jù)局,需要存儲(chǔ)快速把數(shù)據(jù)給到GPU。如果隨機(jī)寫入性能不足,GPU就會(huì)有很多閑置時(shí)間,昂貴的GPU一旦閑置就意味著巨大浪費(fèi)。

而且,訓(xùn)練過(guò)程中經(jīng)常會(huì)出錯(cuò)而導(dǎo)致中斷,為了避免從頭再訓(xùn)練,通常都會(huì)創(chuàng)建很多Check-point(檢查點(diǎn),存檔點(diǎn))來(lái)保存計(jì)算的中間結(jié)果。如果創(chuàng)建檢查點(diǎn)以及從檢查點(diǎn)恢復(fù)的速度比較慢的話,也會(huì)讓GPU多很多閑置狀態(tài)。

倪錦峰表示,當(dāng)需要較高性能,而對(duì)于容量要求不高時(shí),基于PCIe 5.0的Solidigm PS1010/PS1030(TLC),基于PCIe 4.0的Solidigm D7-P5520(TLC),或者基于PCIe 4.0的Solidigm D5-P5430(QLC)都是很好的選擇。

其中,Solidigm PS1010/PS1030是去年發(fā)布的主打性能的SSD,這款產(chǎn)品容易被忽視的優(yōu)勢(shì)其實(shí)是能效。實(shí)測(cè)數(shù)據(jù)顯示,D7-PS1010在大多數(shù)AI負(fù)載下的性能/功耗比明顯優(yōu)于行業(yè)競(jìng)品,能為AI存儲(chǔ)提供更強(qiáng)的性能和更低的能耗。

倪錦峰介紹稱,隨著AI計(jì)算性能不斷提升,存儲(chǔ)性能面臨挑戰(zhàn),部分國(guó)內(nèi)廠商已經(jīng)不滿足于只是把SSD用作緩存層。大容量QLC SSD提供了更具成本效益的解決方案,隨著存儲(chǔ)層級(jí)的演進(jìn),QLC SSD 有望在AI時(shí)代發(fā)揮更大作用。

2025年1月發(fā)布的DeepSeek-R1模型推動(dòng)了大模型技術(shù)的普及,該模型能以極低的成本進(jìn)行本地部署推理,還能利用RAG技術(shù)構(gòu)建本地知識(shí)庫(kù),這對(duì)高性能和大容量存儲(chǔ) 提出了更高要求,也為SSD在今年的發(fā)展提供了更充足的信心。

Solidigm正在引領(lǐng)QLC替代HDD的技術(shù)變革浪潮

作為一家有晶圓原廠的專業(yè)企業(yè)級(jí)SSD廠商,Solidigm有基于SLC的高性能、高耐久性的SSD,也有豐富的高性能大容量TLC和QLC硬盤。Solidigm從2018年就率先開(kāi)始在市場(chǎng)上推QLC產(chǎn)品,目前已累計(jì)出貨超過(guò)100EB的QLC產(chǎn)品。

2024年,倪錦峰就曾提到,部分用戶先一步采用大容量的QLC SSD來(lái)替代HDD方案。因此,2024年也被稱為QLC替代HDD的元年。而現(xiàn)在,大量互聯(lián)網(wǎng)大廠都在大力探索落地HDD替代方案,越來(lái)越多創(chuàng)新方案也在采用QLC。

INONET是一家來(lái)自德國(guó)的工業(yè)計(jì)算機(jī)(IPC)研發(fā)和制造企業(yè),在ADAS領(lǐng)域推出 InoNet QuickTray解決方案,這是一個(gè)可快速更換的數(shù)據(jù)存儲(chǔ)托架,主要用于汽車行業(yè)的高速車載數(shù)據(jù)記錄和后續(xù)分析。

通過(guò)使用30TB的Solidigm QLC SSD替換傳統(tǒng)HDD,延長(zhǎng)了測(cè)試車輛的行駛時(shí)間,能夠收集更多數(shù)據(jù),減少返回維修站的頻率,從而降低停機(jī)時(shí)間。此外,Solidigm SSD具備卓越的抗震耐沖擊能力,即使在復(fù)雜道路條件下依然能穩(wěn)定運(yùn)行。

倫敦動(dòng)物學(xué)會(huì) (ZSL) 發(fā)現(xiàn),城市化導(dǎo)致刺猬等野生動(dòng)物的生存空間受限,使得刺猬種群發(fā)展面臨挑戰(zhàn)。為保護(hù)這些動(dòng)物,ZSL部署了攝像系統(tǒng),每天采集超過(guò)1500萬(wàn)張圖片,并利用AI進(jìn)行數(shù)據(jù)分析。然而,龐大的數(shù)據(jù)量讓原有計(jì)算和存儲(chǔ)系統(tǒng)不堪重負(fù)。

為此,ZSL與PEAK:AIO聯(lián)手,采用61.44TB的D5-P5336打造了高密度AI存儲(chǔ),同時(shí)結(jié)合英偉達(dá)DGX AI計(jì)算平臺(tái)。在ZSL倫敦動(dòng)物園的邊緣數(shù)據(jù)中心提供了1.2 PB存儲(chǔ),還將圖像預(yù)處理時(shí)間從3分鐘縮短至30秒,極大提升了研究效率。

正睿科技是一家服務(wù)器和存儲(chǔ)硬件開(kāi)發(fā)商,該公司使用了Solidigm大容量QLC SSD打造了一套畜牧業(yè)生物基因數(shù)據(jù)存儲(chǔ)解決方案,解決了傳統(tǒng)分布式存儲(chǔ)痛點(diǎn),很好地滿足了研究所構(gòu)建單一、大容量數(shù)據(jù)湖的需求。

結(jié)束語(yǔ)

Solidigm以其創(chuàng)新的122TB企業(yè)級(jí)SSD再次證明了其在QLC技術(shù)和企業(yè)級(jí)存儲(chǔ)領(lǐng)域的領(lǐng)先地位。

面對(duì)AI時(shí)代對(duì)數(shù)據(jù)存儲(chǔ)的迫切需求,Solidigm不僅提供了更大容量的解決方案,更通過(guò)技術(shù)優(yōu)化,為AI工作負(fù)載提供了強(qiáng)大的性能支撐。

可以預(yù)見(jiàn),隨著QLC替代HDD的趨勢(shì)加速,Solidigm將在未來(lái)的數(shù)據(jù)中心和AI基礎(chǔ)設(shè)施建設(shè)中扮演越來(lái)越重要的角色。

分享到

zhupb

相關(guān)推薦