這些數(shù)據(jù)中心的技術(shù)棧正在經(jīng)歷從以通用 CPU 為核心向以 GPU 為中心的加速計算系統(tǒng)轉(zhuǎn)變,架構(gòu)更加貼合 AI 需求,專為并行操作優(yōu)化,旨在滿足新一代 AI 工作負(fù)載及大規(guī)模 AI 吞吐需求。

在此背景下,數(shù)據(jù)中心的存儲架構(gòu)逐步呈現(xiàn)出解耦趨勢——高性能 I/O 層依托 NVMe 與并行文件系統(tǒng),執(zhí)行檢查點與分片讀取操作。非活躍數(shù)據(jù)則存入成本更低的對象存儲,主要保存數(shù)據(jù)集與模型。歸檔層則專注于存儲版本譜系和快照。為確保 GPU 的高效利用率,超高性能數(shù)據(jù) mover 會預(yù)加載數(shù)據(jù),優(yōu)先處理小文件與元數(shù)據(jù),保障整體數(shù)據(jù)流暢性。

大多數(shù)企業(yè)級組織更傾向于通過 OpenAI、Anthropic PBC 等公司或云服務(wù)商構(gòu)建的 API 與軟件對接 AI 應(yīng)用,而非自建 AI 工廠。這類模式的優(yōu)勢在于其軟件層可以不去關(guān)注底層源代碼與復(fù)雜工具,不過如果涉及專有或敏感數(shù)據(jù),企業(yè)也可能選擇部署微型 AI 工廠以增強(qiáng)安全性與控制力。

從存儲系統(tǒng)視角,多家廠商在構(gòu)建 AI 工廠方面的優(yōu)勢:

DDN:與英偉達(dá)及 AI 計算服務(wù)供應(yīng)商關(guān)系密切,且獲得黑石集團(tuán) 3 億美元私募股權(quán)投資,用于 AI 開發(fā)。

戴爾科技:擁有全面的硬件產(chǎn)品與 AI 數(shù)據(jù)平臺,其“閃電計劃”為 PowerScale 和 ObjectScale 存儲系統(tǒng)引入并行訪問能力,以滿足 AI 與 HPC 對高性能、高并發(fā)、低延遲存儲的需求。

NetApp:擁有 AFX 分布式陣列和 AIDE 軟件。

HPE:通過 Alletra Storage MP 實現(xiàn)存儲計算解耦,并具備支持 AI 所需的計算與網(wǎng)絡(luò)能力。

Hitachi Vantara:AI 相關(guān)產(chǎn)品頻頻釋出消息,但尚未推出分布式存儲。

IBM:緊密圍繞大型機(jī)客戶群開展 AI 戰(zhàn)略部署。

Pure Storage:通過 FlashBlade//EXA 實現(xiàn)分布式架構(gòu),并倡導(dǎo)以 AI 為中心的數(shù)據(jù)集管理。

VAST Data:打造 AI 操作系統(tǒng)與 DASE 存儲架構(gòu),保持技術(shù)領(lǐng)先。

WEKA:依賴神經(jīng)網(wǎng)格與增強(qiáng)內(nèi)存網(wǎng)格實現(xiàn)高速數(shù)據(jù)傳輸,盡管上層 AI 數(shù)據(jù)堆棧尚未明顯推進(jìn)。

閃迪:在 FMS 2025 展示了 256TB 容量的 DC SN670 NVMe SSD,采用 BiCS8 QLC NAND 閃存與 UltraQLC 技術(shù),面向 AI 場景深度優(yōu)化,樹立超大容量閃存新標(biāo)桿。

西部數(shù)據(jù):憑借 HAMR(熱輔助磁記錄)技術(shù)提供大容量存儲,助力 AI 工廠高效管理海量數(shù)據(jù)。

此外,Cloudian、MinIO、Scality 等對象存儲廠商正加快布局,將 S3-over-RDMA 納入核心功能,并將 AI 數(shù)據(jù)管道能力納入技術(shù)路線圖。數(shù)據(jù)保護(hù)領(lǐng)域,主流供應(yīng)商亦紛紛發(fā)力,增加 AI 數(shù)據(jù)管道功能,并推出 AI 數(shù)據(jù)網(wǎng)絡(luò)彈性解決方案。

最后

存儲與數(shù)據(jù)保護(hù)廠商正圍繞 AI 場景深度優(yōu)化其架構(gòu)與能力,催生出一場全方位的數(shù)據(jù)基礎(chǔ)設(shè)施重塑浪潮。這場變革不僅涉及技術(shù)迭代,更重塑了企業(yè)構(gòu)建與運(yùn)用 AI 的方式,存儲系統(tǒng)將在未來AI工廠中發(fā)揮關(guān)鍵性作用。

更多AI存儲話題內(nèi)容,歡迎鎖定2025年11月18日即將在北京召開,以“釋放數(shù)據(jù)潛能,加速智能涌現(xiàn)”為主題的2025中國數(shù)據(jù)與存儲峰會,敬請期待!

分享到

崔歡歡

相關(guān)推薦