Stefan Mandl,西部數(shù)據(jù)中國、日本及亞太地區(qū)銷售與市場營銷副總裁

大眾針對 AI 與數(shù)據(jù)的討論主要集中在GPU和閃存性能,卻很少提及這些數(shù)據(jù)從何而來,又最終存放在哪里。從訓練數(shù)據(jù)集和模型檢查點,到推理日志與遙測技術(shù),AI應用會生成熱(hot data)、溫(warm data)、冷(cold data)等不同類型的數(shù)據(jù),因而需要根據(jù)各自不同的性能與容量需求定制存儲解決方案。機械硬盤(HDD) 在AI基礎(chǔ)設(shè)施中發(fā)揮著關(guān)鍵作用,為長期、大容量的數(shù)據(jù)存儲提供堅實支撐,并與高性能、低延遲的固態(tài)硬盤(SSD)協(xié)同運作。

AI工作負載的現(xiàn)實:并非全是實時運算

隨著科技巨頭在亞洲迅速擴展其AI應用能力,AI在數(shù)據(jù)生命周期的每一個階段都會消耗并生成海量數(shù)據(jù),使數(shù)據(jù)存儲需求隨之激增。這些海量數(shù)據(jù)往往達到PB(Petabyte)級別,為 AI 模型提供所需的數(shù)據(jù)智能,助力在關(guān)鍵時刻和大規(guī)模場景中快速、精準地做出決策。數(shù)據(jù)越多,模型表現(xiàn)越佳。整個過程包括數(shù)據(jù)準備與攝取、模型訓練、推理與提示、推理引擎以及新內(nèi)容生成,使AI高度依賴具備不同特性和功能的存儲解決方案。

性能表現(xiàn)固然重要,但容量、彈性、可擴展性等因素同樣關(guān)鍵。許多數(shù)據(jù)是一次寫入、后續(xù)讀取,或在訓練與遙測日志等特定階段呈現(xiàn)寫入密集型特征。這些數(shù)據(jù)通常會因為合規(guī)要求、模型再訓練、快照保存以及未來審計所需等不同需求,需要長期保存,但并非所有數(shù)據(jù)都需要高性能的閃存存儲。事實上,具前瞻性的AI平臺必須將高速存儲層與高效益存儲層結(jié)合配置。

超大規(guī)模云端服務(wù)供應商高度依賴HDD

高容量、高性價比的HDD解決方案為當今廣泛的大數(shù)據(jù)與數(shù)據(jù)湖提供了基礎(chǔ),這些數(shù)據(jù)湖存儲著用于訓練模型的海量數(shù)據(jù)集。其來源包括原始數(shù)據(jù)檔案、視頻內(nèi)容、對象存儲、系統(tǒng)日志、元數(shù)據(jù)和備份。因此,每一個AI應用都需要智能、可擴展且具成本效益的容量支撐,而這正是HDD持續(xù)發(fā)揮優(yōu)勢的領(lǐng)域。

1. 成本優(yōu)勢

在構(gòu)建AI應用動態(tài)存儲環(huán)境時,單位TB成本是企業(yè)關(guān)鍵考量指標。企業(yè)需要優(yōu)化預算分配,最大化可用資源利用率。大多數(shù)AI數(shù)據(jù)屬于溫數(shù)據(jù)或冷數(shù)據(jù),因此高容量HDD是實現(xiàn)規(guī)?;?、低成本存儲的理想選擇。根據(jù)西部數(shù)據(jù)的研究, HDD 在單位TB成本上相比閃存具備 6 倍優(yōu)勢,特別是在大規(guī)模、高容量環(huán)境中表現(xiàn)突出。與此同時,HDD架構(gòu)持續(xù)創(chuàng)新,使其能夠提供更高的存儲成本效益,隨著HDD容量增長,總體擁有成本 (TCO) 將進一步下降。

2. 性能表現(xiàn)

明確的性價比指標是影響存儲解決方案選擇的關(guān)鍵——核心在于為你的工作負載選擇最合適的解決方案。HDD持續(xù)在AI數(shù)據(jù)生命周期的多個工作負載中展現(xiàn)出強勁性能,實現(xiàn)了成本與性能的平衡。與其為冗余性能支付多余費用,各企業(yè)組織組織可以通過將存儲性能與實際需求對齊,來優(yōu)化總擁有成本。供應商如西部數(shù)據(jù)提供了兼?zhèn)涓咝芗俺杀拘б娴膬Υ娼鉀Q方案,幫助客戶根據(jù)不同工作負載需求,打造合適的存儲組合。

3. 技術(shù)創(chuàng)新

HDD技術(shù)正在不斷演進,以更高容量、更優(yōu)性能和更大價值賦能企業(yè)。這包括磁記錄系統(tǒng)創(chuàng)新,如能量輔助磁記錄 (EAMR) 技術(shù)和疊瓦式磁記錄 (SMR) 技術(shù);以及機械結(jié)構(gòu)創(chuàng)新,例如氦氣封裝HDD,讓3.5英寸硬盤可容納多達11個磁碟,從而在存儲密度、性能與能源效率方面不斷突破。展望未來,隨著熱輔助磁記錄 (HAMR) 的廣泛應用,HDD的容量還將迎來更進一步提升。

存儲命題不是非此即彼,而是分層共進

AI應用對存儲的需求極為廣泛,而HDD一直是滿足亞太地區(qū)長期、大規(guī)模存儲需求的中堅力量,幫助企業(yè)組織以高效、高性價比的方式,滿足不斷增長的高容量需求。如今的HDD并非“傳統(tǒng)技術(shù)”,而是數(shù)據(jù)基礎(chǔ)設(shè)施中,不斷進化的核心引擎,承載當下乃至未來AI工作負載所帶來,龐大且持續(xù)增長的存儲需求。

作者:Stefan Mandl,西部數(shù)據(jù)中國、日本及亞太地區(qū)銷售與市場營銷副總裁

分享到

songjy

相關(guān)推薦