從2025年來看,AI與數(shù)據(jù)存儲的關(guān)系已經(jīng)發(fā)生了變化。原本存儲只是支持AI工作負載運行的數(shù)據(jù)基礎(chǔ)設(shè)施,在現(xiàn)在的實踐中,兩者已經(jīng)升級成了一種相互促進,相互成就的共生關(guān)系。
一方面,如今的AI不僅是存儲系統(tǒng)支撐的一種負載,也逐漸成為存儲系統(tǒng)的核心智能組件。另一方面,存儲系統(tǒng)所提供的海量高質(zhì)量數(shù)據(jù),以及對數(shù)據(jù)管理能力,已成為決定AI模型成敗的關(guān)鍵因素之一,存儲系統(tǒng)本身也在發(fā)生變化。
首先,AI正在為數(shù)據(jù)存儲注入智能化能力
通過AIOps技術(shù),存儲基礎(chǔ)設(shè)施獲得了更高的自動化管理水平。AI不僅能夠預(yù)測硬件故障、自動診斷性能瓶頸,還能智能優(yōu)化資源分配,將人工運維從繁瑣的被動響應(yīng)中解放出來。
AIOps超越了基于規(guī)則的被動式IT管理模式,利用先進算法分析海量的數(shù)據(jù)流,從而識別出人眼難以察覺的復雜模式和異常行為。這種方式,使得IT運營從被動響應(yīng),轉(zhuǎn)變?yōu)橹鲃宇A(yù)測和預(yù)防。
通過對歷史數(shù)據(jù)和實時傳感器數(shù)據(jù)的學習,能夠在設(shè)備發(fā)生故障前提前預(yù)警。比如,AI能夠持續(xù)分析SSD內(nèi)置的SMART信息,從而預(yù)測SSD的剩余壽命,然后在出現(xiàn)問題前有計劃地進行更換,從而避免不必要的問題。
現(xiàn)代IT環(huán)境的復雜性使得故障排查變得異常困難,而AIOps平臺能夠從整個IT堆棧中采集并關(guān)聯(lián)數(shù)據(jù),自動診斷性能下降或服務(wù)中斷的根本原因。它的優(yōu)勢在于能迅速定位問題源頭,而無需工程師手動在數(shù)不清的監(jiān)控系統(tǒng)里排查。
類似的,傳統(tǒng)監(jiān)控系統(tǒng)常常產(chǎn)生大量低價值的告警,導致運維團隊進入告警疲勞狀態(tài)。而AIOps能將數(shù)千個相關(guān)告警進行聚合,形成一個具有明確根源和影響范圍的核心事件,從而大幅縮短平均解決時間。
基于AIOps進行資源優(yōu)化與容量規(guī)劃也非常實用。通過分析資源使用模式,AIOps能夠預(yù)測需求,幫助企業(yè)更精準地規(guī)劃,避免浪費。在存儲管理中,AIOps能根據(jù)數(shù)據(jù)的實際訪問頻率自動遷移數(shù)據(jù)到成本更低的存儲層,從而降低存儲開支。
除此之外,由機器學習增強的壓縮與去重以及異常安全行為檢測,都在極大的提升存儲的成本效益和安全性??傊?,有了AI之后,存儲系統(tǒng)正從一個被動的數(shù)據(jù)大倉庫轉(zhuǎn)變?yōu)橐粋€具備自我管理和自我保護能力的智能數(shù)據(jù)平臺。
其次,數(shù)據(jù)存儲行業(yè)正在面向AI進行自我重塑
Garbage In, Garbage Out,這句古老格言在AI時代被賦予了新的內(nèi)涵——低質(zhì)量的數(shù)據(jù)是導致AI項目失敗的重要原因。于是,為了滿足AI對數(shù)據(jù)在規(guī)模、性能和多樣性上的要求,數(shù)據(jù)存儲系統(tǒng)的架構(gòu)、存儲硬件和數(shù)據(jù)管理范式都有新的要求。
首先,數(shù)據(jù)規(guī)模的重要性不難理解,數(shù)據(jù)的規(guī)模直接決定了AI的能力上限。數(shù)據(jù)越大,模型能學到的模式和細節(jié)就越豐富,訓練出的AI也更精準、更智能。同時,大規(guī)模數(shù)據(jù)還能覆蓋更多場景,避免模型產(chǎn)生偏差。
同時,數(shù)據(jù)的多樣性對AI表現(xiàn)的影響也非常大。比如,早期的面部識別系統(tǒng)主要使用白人面孔訓練,導致其在識別深色皮膚個體時準確率極低。因此,一個強大的AI模型必須在多元化的數(shù)據(jù)上進行訓練。
存儲系統(tǒng)需要規(guī)模龐大的、多種多樣的數(shù)據(jù),存儲架構(gòu)也需要發(fā)生變化。從數(shù)據(jù)存儲架構(gòu)的趨勢來看,當前,存儲架構(gòu)正從孤立的數(shù)據(jù)倉庫和數(shù)據(jù)湖,轉(zhuǎn)向統(tǒng)一的數(shù)據(jù)湖倉一體化的架構(gòu)。
這是因為,原本企業(yè)通常維護兩套數(shù)據(jù)系統(tǒng),一個是用于支持BI和報表的數(shù)據(jù)倉庫,里面存的是結(jié)構(gòu)化數(shù)據(jù)。另一套是用于數(shù)據(jù)科學和機器學習的數(shù)據(jù)湖,里面都是非結(jié)構(gòu)化數(shù)據(jù)。這種雙層架構(gòu)導致了嚴重的數(shù)據(jù)孤島問題,系統(tǒng)間進行ETL會有很多問題。
數(shù)據(jù)湖倉一體將數(shù)據(jù)湖與數(shù)據(jù)倉庫結(jié)合在了一起,它統(tǒng)一了結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),它消除了數(shù)據(jù)孤島,為企業(yè)創(chuàng)建了一個單一的可信數(shù)據(jù)源,減少了因數(shù)據(jù)冗余帶來的成本和管理開銷,也加速了從數(shù)據(jù)到模型再到洞察的迭代進程。
在硬件層面,一方面,以NVMe SSD為代表的高性能存儲層,可以最大化GPU的利用率。另一方面,以大容量HDD和磁帶為代表的高容量存儲層,則以極低的單位成本存儲海量訓練數(shù)據(jù)。
為了更好地服務(wù)于AI數(shù)據(jù)存儲的I/O模式,市場上出現(xiàn)了“AI原生”的存儲平臺。這類平臺強調(diào)大規(guī)模并行與可擴展性、極致的低延遲、與AI生態(tài)的深度集成、對統(tǒng)一多協(xié)議訪問的支持。
AI與數(shù)據(jù)存儲之間形成了一個牢固的創(chuàng)新循環(huán)
我們看到,AI與數(shù)據(jù)存儲之間形成了一個創(chuàng)新循環(huán),這一個創(chuàng)新循環(huán)能帶來哪些價值呢?
對于存儲廠商而言,AI與數(shù)據(jù)平臺的融合,推動存儲廠商的商業(yè)模式從靜態(tài)、基于產(chǎn)品銷售的模式,向動態(tài)、基于數(shù)據(jù)洞察和服務(wù)的模式轉(zhuǎn)型。從產(chǎn)品到預(yù)測性服務(wù)的轉(zhuǎn)變,讓存儲廠商從一次性銷售產(chǎn)品轉(zhuǎn)向提供可預(yù)測的成果或服務(wù),創(chuàng)造持續(xù)價值流。
存儲架構(gòu)的數(shù)據(jù)湖倉一體架構(gòu)匯集了所有數(shù)據(jù),而AI模型則能從中挖掘出每個個體的獨特偏好。二者的結(jié)合使得大規(guī)模提供深度個性化體驗成為可能,而個性化的服務(wù)能夠顯著提升用戶粘性,為企業(yè)創(chuàng)造更多價值。
那些擁有較高治理水平數(shù)據(jù)的組織,可以利用AI將其轉(zhuǎn)化為有價值的產(chǎn)品。比如,向市場銷售匿名的行業(yè)趨勢數(shù)據(jù);為金融機構(gòu)提供預(yù)測性的信用風險評分服務(wù);或者提供在特定領(lǐng)域數(shù)據(jù)上預(yù)訓練好的、開箱即用的AI模型。
隨著智能體技術(shù)的興起,AI會變得更加自主。在這些模式中,AI代理能夠以極少的人工干預(yù)執(zhí)行復雜任務(wù),它們能直接與數(shù)據(jù)系統(tǒng)交互以完成工作流。這是今年以來最為廣受關(guān)注的技術(shù)趨勢,這種模式將自動化提升到了全新的高度,也帶來了很多可能。
2025年11月18日,以“釋放數(shù)據(jù)潛能,加速智能涌現(xiàn)”為主題的2025中國數(shù)據(jù)與存儲峰會將于在北京舉行,大會將共同探討AI時代的數(shù)據(jù)基礎(chǔ)設(shè)施演進、存儲技術(shù)創(chuàng)新、智能應(yīng)用實踐及未來發(fā)展趨勢,希望幫助企業(yè)構(gòu)建AI與數(shù)據(jù)存儲螺旋上升的良性循環(huán)。