在生成式AI的工作流中,數據首先要被切割為“詞元”,這些詞元是承載語義的最小單位。例如,在自然語言處理中,詞元可能是一個單詞、短語或字母。這些詞元為AI模型的訓練和推理提供了基礎。

當數據管道不再只是單純的傳輸,而是轉向智能化處理時,存儲系統(tǒng)的價值點發(fā)生了變化,不再僅是存儲大量數據,而是通過“詞元化”技術提取數據的深層價值。

由于生成式人工智能的影響,WEKA的市場正從傳統(tǒng)的高性能計算(HPC)和企業(yè)分析領域發(fā)生轉變。茲維貝爾表示,生成式AI和企業(yè)AI市場持續(xù)爆發(fā)式增長。AI行業(yè)的創(chuàng)新速度驚人,為企業(yè),、政府和研究機構帶來了機遇。

如今,為生成式AI模型訓練和推理提供數據及數據管道的競爭異常激烈。比如DOIT將在3月27日召開人工智能基礎設施峰會,DDN將在3月17日英偉達的GTC25大會上舉辦人工智能數據論壇,VAST Data推出專為人工智能設計的數據基礎設施,所有主流存儲供應商紛紛涌入這個市場,同時Cloudian、MinIO和Scality等對象存儲供應商也蜂擁而至。此外,還有數據管理和編排企業(yè),如Arcitecta、Hammerspace、Komprise等正在構建以人工智能為核心的數據管道。在整個存儲行業(yè),生成式AI推動了以AI為核心的發(fā)展。

詞元經濟正在重塑價值分配法則——存儲系統(tǒng)的價值不再僅僅取決于裝載了多少數據,而在于能提煉出多少可用詞元。這種轉變類似于從原油貿易進階到精細化工產業(yè),可能會催生出新的職業(yè),如存儲咨詢師、詞元精算師、AI存儲合規(guī)專家等。

分享到

崔歡歡

相關推薦