在CXL協(xié)議支持下,內(nèi)存能和DDR內(nèi)存結(jié)合,通過(guò)PCIe通道進(jìn)行帶寬和容量的擴(kuò)展,從而在保證系統(tǒng)性能的同時(shí),降低了企業(yè)在硬件設(shè)備上的投入。比如,此前企業(yè)用戶需要2T內(nèi)存,那么可以采用1TDDR5內(nèi)存+1TCXL內(nèi)存的配置,實(shí)現(xiàn)更靈活的資源調(diào)度,提高數(shù)據(jù)處理效率和資源利用率。

CXL技術(shù)作為未來(lái)內(nèi)存擴(kuò)展和共享資源池的重要組成部分,正在逐漸改變計(jì)算機(jī)系統(tǒng)的架構(gòu)與性能表現(xiàn)。通過(guò)擴(kuò)展內(nèi)存帶寬、降低成本,并為大數(shù)據(jù)和AI應(yīng)用提供支撐,CXL無(wú)疑將在未來(lái)的技術(shù)變革中發(fā)揮重要作用。

CXL標(biāo)準(zhǔn)演進(jìn)

CXL 1.0/1.1:支持基本的緩存一致性與主機(jī)-設(shè)備內(nèi)存訪問(wèn);建立協(xié)議基礎(chǔ);

CXL 2.0:引入內(nèi)存池(memory pooling)、內(nèi)存共享機(jī)制、支持(即支持跨設(shè)備共享、互聯(lián));

CXL 3.0/3.x:2025年CXL規(guī)范進(jìn)入3.x系列成熟期,重點(diǎn)是把CXL?3.1/3.2的一些特性(動(dòng)態(tài)容量、可信安全、全局持久性)落地到實(shí)際硬件與管理軟件中。

CXL 在 AI / 存儲(chǔ) /算力架構(gòu)中的角色與價(jià)值

為什么在 AI、大模型、云計(jì)算時(shí)代,CXL 特別被看重?它能在以下幾個(gè)層面產(chǎn)生價(jià)值:

1. 擴(kuò)展內(nèi)存容量 /緩解冗余

在傳統(tǒng)架構(gòu)中,每個(gè)計(jì)算節(jié)點(diǎn)都要配備自己的內(nèi)存,有時(shí)為了應(yīng)對(duì)極端場(chǎng)景,很多內(nèi)存被閑置或重復(fù)預(yù)留。CXL 允許內(nèi)存池化 /共享,多節(jié)點(diǎn)共享一部分內(nèi)存資源,從而減少冗余、提高總體資源利用率。

2. 降低能耗 / 更高能效

因?yàn)榭砂葱杓せ?/休眠 /共享內(nèi)存,CXL 可幫助數(shù)據(jù)中心 / AI 集群降低內(nèi)存功耗。例如有報(bào)告指出,在某些模擬中,通過(guò)集中化內(nèi)存策略,可節(jié)省 20–30% 的功耗。

3. 縮短數(shù)據(jù)移動(dòng) / 提升訪問(wèn)效率

在未來(lái)的架構(gòu)中,CXL 有可能讓計(jì)算單元(如 NPU / GPU / FPGA)直接訪問(wèn)共享內(nèi)存或其他設(shè)備內(nèi)存,從而減少中間復(fù)制 /拷貝,提升訪問(wèn)效率和帶寬利用。特定情境下,CXL 設(shè)備之間還可以實(shí)現(xiàn)設(shè)備到設(shè)備 (peer-to-peer) 的數(shù)據(jù)傳輸,而不通過(guò)主機(jī)路徑。

4. 存儲(chǔ)與內(nèi)存邊界融合(CXL-SSD / 計(jì)算存儲(chǔ)等方向)

新的研究探索將 SSD / 閃存等塊存儲(chǔ)裝置使用 CXL 協(xié)議暴露為 byte-addressable 設(shè)備 (即 CXL?SSD),使得存儲(chǔ)設(shè)備可以作為擴(kuò)展內(nèi)存被訪問(wèn),同時(shí)兼顧持久性。這樣可以讓一些算法 / workload 直接在設(shè)備端運(yùn)行,減輕主機(jī)負(fù)載。

此外,CXL 交換機(jī)(Switch / Fabric)與持久化交換設(shè)計(jì)也在研究中,以減小持久性存儲(chǔ)訪問(wèn)的延遲開銷。

5. AI / RAG /大模型的場(chǎng)景契合

在 RAG(檢索增強(qiáng)生成模型)、向量數(shù)據(jù)庫(kù)、近似最近鄰搜索(ANN)等場(chǎng)景中,數(shù)據(jù)訪問(wèn)的內(nèi)存帶寬和容量壓力大。CXL可以讓這些系統(tǒng)有更靈活的內(nèi)存結(jié)構(gòu),緩解傳統(tǒng)緩存 / DRAM 裝載的瓶頸。像學(xué)術(shù)界的 Cosmos 系統(tǒng),就是在 CXL 內(nèi)存設(shè)備端集成計(jì)算單元,用于 ANN 搜索任務(wù),以提升吞吐和延遲性能。

分享到

崔歡歡

相關(guān)推薦