在介紹MRDIMM和CXL 2.0之前,先來(lái)看看超大的3級(jí)緩存。高達(dá)504MB的三級(jí)緩存,應(yīng)該是英特爾正常的通用處理器當(dāng)中最大的了,平均單核有近4MB緩存,超大的緩存使得核心更高效地獲取數(shù)據(jù),降低內(nèi)存訪問(wèn)延遲,提升整體系統(tǒng)的并行處理能力。
MRDIMM為性能核英特爾至強(qiáng)6提供了更大內(nèi)存的帶寬
接下來(lái)看看MRDIMM內(nèi)存部分。首先,它的傳統(tǒng)DRAM內(nèi)存頻率從DDR5 5600提高到了6400MT/s,如果用MRDIMM內(nèi)存,頻率直接就來(lái)到了驚人的8800MT/s。那么,什么是MRDIMM呢?
MRDIMM(Multiplexed Rank DIMM)是一種新型的內(nèi)存模塊架構(gòu),通過(guò)使用多路復(fù)用技術(shù),使得多個(gè)Rank可以同時(shí)傳輸數(shù)據(jù),從而減少了數(shù)據(jù)傳輸?shù)却龝r(shí)間,最終提升了內(nèi)存帶寬和吞吐量。
簡(jiǎn)而言之,相比傳統(tǒng)的DIMM(雙列直插式內(nèi)存模塊),MRDIMM能夠支持更高的內(nèi)存頻率。這次,英特爾把MRDIMM內(nèi)存速度提升至8800MT/s,顯著提高了內(nèi)存的性能,在數(shù)據(jù)密集型應(yīng)用中,比如高性能計(jì)算、數(shù)據(jù)庫(kù)和人工智能工作負(fù)載都比較受用。
目前,MRDIMM第一代產(chǎn)品可達(dá)到8800 MT/s,而未來(lái)版本計(jì)劃達(dá)到12800 MT/s甚至17600 MT/s,MRDIMM會(huì)顯著提高內(nèi)存的帶寬和數(shù)據(jù)處理能力,讓單顆核心享受到更大的內(nèi)存帶寬,從而緩解內(nèi)存墻的問(wèn)題。
英特爾的中國(guó)專家表示,英特爾希望通過(guò)支持MRDIMM內(nèi)存來(lái)在一定程度上替代原來(lái)CPU Max產(chǎn)品的市場(chǎng)空間。相比之下,CPU Max是英特爾獨(dú)有的產(chǎn)品,而MRDIMM是業(yè)內(nèi)公開(kāi)的標(biāo)準(zhǔn),這一做法也符合英特爾一直以來(lái)比較開(kāi)放的作風(fēng)。
英特爾至強(qiáng)6性能核處理器支持CXL 2.0的Flat內(nèi)存模式
在IO方面,性能核至強(qiáng)6支持多達(dá)96條PCIe 5.0通道,包含64條CXL 2.0通道。特別想說(shuō)的是對(duì)于CXL 2.0的支持,CXL 2.0支持內(nèi)存共享、池化,支持CXL交換機(jī),從而可以讓多個(gè)設(shè)備靈活共享更多內(nèi)存資源,從而緩解內(nèi)存墻的問(wèn)題。
此前發(fā)布的至強(qiáng)6能效核處理器和這次的至強(qiáng)6性能核處理器都支持CXL 2.0,整個(gè)至強(qiáng)6支持三種CXL模式,整個(gè)至強(qiáng)6都可以使用更大的內(nèi)存池,滿足多樣化的工作負(fù)載需求,有更高的內(nèi)存資源利用率。這次,英特爾特別強(qiáng)調(diào),僅至強(qiáng)6性能核處理器支持Flat 內(nèi)存模式。
Flat內(nèi)存模式可以將DRAM和CXL內(nèi)存統(tǒng)一為一個(gè)內(nèi)存層,為操作系統(tǒng)呈現(xiàn)一個(gè)單一的內(nèi)存空間。這個(gè)模式下,硬件級(jí)別的分層管理完全透明,不需要操作系統(tǒng)進(jìn)行干預(yù),內(nèi)存訪問(wèn)也不會(huì)因軟件調(diào)度而受到影響,這會(huì)使得內(nèi)存管理會(huì)更加高效。
Flat內(nèi)存模式的優(yōu)勢(shì)有很多。從公開(kāi)資料可見(jiàn),這種模式下,硬件會(huì)根據(jù)內(nèi)存訪問(wèn)頻率,自動(dòng)將熱點(diǎn)數(shù)據(jù)放在DRAM中,較少訪問(wèn)的數(shù)據(jù)存儲(chǔ)在CXL內(nèi)存中,從而降低延遲。
Flat內(nèi)存模式還支持即插即用的內(nèi)存擴(kuò)展。由于Flat內(nèi)存模式通過(guò)CXL實(shí)現(xiàn)了即插即用的內(nèi)存擴(kuò)展,企業(yè)可以輕松增加內(nèi)存容量,特別適合需要大規(guī)模內(nèi)存支持的應(yīng)用場(chǎng)景,例如AI和科學(xué)計(jì)算場(chǎng)景。
有意思的是,使用Flat內(nèi)存模式時(shí),用戶可以將較便宜的內(nèi)存模塊,或者說(shuō)即將淘汰的DDR4內(nèi)存與新服務(wù)器平臺(tái)支持的高性能DDR5內(nèi)存結(jié)合使用,從而顯著降低內(nèi)存成本,成為降本增效的一把利器。
發(fā)布會(huì)現(xiàn)場(chǎng),超聚變展示了超聚變CXL 2.0內(nèi)存池解決方案。這是業(yè)界首款支持CXL 2.0+內(nèi)存池,支持靈活分配內(nèi)存資源,高效內(nèi)存資源共享,提升系統(tǒng)效能。結(jié)合英特爾至強(qiáng)6性能核處理器,能充分發(fā)揮所有PCIe/CXL端口的帶寬潛力,提升系統(tǒng)整體性能。
從展區(qū)看到的數(shù)據(jù)顯示,該方案提供的共享內(nèi)存訪問(wèn)時(shí)延不到300ns,支持48塊內(nèi)存條,可擴(kuò)展至80個(gè)內(nèi)存條,并且支持從16GB到128GB的內(nèi)存條容量。該方案可用在云計(jì)算/虛擬化、科學(xué)計(jì)算以及AI與推理等場(chǎng)景。
幾年前,CXL就描繪了很美好的未來(lái)。目前看來(lái),考慮到AI等場(chǎng)景對(duì)內(nèi)存帶寬和容量的需求都在快速增加,內(nèi)存池化的部分將會(huì)是最先落地的。英特爾專家介紹稱,英特爾在至強(qiáng)6性能核處理器的內(nèi)存控制器里做了很多工作,有助于改善CXL的延遲情況。
目前,英特爾在積極推進(jìn)CXL技術(shù)落地,已經(jīng)構(gòu)建了較為完備的CXL技術(shù)生態(tài)。在國(guó)內(nèi)也有包括瀾起科技、超聚變等技術(shù)伙伴以及騰訊和阿里巴巴等終端用戶。2024年7月,CXL技術(shù)應(yīng)用俱樂(lè)部(CXL Tech Application Club)成立,預(yù)示著CXL國(guó)內(nèi)產(chǎn)業(yè)生態(tài)步入?yún)f(xié)調(diào)發(fā)展階段。