騰訊云上目前提供的實(shí)例主要分為兩大系列:6代實(shí)例(S6、C6、M6),基于第三代英特爾至強(qiáng)處理器;以及8代實(shí)例(S8、M8),搭載第五代英特爾至強(qiáng)處理器。與原來使用的第三代至強(qiáng)相比,現(xiàn)在搭載第五代至強(qiáng)的實(shí)例性能提升尤為顯著。
首先,物理核心數(shù)量從36個(gè)提升到了56個(gè),內(nèi)存帶寬從DDR4升級(jí)為DDR5,速率提升75%,并且PCIe帶寬也實(shí)現(xiàn)了翻倍。更值得一提的是,L3緩存從60MB增至320MB,提升了5倍,單核的IPC至少提升了25%。
英特爾資深技術(shù)專家表示,這些改進(jìn)使得在實(shí)際應(yīng)用中,騰訊云的實(shí)例可以處理更復(fù)雜的任務(wù),特別是在AI和大規(guī)模數(shù)據(jù)處理場(chǎng)景中表現(xiàn)優(yōu)異。
騰訊云將基于英特爾至強(qiáng)6構(gòu)建下一代CVM實(shí)例
下一階段,英特爾計(jì)劃推出更性能強(qiáng)大的至強(qiáng)6性能核處理器。首先,至強(qiáng)6性能核處理器的核心數(shù)量將增加到128個(gè)。內(nèi)存通道也將從8個(gè)擴(kuò)展到12個(gè),并且,它的內(nèi)存速率將達(dá)到8800MT/s,提升1.57倍。
至強(qiáng)6還支持最新的MRDIMM,MRDIMM的優(yōu)勢(shì)在于通過多路復(fù)用技術(shù)優(yōu)化內(nèi)存數(shù)據(jù)傳輸,提升內(nèi)存系統(tǒng)的帶寬利用率和頻率性能,同時(shí)支持更高的容量和效率,適用于高性能計(jì)算和服務(wù)器環(huán)境。
至強(qiáng)6還引入了新的AI功能,支持FP16數(shù)據(jù)類型,可以為AI推理和訓(xùn)練提供更高精度的選擇。此外,它還支持CXL 2.0,支持各種CXL設(shè)備,為未來的內(nèi)存擴(kuò)展和池化奠定了中套基礎(chǔ)。
英特爾專家表示,英特爾也將用至強(qiáng)6助力騰訊打造下一代CVM實(shí)例。這些硬件提升將為云計(jì)算和AI提供更強(qiáng)大的支持,特別是在需要大規(guī)模數(shù)據(jù)處理和并發(fā)計(jì)算的場(chǎng)景中,至強(qiáng)6的性能將顯著超越其前代。
英特爾的架構(gòu)優(yōu)勢(shì):獨(dú)特的網(wǎng)絡(luò)與內(nèi)存設(shè)計(jì)
相比競(jìng)爭(zhēng)對(duì)手,英特爾至強(qiáng)處理器在架構(gòu)設(shè)計(jì)上具備兩大顯著優(yōu)勢(shì)。
首先,第五代英特爾至強(qiáng)由兩個(gè)Tile構(gòu)成,每個(gè)Tile最多32個(gè)物理核心,處理器最多64核。兩個(gè)Tile通過Mesh網(wǎng)絡(luò)連接,以確保核心之間的低延遲通信。
也就是說,英特爾的Mesh架構(gòu)通過網(wǎng)狀網(wǎng)絡(luò)連接所有的CPU核心,使得多核心的通信延遲顯著降低,這意味著它在多核并發(fā)任務(wù)中表現(xiàn)更為突出。
而AMD采用的是多個(gè)Die的小核心設(shè)計(jì),通過中央的I/O Die連接多個(gè)Die,這種總線式架構(gòu)導(dǎo)致Die之間的通信隔離性較強(qiáng),跨Die時(shí)的延遲較高。
根據(jù)Java負(fù)載基準(zhǔn)測(cè)試發(fā)現(xiàn),在虛擬機(jī)核數(shù)較少時(shí)區(qū)別不大,但當(dāng)虛擬機(jī)超過24核時(shí),英特爾至強(qiáng)處理器的多核性能明顯領(lǐng)先于對(duì)手,最高差出42%,展現(xiàn)了更強(qiáng)的擴(kuò)展性。
其次,內(nèi)存帶寬是影響處理器性能的關(guān)鍵因素之一,特別是在需要頻繁內(nèi)存讀寫的應(yīng)用中,如AI訓(xùn)練、游戲和科學(xué)計(jì)算。
第五代英特爾至強(qiáng)的加持,讓騰訊云S8 CVM單核內(nèi)存帶寬達(dá)到了3.2GB/s,基于AMD的SA4高33%,比基于AMD的SA5高出77%。
當(dāng)內(nèi)存帶寬不會(huì)輕易成為系統(tǒng)瓶頸,處理器可以更高效地執(zhí)行復(fù)雜任務(wù),在處理大規(guī)模并發(fā)任務(wù)時(shí)會(huì)更從容。
應(yīng)用場(chǎng)景:游戲、科學(xué)計(jì)算與數(shù)據(jù)處理
英特爾至強(qiáng)處理器的技術(shù)優(yōu)勢(shì)在多個(gè)行業(yè)的應(yīng)用中得到了驗(yàn)證,尤其在游戲、科學(xué)計(jì)算和數(shù)據(jù)處理等領(lǐng)域表現(xiàn)尤為出色。
為游戲行業(yè)用戶提供更高性能和更低延遲
MMORPG、FPS、以及很多對(duì)戰(zhàn)游戲?qū)Ψ?wù)器的要求很高,特別是在并發(fā)計(jì)算和實(shí)時(shí)數(shù)據(jù)同步方面。游戲中的玩家行為涉及大量的時(shí)空矢量計(jì)算,這些計(jì)算需要在極短時(shí)間內(nèi)完成,同時(shí)還要同步大量數(shù)據(jù),以確保玩家實(shí)時(shí)看到其他玩家的動(dòng)作。
首先,第五代英特爾至強(qiáng)通過更高的IPC性能和AVX-512指令集加速這些矢量計(jì)算,同時(shí)內(nèi)置的AI加速引擎能夠提升游戲中的AI表現(xiàn)。第五代英特爾至強(qiáng)在單核性能上比前代提升25%,能夠支持更多的玩家并發(fā)運(yùn)行。
此外,搭載第五代英特爾至強(qiáng)的騰訊云S8云主機(jī)有更大的L3緩存、更高的內(nèi)存帶寬和網(wǎng)絡(luò)吞吐能力,這有助于減少延遲,確保更快的數(shù)據(jù)同步和更流暢的游戲體驗(yàn)。
同時(shí),采用第五代英特爾至強(qiáng)的騰訊云S8云主機(jī)在高密度部署時(shí)性能衰減更可控,適合游戲服務(wù)器的大規(guī)模部署。
最后,英特爾在游戲領(lǐng)域還提供了優(yōu)化的編譯器、渲染工具包和AI工具,幫助提升游戲開發(fā)和運(yùn)行的性能。
英特爾與Riot Games合作的游戲《Valorant》就是一個(gè)典型案例。通過軟硬件優(yōu)化,英特爾幫助《Valorant》實(shí)現(xiàn)了128Tickrate的刷新率,帶來了更低延遲和更流暢的游戲體驗(yàn)?!禫alorant》在國(guó)服上線時(shí),英特爾通過硬件升級(jí)和優(yōu)化,提升了用戶承載量。
科學(xué)計(jì)算領(lǐng)域,加速仿真與研發(fā)
在科學(xué)計(jì)算領(lǐng)域,英特爾至強(qiáng)處理器同樣有出色表現(xiàn)。通過與騰訊云和合作伙伴的聯(lián)合解決方案,基于英特爾至強(qiáng)處理器的云架構(gòu)能夠顯著提升并發(fā)計(jì)算的能力。
比如,騰訊云與速石科技合作,基于搭載英特爾至強(qiáng)實(shí)例的騰訊云服務(wù)器,建立了混合云存算分離架構(gòu)。該架構(gòu)使任務(wù)并發(fā)量提高了100%,仿真周期縮短了30%。
與晶泰科技合作的藥物研發(fā)案例中,英特爾不僅提供了硬件支持,還利用了OneAPI軟件生態(tài)庫。這個(gè)生態(tài)庫包含了科學(xué)計(jì)算所需的編譯器、數(shù)學(xué)庫、通信庫和并行庫,幫助優(yōu)化計(jì)算性能。
通過這套軟件優(yōu)化,總體性能提升了2.32倍,其中,切換到英特爾編譯器,性能提升了41%。通過使用英特爾數(shù)學(xué)庫,性能提升了28%。利用英特爾IPP中的AVX-512指令集,性能提升了38%。
提升數(shù)據(jù)庫性能
在數(shù)據(jù)處理領(lǐng)域,特別是數(shù)據(jù)庫的應(yīng)用中,英特爾至強(qiáng)憑借大容量的L3緩存和向量計(jì)算能力,顯著提升了數(shù)據(jù)庫的性能。例如,在MySQL數(shù)據(jù)庫的測(cè)試中,第五代英特爾至強(qiáng)比第三代英特爾至強(qiáng)在同等規(guī)格下,性能提升了40%。
小結(jié)
英特爾通過不斷創(chuàng)新,繼續(xù)在競(jìng)爭(zhēng)激烈的通用計(jì)算市場(chǎng)中保持領(lǐng)先。通過與騰訊云等領(lǐng)先的云服務(wù)提供商的合作,英特爾至強(qiáng)處理器不僅在當(dāng)前應(yīng)用中展現(xiàn)了卓越的性能,還為未來的云計(jì)算和AI工作負(fù)載提供了堅(jiān)實(shí)的基礎(chǔ)。