(圖片源于網(wǎng)絡(luò))

ChatGPT的火爆,以及東數(shù)西算、數(shù)字化轉(zhuǎn)型等應(yīng)用的強(qiáng)勁增長,使得全球算力呈現(xiàn)供應(yīng)緊張的現(xiàn)象;坊間傳聞,英偉達(dá)(NVIDIA)的AI芯片供貨已經(jīng)排隊(duì)到明年二季度,有人甚至把當(dāng)下人工智能熱度降溫,歸結(jié)于算力的供不應(yīng)求。

算力就是生產(chǎn)力,數(shù)字基礎(chǔ)設(shè)施的重要性也不言而喻。

那么,算力需求和缺口該如何填補(bǔ)?

其實(shí),AI芯片主要分為圖形處理器(GPU)、現(xiàn)場(chǎng)可編程門陣列(FPGA)、專用集成電路(ASIC)、中央處理器(CPU)等類腦芯片四大類。面對(duì)強(qiáng)勁的算力需求,AI芯片作為算力的硬件基石,更需要多種AI芯片各司其職,共同協(xié)作。

今年6月份舉辦的“數(shù)據(jù)中心與AI技術(shù)首映”上,AMD在第四代EPYC(霄龍) CPU產(chǎn)品組合中增加兩款新的工作負(fù)載優(yōu)化處理器——Bergamo和Genoa-X,以及適用于生成式AI的下一代 AMD Instinct 產(chǎn)品。這無疑將大大緩解算力緊缺的局面,同時(shí)也會(huì)顯著降低客戶的投資成本和最終用戶的使用成本。

AMD董事會(huì)主席及CEO蘇姿豐(Lisa Su)博士舉起的不僅僅是EPYC,也托起了人們對(duì)人工智能與計(jì)算領(lǐng)域新的希冀。

為什么這么說呢?兩年前,AMD曾宣布在2025年實(shí)現(xiàn)EPYC 處理器和AMD Instinct加速器能效提高30倍的目標(biāo),這些產(chǎn)品也將為運(yùn)行在加速計(jì)算節(jié)點(diǎn)上的AI訓(xùn)練和高性能計(jì)算應(yīng)用提供算力支持。

這不是空話,很多事例已經(jīng)證明了這一點(diǎn)。例如,唯一投入實(shí)用的百億億次超算——“Frontier”,就使用了AMD的第三代EPYC 處理器及Instinct MI250X加速卡這對(duì)好拍檔。EPYC、Instinct強(qiáng)強(qiáng)聯(lián)手的同時(shí),它們也是開放的,可以搭檔友商的硬件來使用。

Frontier超級(jí)計(jì)算機(jī)(圖片源于網(wǎng)絡(luò))

此外,峰值性能有望超過200億億次的超算預(yù)計(jì)將于明年在美國勞倫斯利弗莫爾國家實(shí)驗(yàn)室亮相。這款名稱“EI Capitan”的超級(jí)計(jì)算機(jī)配備AMD第四代EPYC處理器(Genoa)和最新Instinct MI300A加速器。

2022年11月AMD推出了基于chiplet打造的EPYC第四代處理器Genoa,其以最快的運(yùn)行速度、出色的每插槽性能和每核心性能、超強(qiáng)的安全性、豐富的解決方案生態(tài)系統(tǒng),為不同的工作負(fù)載提供領(lǐng)先的能源效率和最佳的TCO。

2P SPECrate_2017_int_base、2P Enterprise Server-Side Java、2P VMmark 3.1.1、2P SAP Sales 8 Distribution等平臺(tái)提供的測(cè)試數(shù)據(jù)顯示AMD EPYC 9654對(duì)比英特爾最優(yōu)至強(qiáng)8490H處理器的優(yōu)勢(shì)。

“以更少的投資,獲取更多的價(jià)值?!盇MD EPYC的這種領(lǐng)先優(yōu)勢(shì)一直延續(xù)至今。

如今,第四代EPYC處理器還擁有了新的系列,分別是“Genoa-X”和“Bergamo”,還有即將發(fā)布的“Siena”。

加載了AMD 3D V-Cache技術(shù)的“Genoa-X”,其采用的是5nm制程工藝的第四代Zen 4架構(gòu),比上一代Zen3架構(gòu)能效高出62%,同等功耗下性能提升49%。通過3D V-Cache技術(shù)在每個(gè)CCD上額外堆疊64MB緩存,緩存總量高達(dá)1254MB,再輔以AMD Infinity、Guard安全性與更加豐富的解決方案生態(tài),其性能大大提升,有效支持電子設(shè)計(jì)自動(dòng)化相關(guān)的計(jì)算(EDA)、計(jì)算流體動(dòng)力學(xué)(CFD)、有限元分析(FEA)和結(jié)構(gòu)分析(SA)。

運(yùn)行在Ansys基準(zhǔn)測(cè)試上,AMD 96核的EPYC 9684X比英特爾60核Xeon Platinum 8490H的計(jì)算性能優(yōu)勢(shì)超出1-2倍。

采用AMD 3D V-Cache的第四代AMD EPYC處理器Genoa-X 在Ansys CFX中每天可完成更多的設(shè)計(jì)任務(wù),從而大幅加速產(chǎn)品開發(fā);而運(yùn)行ANSYS Fluent的性能最高達(dá)到了英特爾60核的Xeon Platinum 8490H處理器的2.9倍 有效模擬和優(yōu)化產(chǎn)品外部空氣動(dòng)力學(xué)特征,促進(jìn)客戶改進(jìn)產(chǎn)品外觀、提高工作效率、節(jié)省能源消耗;在OpenFOAM的測(cè)試中最高也達(dá)到英特爾Xeon Platinum 8490H的2.2倍,這意味著技術(shù)計(jì)算工作負(fù)載可在更少計(jì)算節(jié)點(diǎn)上獲得高性能表現(xiàn),讓用戶可用更少的機(jī)器來獲得更好的負(fù)載性能表現(xiàn)。

EPYC 97X4(Bergamo)系列處理器采用了Zen4c架構(gòu),它是AMD專門為云計(jì)算場(chǎng)景打造的一款CPU核心,與Zen4架構(gòu)保持了相同的IPC性能和ISA指令集,通過在設(shè)計(jì)上的多項(xiàng)優(yōu)化,使得核心面積大幅縮小,功耗效率大幅提升。Zen4c EPYC處理器搭載128個(gè)核心256個(gè)線程,超過了Zen4的96個(gè)核心192個(gè)線程。Bergaomo提供了可擴(kuò)展性、靈活性、抗壓性、速度、可視化,支持建模、簡化部署和管理,是支持云原生開發(fā)與應(yīng)用的得力武器。

Bergamo有三個(gè)版本:9754、9754S、9734,核心從112到128個(gè),三級(jí)緩存均為256MB。其中EPYC 9754的同步多線程技術(shù)(SMT)可以配置——開啟后可降低總體擁有成本。

AMD EPYC 9754 平均吞吐量性能提升2.9倍。比Ampere Altra Max 128C高出3.7倍,比英特爾Xeon Platinum8490H系列最少也高出了50%。

經(jīng)過NGINX、Redis、Cassandra-test、Memcached、FFmpeg、MySQL TPROC-C、Server-side Java Max等平臺(tái)運(yùn)行測(cè)試,EPYC 9754的平均吞吐量、性能均數(shù)倍于友商。

要實(shí)現(xiàn)每秒處理3.75億的實(shí)時(shí)需求,與128核的2P Ampere Altra相比,同核數(shù)的2P AMD EPYC 9754S可以節(jié)省55%的服務(wù)器數(shù),年度節(jié)省39%的耗電量、39%的運(yùn)營成本,最終減少19%的總體擁有成本。

最近,中國電子技術(shù)標(biāo)準(zhǔn)化研究院審查和公告后的2023年首輪CPUBench公開測(cè)試活動(dòng)報(bào)告顯示,搭載AMD EPYC 9754處理器的新華三UniServer R5500 G6Typical分?jǐn)?shù)拿到了572.8的最好成績。英特爾平臺(tái)最好成績排第四,基于Xeon Platinum 8490H處理器的新華三R6900G6成績?yōu)?49.1,比AMD最好成績落后27.5%。

從第三代EPYC處理器開始,AMD的處理器產(chǎn)品線呈現(xiàn)出了多元化態(tài)勢(shì),第四代EPYC處理器更是根據(jù)市場(chǎng)做了細(xì)分,除了保持傳統(tǒng)優(yōu)勢(shì)的通用型產(chǎn)品,還針對(duì)云原生應(yīng)用、計(jì)算技術(shù)以及面向電信與邊緣端演繹拓展,產(chǎn)品家族越來越豐富的同時(shí),為客戶需求提供更加精準(zhǔn)的解決方案和服務(wù),也為目前的算力困境提出了多種不同的產(chǎn)品組合,助力算力突圍。

產(chǎn)品只是AMD面向從云端到邊緣再到端點(diǎn)的全面應(yīng)用支持的舉措之一。AMD還在架構(gòu)方面和生態(tài)系統(tǒng)合作伙伴攜手打造經(jīng)驗(yàn)證的開放式解決方案,應(yīng)對(duì)全球算力面臨的嚴(yán)峻挑戰(zhàn)。

基于EPYC 9754、9684X與EPYC 9654在密度、能效、頻率等特性方面對(duì)比

AMD不僅開發(fā)了大量軟件及開源平臺(tái),同時(shí)也與合作伙伴緊密牽手,以適配更多的應(yīng)用,支持更多的業(yè)務(wù)需求。

在鞏固拓展EPYC處理器應(yīng)用范圍的同時(shí),AMD的生態(tài)圈在不斷擴(kuò)大,目前已經(jīng)擁有AWS、Oracle、ASUS、聯(lián)想、戴爾、HPE、Supermicro、思科、谷歌云、微軟Azure、騰訊云等大量的生態(tài)伙伴。

前不久,一家市場(chǎng)份額居國內(nèi)前茅的服務(wù)器供應(yīng)商,在其產(chǎn)品戰(zhàn)略發(fā)布會(huì)期間向筆者透露,該公司生產(chǎn)的服務(wù)器中,采用EPYC處理器的數(shù)量占比接近30%。這是一個(gè)很了不起出的數(shù)字——兩年前,這家公司的CEO親口告訴筆者,公司只選擇另外一家供應(yīng)商的處理器。

看得出來,AMD EPYC已經(jīng)成為當(dāng)前市場(chǎng)上性能最為強(qiáng)勁的處理器,其以憑借先進(jìn)的制程工藝、架構(gòu)技術(shù)以及更多的核心、更高的頻率,在整體綜合性、多核整數(shù)性能、多核浮點(diǎn)性能都穩(wěn)居前列;面向AI與未來計(jì)算領(lǐng)域,EPYC處理器用配置與測(cè)試結(jié)果說話, 方方面面“吊打”英特爾,也在AI算力競賽中取得了先機(jī)。伴隨AMD在技術(shù)、服務(wù)和生態(tài)等方面的不斷突破,筆者相信,AMD EPYC處理器將在未來眾多領(lǐng)域、尤其是AI算力領(lǐng)域,將扮演更為重要的角色。

AMD的成功之道,在于“創(chuàng)新”二字。要敢于創(chuàng)新,勇于創(chuàng)新。但創(chuàng)新并非易事,AMDEPYC的故事向我們展示:企業(yè)的成功并沒有捷徑,踏踏實(shí)實(shí)做產(chǎn)品才是王道。

分享到

xiesc

相關(guān)推薦