與之前的Ampere Altra和Ampere Altra Max一樣,AmpereOne也是單物理核單線程的設(shè)計(jì),這樣設(shè)計(jì)的好處是可以避免雙線程之間,相互爭(zhēng)搶資源造成的性能抖動(dòng)。

由于延續(xù)了這一思路,使得它與之前的Ampere Altra系列一樣,也可以提供可預(yù)測(cè)的高性能,提供較強(qiáng)的彈性和可擴(kuò)展性,具備高能效和可持續(xù)性優(yōu)勢(shì)。

AmpereOne的基本參數(shù)信息

AmpereOne出現(xiàn)以前,Ampere Altra系列最多128核心,新的AmpereOne則是從136核起步,最多192核心。所以,AmpereOne可以看做是Ampere Altra的補(bǔ)充,兩者將長(zhǎng)期共存。

Ampere Computing首席產(chǎn)品官Jeff Wittich表示,當(dāng)用戶需要在邊緣計(jì)算場(chǎng)景部署時(shí),可以選擇32核、功耗40瓦的Ampere Altra處理器,對(duì)于算力需求更大的數(shù)據(jù)中心用戶,可以選擇核數(shù)更多,性能更好的處理器。

Ampere Altra系列采用的是7nm,而AmpereOne系列采用的是臺(tái)積電5nm。核心方面,Ampere強(qiáng)調(diào)核心是自研的,由Ampere自有IP全新打造(Arm ISA沒變,所以不存在兼容性問題),這使得Ampere可以根據(jù)需求做更多改動(dòng)。

AmpereOne的部分參數(shù)規(guī)格(L2 Cache翻倍)

能看到,AmpereOne的核心規(guī)格有明顯變化,每個(gè)核心專有L2緩存從原來的1MB提升到了2MB,對(duì)性能提升應(yīng)該很有幫助。但L1的指令緩存從原來的64KB,縮小為16KB。

功耗方面,Ampere Altra的TDP為40-180瓦,而AmpereOne則是200-350瓦。算下來,每個(gè)核心的平均TDP相較于之前有所增長(zhǎng)。

AmpereAltra的部分參數(shù)規(guī)格

AmpereOne支持PCIe Gen5和DDR5內(nèi)存。PCIe通道數(shù)還是128個(gè),內(nèi)存通道依然是8通道。DDR5最大容量翻倍,而AmpereOne支持的最大內(nèi)存容量也從4TB提升到了8TB。

此外,Ampere Altra的最高主頻為3G,AmpereOne也完全保持一致。較低的主頻,帶來較低的工作電壓和較低的功耗,還能讓核心持續(xù)穩(wěn)定在固定頻率上,從而帶來穩(wěn)定的性能表現(xiàn)。

以更少的功耗輸出更多性能

AmpereOne跟隔壁x86處理器完全不一樣套路,單機(jī)架可提供的性能遠(yuǎn)高于x86處理器。同時(shí),在節(jié)省能耗和節(jié)省占地空間方面也有非常大的優(yōu)勢(shì)。

Ampere將能效比優(yōu)勢(shì)視為一大亮點(diǎn)。有調(diào)研數(shù)據(jù)顯示,數(shù)據(jù)中心貢獻(xiàn)了3%以上的碳排放量,是不折不扣的排放大戶,從節(jié)能減排的角度講,AmpereOne非常有優(yōu)勢(shì)。

Ampere還提到了全球多地能源價(jià)格飛漲的現(xiàn)狀,這些也都會(huì)直接影響數(shù)據(jù)中心的運(yùn)營成本,對(duì)于這些地區(qū)的數(shù)據(jù)中心運(yùn)營者來說,能效比占優(yōu)的Ampere非常具有吸引力。

新增BF16計(jì)算精度,提高AI推理能力

Ampere還提到了AmpereOne在AI推理方面的優(yōu)勢(shì),這得益于在FP16,Int16,Int8基礎(chǔ)上新增的對(duì)BF16的支持。

在運(yùn)行文生圖的模型Stable Diffusion時(shí),AmpereOne每秒生成的圖片幀率是AMD EPYC 9654的2.3倍。

在運(yùn)行智能推薦模型DLRM(Deep Learning Recommendation Model)時(shí),AmpereOne每秒能處理的推薦次數(shù)是AMD EPYC 9654的2倍以上。

Jeff Wittich表示,AmpereOne系列處理器設(shè)計(jì)過程中考慮到了AI的需求。

軟件層面,Ampere收購了AI軟件公司OnSpecta,從而讓Ampere處理器更好地運(yùn)行AI相關(guān)負(fù)載。硬件層面,AmpereOne系列處理器新增了對(duì)于BF16計(jì)算精度的支持。

據(jù)了解,目前已經(jīng)有許多企業(yè)都在使用Ampere Altra系列處理器做AI推理,用著Ampere官方Library庫,包括TensorFlow、PyTorch、ONNX等主流框架。

更適合云計(jì)算場(chǎng)景的處理器

Ampere一直喜歡強(qiáng)調(diào)自家做的叫云原生處理器,意在凸顯它非常適合用在公有云的場(chǎng)景。然而,最能體現(xiàn)它適合云場(chǎng)景就是對(duì)虛擬機(jī)的支持。

如上圖所示,由于核心比較多,單個(gè)Rack能支持更多的虛擬機(jī),更多的虛擬機(jī)可以賣給更多的用戶,能幫云廠商產(chǎn)生更多經(jīng)濟(jì)效益。

為了用如此之多的核心穩(wěn)定地支持更多用戶,Ampere在內(nèi)存管理上做了很多優(yōu)化。

在面對(duì)內(nèi)存墻和可能存在的內(nèi)存不均衡問題時(shí),Jeff Wittich表示,AmpereOne擁有更高的內(nèi)存帶寬,更好的帶寬管理技術(shù),新的Chiplet技術(shù),新的網(wǎng)格擁塞管理(Mesh Congestion Management)等技術(shù),這都有助于讓每個(gè)用戶都公平地使用內(nèi)存資源。

從Jeff Wittich的介紹中了解到,下一階段,Ampere將推出12內(nèi)存通道版本的ApmereOne。同時(shí),為了擴(kuò)大在云原生領(lǐng)域的優(yōu)勢(shì),Ampere在未來還將推出更多核心的處理器。

多核處理器將會(huì)讓單路服務(wù)器市場(chǎng)走向繁榮

Ampere的多核處理器確實(shí)為服務(wù)器市場(chǎng)帶來了一些變化,比如,Ampere這種級(jí)別的處理器會(huì)讓單路服務(wù)器走向繁榮。

Jeff Wittich認(rèn)為,單路服務(wù)器市場(chǎng)有明顯的增長(zhǎng)動(dòng)力。

多路服務(wù)器通常是為了彌補(bǔ)算力、核數(shù)、內(nèi)存、IO的不足。然而,多路服務(wù)器不僅會(huì)提高設(shè)計(jì)復(fù)雜度和成本,在使用方面也會(huì)有一些損失。

而當(dāng)單顆處理器核心足夠多的時(shí)候,用戶就沒必要用雙路以及多路服務(wù)器了。

成立短短幾年以來,Ampere 的客戶群正在不斷擴(kuò)大,包括谷歌云、微軟 Azure、甲骨文云、阿里云、百度云、京東云、騰訊云、火山引擎、UCloud等云服務(wù)提供商(CSP),以及 HPE 和 Supermicro、華勤等等OEM廠商都在使用Ampere的Arm處理器。

分享到

zhupb

相關(guān)推薦