后來(lái)聽(tīng)亞馬遜云科技的人介紹Graviton,說(shuō)這是云原生處理器,最近聽(tīng)Ampere的人介紹Ampere Altra,這才幡然醒悟,對(duì)云原生處理器的概念有了一點(diǎn)認(rèn)識(shí),也漸漸認(rèn)可了這類Arm處理器更適合公有云的說(shuō)法。

此前聽(tīng)亞馬遜云科技的人介紹Graviton2,當(dāng)時(shí)印象最深的除了相比x86有最高40%的性價(jià)比優(yōu)勢(shì),就是Graviton的單物理核心提供單線程的獨(dú)特設(shè)計(jì),單個(gè)物理核有獨(dú)享的緩存,避免了核心之間爭(zhēng)搶緩存從而影響性能,使得性能和延遲表現(xiàn)會(huì)更穩(wěn)定。

Ampere 80核的Ampere Alta和128核的Ampere Alta Max也能實(shí)現(xiàn)顯著的降本增效。在基于Ampere Altra騰訊云SR1實(shí)例上,對(duì)NGINX、Redis、MySQL三種Web應(yīng)用程序中的關(guān)鍵工作負(fù)載進(jìn)行測(cè)試,所展現(xiàn)的性價(jià)比與基于x86架構(gòu)的S6云實(shí)例對(duì)比有平均50%以上的提升(數(shù)據(jù)來(lái)源)。

除此之外,由于比64核的Graviton核數(shù)多,所以,Ampere更清楚地展示了多核心的優(yōu)勢(shì),隨工作負(fù)載的實(shí)例數(shù)量(即運(yùn)行的線程數(shù))增長(zhǎng)性能也表現(xiàn)出了近乎線性的增長(zhǎng),主頻可以達(dá)到3.0GHz以上,而x86在運(yùn)行的實(shí)例數(shù)量(即運(yùn)行的線程數(shù))增長(zhǎng)到一定程度后,再增加核數(shù)的提升則非常有限。

這是Ampere Computing產(chǎn)品市場(chǎng)總監(jiān)孫開(kāi)本在2022 OCP China上分享的一張圖,測(cè)試運(yùn)行的是Encoding編碼工作負(fù)載,橫坐標(biāo)是并發(fā)的編碼任務(wù)數(shù),代表的是使用的線程數(shù),縱坐標(biāo)是性能數(shù)據(jù)。隨著任務(wù)數(shù)的增加,性能增長(zhǎng)的趨勢(shì)有比較大的區(qū)別。

另外一張圖展示的是Ampere Altra Max的性能可預(yù)測(cè)性,也可以說(shuō)是性能的穩(wěn)定性。

上圖測(cè)試跑的是Redis工作負(fù)載,在運(yùn)行Redis負(fù)載的同時(shí),定期間隔性地插入其他工作負(fù)載,隨著負(fù)載的加入和完成,觀察主工作負(fù)載的性能變化。如圖所示,Ampere Altra Max的上運(yùn)行的Redis性能幾乎沒(méi)有變化,而x86的性能抖動(dòng)則非常明顯。

孫開(kāi)本在演講中表示,主要原因有兩點(diǎn),一個(gè)是單核單線程的設(shè)計(jì),另一個(gè)得益于優(yōu)秀的功耗控制。

SPEC測(cè)試:Ampere處理器實(shí)際功耗低于TDP,從而能使主頻穩(wěn)定

大致原理上,單核單線程的設(shè)計(jì)減少了核心之間的相互干擾,既有助于性能穩(wěn)定,也有助于讓性能隨著核數(shù)的增長(zhǎng)而增長(zhǎng)。同時(shí),在功耗控制方面的優(yōu)勢(shì),Ampere 不僅能讓所有運(yùn)行的內(nèi)核保持一致的最大主頻,從而提升穩(wěn)定性,而且還使得堆更多核心成為可能。

功耗是芯片設(shè)計(jì)的重要考量因素,Ampere處理器主頻相對(duì)較低,波動(dòng)范圍也很小,方便控制功耗,為了性能穩(wěn)定,甚至能保持在一定的主頻保持不動(dòng),不用擔(dān)心撞到功耗墻而降頻造成性能抖動(dòng)。

當(dāng)然,x86也可以關(guān)掉超線程技術(shù),把頻率鎖在較低的水平,以此來(lái)提供更穩(wěn)定的性能表現(xiàn)。雖然此時(shí)x86的單核性能更強(qiáng),但由于核數(shù)太少,整體性能表現(xiàn)還未可知,況且,這種做法無(wú)異于自廢多年修煉來(lái)的武功,目前想這么用x86處理器的用戶應(yīng)該只能是少數(shù)。而且對(duì)于云服務(wù)提供商來(lái)說(shuō),關(guān)掉超線程就意味著同一平臺(tái)可售賣(mài)的核數(shù)減半,經(jīng)濟(jì)效益將大打折扣,很不劃算。

總之,單核提供單線程加上功耗優(yōu)勢(shì),Ampere就有了更穩(wěn)定的性能表現(xiàn),更線性的性能增長(zhǎng)表現(xiàn),而這,正是公有云廠商所需要的:

一方面,公有云希望用創(chuàng)新技術(shù)來(lái)降本增效。

Ampere的核數(shù)優(yōu)勢(shì)使得云數(shù)據(jù)中心的計(jì)算密度大大提升,節(jié)省數(shù)據(jù)中心的空間成本。同時(shí),能用單臺(tái)設(shè)備能提供更多實(shí)例,服務(wù)于更多用戶。最終,降本增效的成果最后也會(huì)讓用戶受益。目前,通過(guò)使用基于Ampere Altra的云實(shí)例(阿里云c6r),國(guó)內(nèi)可觀測(cè)解決方案提供商觀測(cè)云也實(shí)現(xiàn)了40%的性價(jià)比提升。這點(diǎn)也可以參考AWS的Graviton。

另一方面,公有云希望給用戶提供更好的使用體驗(yàn)。

很多用戶擔(dān)心“嘈雜鄰居”問(wèn)題影響性能表現(xiàn),而Ampere方案的性能是能在所有時(shí)刻保持一個(gè)穩(wěn)定的表現(xiàn),讓云服務(wù)商提供始終如一的穩(wěn)定服務(wù),避免性能抖動(dòng)影響業(yè)務(wù)。

以上,就是我看到的云廠商為什么會(huì)選擇Arm服務(wù)器的主要原因。

OCP China Day 2022活動(dòng)主題就有“綠色”這一關(guān)鍵詞,數(shù)據(jù)中心作為全球用電大戶,在綠色低碳方面的工作也非常重要,Arm在低功耗方面的優(yōu)勢(shì)也有助于數(shù)據(jù)中心實(shí)現(xiàn)低碳目標(biāo),這也會(huì)是數(shù)據(jù)中心采用Arm服務(wù)器的一大推動(dòng)因素。

雖然,x86架構(gòu)在未來(lái)很長(zhǎng)時(shí)間仍會(huì)是主流,但Arm服務(wù)器也將有越來(lái)越多的用戶。如今,Arm的應(yīng)用生態(tài)取得了許多進(jìn)展。

一方面,AWS自研的Graviton 是Arm陣營(yíng)的一面旗幟,讓更多人關(guān)注到甚至開(kāi)始用Arm服務(wù)器,而Ampere這種Arm芯片廠商可以無(wú)障礙共享Arm應(yīng)用生態(tài)。

另一方面,Ampere的第三方處理器被Oracle、谷歌云、騰訊云、微軟Azure、阿里云等各大公有云廠商所采用。這些頭部廠商的帶動(dòng)不僅將加速生態(tài)的發(fā)展,也讓Arm服務(wù)器CPU的市場(chǎng)份額出現(xiàn)快速的增長(zhǎng)。根據(jù)研究公司Omdia的數(shù)據(jù)顯示,今年第二季度全球服務(wù)器出貨量為 340 萬(wàn)臺(tái),其中Arm架構(gòu)達(dá)到了創(chuàng)紀(jì)錄的 7.1%,份額同比增長(zhǎng)了 48%。

此外,浪潮、超微、HPE、緯穎、技嘉等服務(wù)器廠商也都推出了服務(wù)器硬件,既服務(wù)于超大規(guī)模數(shù)據(jù)中心市場(chǎng),也能服務(wù)于企業(yè)用戶。

Ampere官網(wǎng)上列舉了Ampere支持的六大類場(chǎng)景,包括:各種常見(jiàn)的機(jī)器學(xué)習(xí)框架,支持Arm的老本行(云手機(jī)、IoT、自動(dòng)駕駛)、大數(shù)據(jù)分析工作負(fù)載、云原生應(yīng)用負(fù)載、云存儲(chǔ)和Web服務(wù)。

其中,云存儲(chǔ)部分的相對(duì)較少,目前只顯示了Ceph。而云原生應(yīng)用負(fù)載部分則非常豐富,官網(wǎng)上列舉了很多,在DockerHub上能看到4943個(gè)鏡像,數(shù)量上大約是x86的三分之一,目之所及的各種常用鏡像都有了。

今年五月份,Ampere公布了下一代處理器AmpereOne?的規(guī)劃,將采用5nm制程工藝,支持PCIe 5.0和DDR5,將采用定制的內(nèi)核,從而有更多靈活的設(shè)計(jì)空間。Ampere還表示,未來(lái)將保持每年一代產(chǎn)品的更新節(jié)奏。

前不久HPE發(fā)布的ProLiant RL300就是單路服務(wù)器,但在OCP China Day 2022活動(dòng)現(xiàn)場(chǎng),Ampere的展臺(tái)上放置了兩臺(tái)服務(wù)器全都是雙路服務(wù)器,雙路至少可以提供160核。

左側(cè)是浪潮NF5080R6,右側(cè)是一臺(tái)Mt.Jade

一臺(tái)是浪潮采用Ampere處理器的雙路服務(wù)器NF5080R6(“R”大概就是Arm的意思)。另一臺(tái)則是開(kāi)源的Mt.Jade服務(wù)器,它是由Ampere貢獻(xiàn)給OCP的開(kāi)源服務(wù)器,任何人都可以下載設(shè)計(jì)圖紙進(jìn)行制造和使用。

有專家表示,這是中國(guó)用戶的采購(gòu)習(xí)慣所致,未來(lái)可能會(huì)有所改觀。

分享到

zhupb

相關(guān)推薦