產品發(fā)布會上,英特爾圈重點介紹了七大算力神器,比如,提高機器學習運算力的AMX,提高網絡負載處理能力的DLB,提高內存數據分析的加速器IAA,為提高提高HPC算力采用HBM的CPU Max系列等。

英特爾強調新的功能特性是結合用戶的需求來打造的,很多用戶都在積極采用新功能特性。

發(fā)布會現場,騰訊云介紹了AMX加速器加速AI計算負載的使用體驗,中國電信天翼云分享了使用英特爾DLB提升服務能力的細節(jié),京東云介紹了英特爾IAA加速器在數據庫場景的實用價值。

字節(jié)跳動是互聯(lián)網時代的新巨頭,旗下有今日頭條、抖音等多款熱門App,對于IT資源的需求量非常大,火山引擎是字節(jié)跳動旗下的云服務,是字節(jié)跳動多種在線服務的底層技術支撐。

在火山引擎云基礎產品負責人羅浩看來,云產品最終是為了客戶業(yè)務增長去服務的,在做好增長的基礎之上,火山引擎會關注如何在資源層面獲得更好的成本優(yōu)勢,因此,火山引擎云基礎團隊累積了非常多成本優(yōu)化的經驗。

火山引擎基于第四代至強可擴展處理器發(fā)布了彈性計算實例,使得單核能力、網絡轉發(fā)能力,加解密、視頻和AI推理訓練能力上,都獲得了大幅提升。內部測試結果顯示,新處理器帶來了30%以上的整體收益,如今,火山引擎的技術架構正在切換到更具性價比的方案上。

在談到新的算力神器時,羅浩表示,火山引擎其實已經用了多個算力神器,比如,此前就在用QAT技術,用于加速AI算力的VNNI向量計算,整體上,火山引擎應用了英特爾發(fā)布的很多加速器的能力。

很多技術進步的意義就在于提高效率,英特爾原來強調的是用更高主頻和更多核心來提升效率,而現在,則更強調通過特定的加速器來支持特定的業(yè)務邏輯,從而降低功耗并提升性能。

具體差別有多大呢?

從英特爾專家的介紹中了解到,同樣一個功能分別由軟件和硬件來實現時,性能有時候會有10-100倍的差距。通過硬件來實現功能時,會讓一些邏輯固化后內置到硬件中,它的功耗便會大幅度降低,效率就有幾十倍上百倍的變化。

加速器的做法有助于提高效率,但是,隨著集成的功能越來越多,意味著制造工藝會變復雜,成本會變高,而且,長遠來看,處理器本身會越來越臃腫,必然會存在用不到某些功能而浪費的情況。

于是,這一代至強可擴展處理器在成本和功能特性上做了開創(chuàng)性的變化,新推出的On Demand服務模式,將改變行業(yè)的消費模式,從CAPEX專向OPEX,用戶可以按照需求單獨開啟或者關閉以下幾個功能,包括:

英特爾動態(tài)負載均衡器DLB、英特爾數據流加速器DSA、英特爾存內分析加速器IAA、英特爾數據保護與壓縮加速技術QAT和英特爾軟件防護擴展SGX。

On Demand服務模式下,企業(yè)可以在初次購買的時候選擇全功能的處理器,也可以在后期使用過程中,根據需求隨時開啟和關閉某些功能,最終,按照實際的使用量來付費。

在外界看來,On Demand服務模式可以有兩種截然不同的走向:

一種是以基礎款(沒有開啟任何功能)處理器的定價為基準,用戶開啟新的功能需要額外付費時,相當于用戶承擔了額外成本;

另一種情況下,以完全功能的處理器為基準價格,少開啟一些功能就少付一些費用,而且,僅在需要的時候開啟功能,不需要的時候關閉即可。

我個人傾向于認為是第二種邏輯,也就是要幫用戶省錢,或者說是控制成本。同時,這還能為用戶帶來更多靈活性和自定義的空間,用戶在選購第四代至強可擴展處理器時應該考慮場景來做決策。

從實際落地來看,On Demand服務模式更適合互聯(lián)網公司或者云服務商,總之是有大規(guī)模數據中心的用戶,這些用戶通常都比較懂技術,會結合需求做一些更有針對性的調整,從而降本增效。

定制處理器定制的是核心數目或者核心頻率方面,而On Demand服務模式定制的是功能特性,未來,兩種定制模式應該會共存。

分享到

zhupb

相關推薦