本周,英偉達(dá)宣布推出其首款用于AI和HPC服務(wù)器,基于Arm的Grace處理器,盡管業(yè)界有所察覺,但其首次亮相仍對AMD和英特爾的股價產(chǎn)生了負(fù)面影響。
毫無疑問,英偉達(dá)是一個強(qiáng)大的競爭對手,但英特爾認(rèn)為,它并沒有真正威脅到其數(shù)據(jù)中心業(yè)務(wù)。
英特爾新任首席執(zhí)行官,Pat Gelsinger在受訪時稱:“我們上周發(fā)布了Ice Lake (冰湖處理器)系列處理器,并獲得了積極響應(yīng)。在Ice Lake上,我們對AI功能進(jìn)行了擴(kuò)展。英偉達(dá)正在回應(yīng)我們,而非我們對此做出反應(yīng)。顯而易見,這種AI增強(qiáng)型CPU的想法是英特爾發(fā)揮巨大領(lǐng)導(dǎo)作用的領(lǐng)域。”
英偉達(dá)發(fā)布適用于AI和HPC的Grace處理器有望在AI和HPC工作負(fù)載方面比x86處理器速度快10倍以上,但它會在2023年初發(fā)布。像這樣的性能看起來總是非常強(qiáng)大,不過AMD和英特爾的競爭并沒有停滯不前。
英特爾最新的至強(qiáng)處理器以DL Boost(深度學(xué)習(xí)加速)的名義集成了AI加速技術(shù),該技術(shù)目前包括在AVX512_VNNI(Cascade Lake和Ice Lake)和AVX512_BF16(僅Cooper Lake)等指令集擴(kuò)展。
據(jù)英特爾測試顯示,兩者都極具競爭力,并且在處理優(yōu)化算法時,它們可以讓英特爾的CPU性能比英偉達(dá)的GPU高出15倍。
此外,由于英特爾的至強(qiáng)CPU被廣泛用于推理型工作負(fù)載,并且ISV(獨(dú)立軟件開發(fā)商)為這些處理器優(yōu)化了他們的引擎。簡而言之,英特爾的至強(qiáng)可擴(kuò)展產(chǎn)品已經(jīng)有AI增強(qiáng)功能,其后續(xù)產(chǎn)品自然會擴(kuò)展AI功能。
通常,Arm,AMD,英特爾和英偉達(dá)等公司都在努力提高其處理器(CPU,GPU,IPU,VPU等)在AI和HPC工作負(fù)載中的性能以應(yīng)對人工智能的需求。超級計算正在迅速發(fā)展。與過去的30年相比,未來幾年AI和HPC方向?qū)⑷〉酶筮M(jìn)步。
需要注意的是,英偉達(dá)當(dāng)前展示的Grace CPU是與GPU集成,而非獨(dú)立存在。因此,雖然Grace處理器本身可能具有眾多AI增強(qiáng)器,但英偉達(dá)會把它和針對計算優(yōu)化的數(shù)據(jù)中心GPU一起打包出售提供一個處理AI和HPC工作負(fù)載的平臺。
2022年,英特爾也會擁有一個類似的平臺。英特爾的第四代至強(qiáng)可擴(kuò)展Sapphire?Rapid處理器(有多達(dá)56個內(nèi)核)以及針對各種工作負(fù)載的眾多增強(qiáng)功能,明年將與英特爾千億晶體管的Ponte Vecchio計算GPU一起在Aurora?百億級超級計算機(jī)中使用。
這款GPU似乎有約1 FP16 PFLOPS性能,或1,000 TFLOPS FP16性能,是英偉達(dá) A100的312 FP16 TFLOPS性能的三倍。