英特爾中國(guó)區(qū)顯卡和AI高級(jí)產(chǎn)品總監(jiān)徐金平發(fā)表演講

在AI時(shí)代,企業(yè)面臨的是一個(gè)充滿機(jī)遇與挑戰(zhàn)的局面:一方面,大模型規(guī)模化商用進(jìn)展突飛猛進(jìn),蘊(yùn)藏的機(jī)遇近在咫尺。另一方面,無(wú)論是海量圖像、文本、音視頻數(shù)據(jù)的處理,還是復(fù)雜精細(xì)化AI模型的部署等等,都給傳統(tǒng)算力架構(gòu)的性能和能耗帶來(lái)了挑戰(zhàn)。AI浪潮的確是席卷而來(lái),但如何將AI潛力有效地轉(zhuǎn)化為實(shí)際生產(chǎn)力,仍是一道橫亙?cè)谇暗碾y題。

英特爾銳炫多卡方案希望憑借靈活的擴(kuò)展能力,不僅高效承接多模態(tài)數(shù)據(jù)的密集型計(jì)算需求,又能降低企業(yè)AI部署的成本與復(fù)雜度,為AI的大規(guī)模、普惠化落地筑牢支撐。

作為方案的核心硬件,英特爾銳炫? Pro B60 GPU有著為AI推理量身打造的關(guān)鍵亮點(diǎn)——24GB的大顯存和456GB/s的高內(nèi)存帶寬,滿足了AI推理對(duì)顯存容量的迫切需求,讓大參數(shù)模型流暢運(yùn)行,讓海量數(shù)據(jù)高效吞吐;同時(shí),197 TOPS的峰值算力則為各類(lèi)復(fù)雜AI推理任務(wù)提供了源源不斷的動(dòng)力。

英特爾銳炫Pro B60 GPU的另一大亮點(diǎn)是支持多顯卡協(xié)同工作??紤]到邊緣端和服務(wù)器等更廣泛應(yīng)用場(chǎng)景的需求,英特爾設(shè)計(jì)了基于銳炫Pro B60 GPU的多卡互聯(lián)方案——Battlematrix(戰(zhàn)斗陣列)推理工作站平臺(tái)。它最多可搭載8/16張英特爾銳炫Pro GPU,顯存最高可達(dá)192GB/384GB,支持100B+參數(shù)模型,可順暢處理大規(guī)模數(shù)據(jù)集與復(fù)雜模型等任務(wù),契合企業(yè)對(duì)“高算力+大顯存+成本效益”的多重訴求。在實(shí)際應(yīng)用中,英特爾工程師團(tuán)隊(duì)借助該方案,將原本需數(shù)天完成的代碼修復(fù)全流程縮短至數(shù)小時(shí),充分驗(yàn)證了多卡互聯(lián)方案在復(fù)雜任務(wù)處理中的高效與可靠。

以英特爾銳炫Pro B60和銳炫多卡解決方案為核心,英特爾為不同場(chǎng)景的AI部署提供了靈活的產(chǎn)品形態(tài)選擇。具體而言:

由此一來(lái),無(wú)論是個(gè)人電腦、邊緣設(shè)備、通用工作站/服務(wù)器,乃至專(zhuān)用AI服務(wù)器,都能找到與之匹配的高效且具備成本優(yōu)勢(shì)的部署方案,這正是英特爾助力更多企業(yè)快速推進(jìn)AI部署與實(shí)踐的具體體現(xiàn)。

今年,英特爾已經(jīng)推出了英特爾銳炫多卡AI算力一體機(jī)方案,而基于英特爾銳炫Pro B系列的多卡方案的到來(lái),進(jìn)一步豐富了英特爾支持AI大模型部署的硬件形態(tài)。在AI快速迭代的當(dāng)下,英特爾強(qiáng)調(diào)的是軟硬結(jié)合的綜合價(jià)值,將通過(guò)底層硬件創(chuàng)新與開(kāi)放軟件生態(tài),讓AI部署更普惠、更便捷。

分享到

lixiangjing

算力豹主編

相關(guān)推薦