英特爾Gaudi 2E配備96 GB大容量?jī)?nèi)存,搭載先進(jìn)的HBM控制器,針對(duì)隨機(jī)訪問(wèn)、線性訪問(wèn)場(chǎng)景進(jìn)行深度優(yōu)化,有效避免了AI訓(xùn)練或推理任務(wù)的延遲,從而保障了計(jì)算流程的流暢性。英特爾Gaudi 2E擁有卓越的可擴(kuò)展能力,支持多卡互聯(lián),為用戶提供了靈活的、可定制化的解決方案,滿足其不斷變化的AI需求。
英特爾Gaudi 2E以出色的適配性和易用性,為諸多大模型應(yīng)用提供支持。實(shí)測(cè)數(shù)據(jù)顯示,在英特爾Gaudi 2E的支持下,DeepSeek-V3.1無(wú)論是在問(wèn)答還是編碼上,能力都有著顯著提升:在部署了8張英特爾Gaudi 2E的一體機(jī)服務(wù)器上運(yùn)行DeepSeek-V3.1模型,在輸入/輸出token長(zhǎng)度均為1k、多用戶并發(fā)數(shù)為30的條件下,每個(gè)并發(fā)token生成速率達(dá)到每秒10 token;在輸入/輸出token長(zhǎng)度均為2k、多用戶并發(fā)數(shù)為28的條件下,每個(gè)并發(fā)token生成速率達(dá)到每秒10 token。
無(wú)論是要求邏輯嚴(yán)密的數(shù)學(xué)計(jì)算還是考驗(yàn)分析能力的知識(shí)理解,基于英特爾Gaudi 2E的DeepSeek-V3.1均能迅速響應(yīng),高效完成解析。這種強(qiáng)大的組合,不僅大幅提升了問(wèn)題解決的效率,更助力用戶在多維度、高難度的推理場(chǎng)景中輕松跨越障礙。
通過(guò)開(kāi)放的架構(gòu)、強(qiáng)大的技術(shù)支持和緊密的生態(tài)合作,英特爾將持續(xù)賦能AI產(chǎn)業(yè)的創(chuàng)新與發(fā)展,加速AI大模型技術(shù)的普惠落地。