下面以Deepseek-V3為例,演示在昇騰社區(qū)如何高效獲取模型及使用

硬件要求:

部署DeepSeek-V3模型需配置4臺(tái)Atlas 800I A2(8*64G)服務(wù)器資源

模型調(diào)用實(shí)踐:

一、權(quán)重轉(zhuǎn)換

GPU

圖片2.png

NPU

圖片3.png

二、加載鏡像

在昇騰社區(qū)/開發(fā)資源下載適配DeepSeek-V3的鏡像包:

mindie:1.0.T71-800I-A2-py311-ubuntu22.04-arm64

完成之后,請(qǐng)使用docker images命令確認(rèn)查找具體鏡像名稱與標(biāo)簽。

圖片4.png

三、容器啟動(dòng)

提供的MindIE鏡像預(yù)置了DeepSeek-V3模型推理腳本,從您信任的來源自行獲取權(quán)重后,放置在從上述下載的模型代碼的主目錄下,修改模型文件夾屬組為1001,執(zhí)行權(quán)限為750,啟動(dòng)容器。

圖片5.png
圖片6.png

四、服務(wù)化測(cè)試

配置服務(wù)化環(huán)境變量,expandable_segments-使能內(nèi)存池?cái)U(kuò)展段功能,即虛擬內(nèi)存特性

圖片7.png

修改服務(wù)化參數(shù)

圖片8.png

拉起服務(wù)化

圖片9.png

出現(xiàn)“Daemon start success!,則認(rèn)為服務(wù)成功啟動(dòng)。

分享到

崔歡歡

相關(guān)推薦