DeepSeek AI最新發(fā)布的多模態(tài)大模型Janus-Pro,以及之前發(fā)布的大型語(yǔ)言模型DeepSeek-R1、DeepSeek-V3及DeepSeek-V2,一經(jīng)發(fā)布,就在AI領(lǐng)域引起了熱烈反響,多項(xiàng)創(chuàng)新技術(shù)顯著提升了模型的性能與效率。DeepSeek系列模型首發(fā)即支持昇騰平臺(tái),讓用戶能夠在昇騰硬件和MindIE推理引擎上實(shí)現(xiàn)高效推理。
2025年2月4日,DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro正式上線昇騰社區(qū),支持一鍵獲取DeepSeek系列模型,支持昇騰硬件平臺(tái)上開(kāi)箱即用,推理快速部署,帶來(lái)更快、更高效、更便捷的AI開(kāi)發(fā)和應(yīng)用體驗(yàn),歡迎廣大開(kāi)發(fā)者體驗(yàn)使用。
部署DeepSeek-V3模型需配置4臺(tái)Atlas 800I A2(8*64G)服務(wù)器資源
一、 權(quán)重轉(zhuǎn)換
GPU:
NPU:
二、 加載鏡像
在昇騰社區(qū)/開(kāi)發(fā)資源下載適配DeepSeek-V3的鏡像包:
mindie:1.0.T71-800I-A2-py311-ubuntu22.04-arm64
完成之后,請(qǐng)使用docker images命令確認(rèn)查找具體鏡像名稱與標(biāo)簽。
三、 容器啟動(dòng)
提供的MindIE鏡像預(yù)置了DeepSeek-V3模型推理腳本,從您信任的來(lái)源自行獲取權(quán)重后,放置在從上述下載的模型代碼的主目錄下,修改模型文件夾屬組為1001,執(zhí)行權(quán)限為750,啟動(dòng)容器。
四、 服務(wù)化測(cè)試
配置服務(wù)化環(huán)境變量,expandable_segments-使能內(nèi)存池?cái)U(kuò)展段功能,即虛擬內(nèi)存特性。
修改服務(wù)化參數(shù)
拉起服務(wù)化
出現(xiàn)“Daemon start success!”,則認(rèn)為服務(wù)成功啟動(dòng)。
更深入了解DeepSeek系列模型在昇騰上的使用方法及指導(dǎo)文檔,可登錄昇騰社區(qū)模型庫(kù)專(zhuān)區(qū)學(xué)習(xí)了解!
更多DeepSeek模型獲取鏈接可參考:
DeepSeek-R1
(掃碼獲取)
DeepSeek-V3:
(掃碼獲取)
Janus-Pro
https://www.hiascend.com/software/modelzoo/models/detail/ffe1a0f4e8ba43aeb989251a3f0308e9
(掃碼獲取)