基于Ktransformers的DeepSeek-R1滿血版部署

UCloud小助手發(fā)布于2025-02-19 13:50 / 1012人閱讀

2月10日，清華大學(xué)KVCache.AI團隊聯(lián)合趨境科技發(fā)布的KTransformers開源項目公布更新：一塊24G顯存的4090D就可以在本地運行DeepSeek-R1、V3的671B“滿血版”。預(yù)處理速度最高達(dá)到286 tokens/s，推理生成速度最高能達(dá)到14 tokens/s。

KTransformers通過優(yōu)化本地機器上的LLM部署，幫助解決資源限制問題。該框架采用了異構(gòu)計算、先進(jìn)量化技術(shù)、稀疏注意力機制等多種創(chuàng)新手段，提升了模型的計算效率，并具備處理長上下文序列的能力。

基于Ktransformers部署DeepSeek-R1

第一步：登錄「優(yōu)云智算」算力共享平臺并進(jìn)入「鏡像社區(qū)」

訪問優(yōu)云智算官網(wǎng)：https://www.compshare.cn/ ，點擊右上角登錄進(jìn)行賬號注冊，注冊實名后將得到20元算力金，可免費體驗4090 10小時。

步驟二：創(chuàng)建GPU實例

訪問優(yōu)云智算鏡像社區(qū)，選擇DeepSeek Ktransformers鏡像。

鏈接直達(dá)：https://www.compshare.cn/images-detail?ImageID=compshareImage-18ikrnb3x30r

KTransformers目前支持Q4級別的DeepSeek的QA對話，由于內(nèi)存需要300G以上，因此需要選擇4卡4090資源。

第三步：啟動推理服務(wù)，鏡像已配置好所需依賴環(huán)境，無需額外安裝，即可通過以下命令啟動推理服務(wù)

打開Jupyterlab：

進(jìn)入Terminal并執(zhí)行服務(wù)啟動命令：

進(jìn)入 KTransformers 目錄：

cd ktransformers/

運行本地聊天程序：

python ./ktransformers/local_chat.py --model_path deepseek-ai/DeepSeek-R1 --gguf_path /compshare-model/DeepSeek-R1-GGUF/DeepSeek-R1-Q4_K_M --force_think true --cpu_infer 60 --max_new_tokens 1000 --optimize_rule_path ktransformers/optimize/optimize_rules/DeepSeek-V3-Chat-multi-gpu.yaml

服務(wù)啟動較慢，需要等待幾分鐘。

參數(shù)說明：

--model_path（必需）：指定模型名稱，例如 "deepseek-ai/DeepSeek-V2-Lite-Chat"，該名稱會自動從 Hugging Face 下載配置文件。如果您已經(jīng)有本地文件，可以直接使用該路徑來初始化模型。

注意：目錄中不需要 .safetensors 文件，我們只需要配置文件來構(gòu)建模型和分詞器。

--gguf_path（必需）：指定包含 GGUF 文件的目錄路徑，這些文件可以從 Hugging Face 下載。注意該目錄應(yīng)僅包含當(dāng)前模型的 GGUF 文件，這意味著每個模型需要一個多帶帶的目錄。

--optimize_rule_path（除 Qwen2Moe 和 DeepSeek-V2 外必需）：指定包含優(yōu)化規(guī)則的 YAML 文件路徑。ktransformers/optimize/optimize_rules 目錄中預(yù)先寫好了兩個規(guī)則文件，用于優(yōu)化 DeepSeek-V2 和 Qwen2-57B-A14，這兩個是當(dāng)前最先進(jìn)的 MoE 模型。

--max_new_tokens：整數(shù)（默認(rèn)值為 1000）。生成的新令牌的最大數(shù)量。

--cpu_infer：整數(shù)（默認(rèn)值為 10）。用于推理的 CPU 數(shù)量。理想情況下應(yīng)設(shè)置為（總核心數(shù) - 2）。

以上是優(yōu)云智算平臺支持的Ktransformers DeepSeek模型，優(yōu)云智算鏡像社區(qū)仍在不斷更新DeepSeek系列鏡像，更有海量AI行業(yè)鏡像等你來體驗！

云服務(wù)器 GPU云服務(wù)器基于docker的私有云部署基于云服務(wù)器的部署基于docker的混合云部署方案基于docker快速部署微服務(wù)

文章版權(quán)歸作者所有，未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址：http://www.ezyhdfw.cn/yun/131188.html

發(fā)表評論

登陸后可評論

0條評論

UCloud小助手

男|高級講師

我要關(guān)注我要私信

TA的文章

7分鐘零代碼快速搭建電商獨立站！

閱讀 1469·2025-04-29 17:46
煥新季出海大促來襲！香港回內(nèi)地網(wǎng)絡(luò)大升級~海內(nèi)外云主機2C4G低至 27元/月！出海業(yè)務(wù)必選

閱讀 13963·2025-03-21 11:44
DeepSeek從入門到精通（2）：0成本用DeepSeek（滿血版）搭建本地知識庫

閱讀 804·2025-02-19 18:27
DeepSeek從入門到精通（1）：10分鐘用DeepSeek搭建私有化知識庫

閱讀 976·2025-02-19 18:21
基于Ktransformers的DeepSeek-R1滿血版部署

閱讀 1013·2025-02-19 13:50
UCloud X DeepSeek V3、R1滿血版橫向大對比！

閱讀 2020·2025-02-13 22:35
基于unsloth的DeepSeek-R1動態(tài)量化版本部署

閱讀 1674·2025-02-08 10:20
2025年U大使新年軟文推廣限時活動

閱讀 6024·2025-01-02 11:25

亚洲中字慕日产2020,大陆极品少妇内射AAAAAA,无码av大香线蕉伊人久久,久久精品国产亚洲av麻豆网站

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

基于Ktransformers的DeepSeek-R1滿血版部署

基于Ktransformers部署DeepSeek-R1

第一步：登錄「優(yōu)云智算」算力共享平臺并進(jìn)入「鏡像社區(qū)」

步驟二：創(chuàng)建GPU實例

第三步：啟動推理服務(wù)，鏡像已配置好所需依賴環(huán)境，無需額外安裝，即可通過以下命令啟動推理服務(wù)

相關(guān)文章

UCloud X DeepSeek V3、R1滿血版橫向大對比！

**DeepSeek從入門到精通（2）：0成本用DeepSeek（滿血版）搭建本地知識庫**

**基于unsloth的DeepSeek-R1動態(tài)量化版本部署**

DeepSeek R1系列模型一鍵部署教程，支持云端免費體驗！

使用Ollama本地化部署DeepSeek

發(fā)表評論

0條評論

UCloud小助手

男|高級講師

TA的文章

7分鐘零代碼快速搭建電商獨立站！

煥新季出海大促來襲！香港回內(nèi)地網(wǎng)絡(luò)大升級~海內(nèi)外云主機2C4G低至 27元/月！出海業(yè)務(wù)必選

DeepSeek從入門到精通（2）：0成本用DeepSeek（滿血版）搭建本地知識庫

DeepSeek從入門到精通（1）：10分鐘用DeepSeek搭建私有化知識庫