DeepSeek R1系列模型一鍵部署教程，支持云端免費(fèi)體驗(yàn)！

社區(qū)管理員發(fā)布于2025-02-07 13:29 / 1548人閱讀

DeepSeek-R1 Distill系列

基于DeepSeek-R1的推理能力，通過蒸餾技術(shù)將推理能力遷移到較小的模型上，在保持高效性能的同時(shí)，成功降低了計(jì)算成本，實(shí)現(xiàn)了“小身材、大智慧”的完美平衡！該鏡像使用vLLM部署提供支持，適用于高性能大語言模型的推理和微調(diào)任務(wù)，

第一步：登錄「優(yōu)云智算」算力共享平臺(tái)并進(jìn)入「鏡像社區(qū)」

地址：https://www.compshare.cn/?ytag=seo

第二步：選擇「vLLM-DeepSeek-R1-Distill」鏡像，點(diǎn)擊「使用該鏡像創(chuàng)建實(shí)例」

鏡像地址：https://www.compshare.cn/images-detail?ImageID=compshareImage-17ym815cbokz

根據(jù)鏡像說明中的引導(dǎo)，選擇所用模型需要的GPU算力規(guī)格，并點(diǎn)擊「立即部署」即可擁有一個(gè)自帶模型的算力資源。

第三步：?jiǎn)?dòng)vLLM api 服務(wù)，鏡像已配置好所需依賴環(huán)境，無需額外安裝，即可通過以下命令啟動(dòng)vLLM服務(wù)：

單卡4090

# DeepSeek-R1-Distill-Qwen-1.5B

vllm serve  /model/HuggingFace/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B --port 8000

# DeepSeek-R1-Distill-Qwen-7B

vllm serve  /model/HuggingFace/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B --port8000 --max-model-len 65536

# DeepSeek-R1-Distill-Llama-8B

vllm serve  /model/HuggingFace/deepseek-ai/DeepSeek-R1-Distill-Llama-8B --port8000 --max-model-len 17984

2卡4090

# DeepSeek-R1-Distill-Qwen-14B

vllm serve  /model/HuggingFace/deepseek-ai/DeepSeek-R1-Distill-Qwen-14B --port8000-tp2 --max-model-len 59968

4卡4090

# DeepSeek-R1-Distill-Qwen-32B

vllm serve  /model/HuggingFace/deepseek-ai/DeepSeek-R1-Distill-Qwen-32B --port 8000 -tp 4 --max-model-len 65168

8卡4090

# DeepSeek-R1-Distill-Llama-70B

vllm serve  /model/HuggingFace/deepseek-ai/DeepSeek-R1-Distill-Llama-70B --port 8000

GPU云服務(wù)器 RTX40系云服務(wù)器一鍵體驗(yàn)免費(fèi)主機(jī)備案一鍵免費(fèi)體驗(yàn)云主機(jī) 一鍵體驗(yàn)公有云一鍵體驗(yàn)容器云

文章版權(quán)歸作者所有，未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址：http://www.ezyhdfw.cn/yun/131183.html

相關(guān)文章

DeepSeek Janus Pro多模態(tài)模型一鍵部署教程，支持云端免費(fèi)體驗(yàn)！

DeepSeek Janus-Pro開源模型DeepSeek團(tuán)隊(duì)于1月28日凌晨發(fā)布了開源多模態(tài)大語言模型Janus-Pro，這是一款基于DeepSeek-LLM-1.5b-base和DeepSeek-LLM-7b-base構(gòu)建的模型。第一步：登錄「優(yōu)云智算」算力共享平臺(tái)并進(jìn)入「鏡像社區(qū)」地址：https://www.compshare.cn/?ytag=seo 第二步：選擇「Janus-Pro-...

miguel.jiang 2025-02-07 13:37 評(píng)論0 收藏0
基于unsloth的DeepSeek-R1動(dòng)態(tài)量化版本部署

DeepSeek-R1-671b動(dòng)態(tài)量化版，由unsloth.ai發(fā)布，推薦使用多卡進(jìn)行部署，具體操作如下。本鏡像還附帶32b的無限制版蒸餾模型，使用open-webui和ollama以及l(fā)lama.cpp進(jìn)行部署，內(nèi)置所有環(huán)境，即拉即用。第一步：登錄「優(yōu)云智算」算力共享平臺(tái)并進(jìn)入「鏡像社區(qū)」，新用戶免費(fèi)體驗(yàn)10小時(shí)4090地址：https://www.compshare.cn/?ytag=seo...

UCloud小助手 2025-02-08 10:20 評(píng)論0 收藏0
使用Ollama本地化部署DeepSeek

DeepSeek-R1-32B-WebUIDeepSeek-R1采用強(qiáng)化學(xué)習(xí)進(jìn)行后訓(xùn)練，旨在提升推理能力，尤其擅長(zhǎng)數(shù)學(xué)、代碼和自然語言推理等復(fù)雜任務(wù)，該鏡像安裝和使用 Ollama 和 Open WebUI，以便更好地利用深度學(xué)習(xí)模型進(jìn)行推理和交互。第一步：登錄「優(yōu)云智算」算力共享平臺(tái)并進(jìn)入「鏡像社區(qū)」地址：https://www.compshare.cn/?ytag=seo第二步：選擇「Deep...

miguel.jiang 2025-02-07 13:40 評(píng)論0 收藏0
UCloud X DeepSeek V3、R1滿血版橫向大對(duì)比！

DeepSeek V3憑借多頭潛注意力（MLA）與優(yōu)化的混合專家網(wǎng)絡(luò)（MoE）架構(gòu)，奠定了高效訓(xùn)練的基礎(chǔ)，僅以557.6萬元成本實(shí)現(xiàn)媲美OpenAI O1的性能；而R1則基于V3進(jìn)一步突破，通過無監(jiān)督強(qiáng)化學(xué)習(xí)與知識(shí)蒸餾技術(shù)，在推理能力上對(duì)標(biāo)頂尖模型，同時(shí)開源多尺寸版本，推動(dòng)更廣泛的應(yīng)用。DeepSeek三種模式對(duì)比基礎(chǔ)模型（V3）：通用模型（2024.12），高效便捷，適用于絕大多數(shù)任務(wù)，規(guī)范性 ...

UCloud小助手 2025-02-13 22:35 評(píng)論0 收藏0
GPU云服務(wù)器最新排名（數(shù)據(jù)截止到2025年4月1日）

（遵循數(shù)據(jù)全面性、客觀性、可驗(yàn)證性及結(jié)構(gòu)化原則）一、排名依據(jù)與評(píng)估維度本文從以下維度評(píng)估GPU云服務(wù)器一體機(jī)解決方案：性能表現(xiàn)：包括GPU型號(hào)覆蓋、算力效率、分布式訓(xùn)練支持等。可靠性：服務(wù)穩(wěn)定性、容災(zāi)能力、SLA承諾。生態(tài)整合：與AI框架的兼容性、多模態(tài)大模型支持、開發(fā)者工具鏈。性價(jià)比：?jiǎn)挝凰懔Τ杀?、彈性?jì)費(fèi)模式、長(zhǎng)期合作折扣。行業(yè)適配：企業(yè)級(jí)服務(wù)案例、垂直領(lǐng)域解決方案。二、2025年GPU云服務(wù)...

erick.lu 2025-04-01 14:49 評(píng)論0 收藏0