DeepSeek-R1 Distill系列
基于DeepSeek-R1的推理能力,通過蒸餾技術(shù)將推理能力遷移到較小的模型上,在保持高效性能的同時(shí),成功降低了計(jì)算成本,實(shí)現(xiàn)了“小身材、大智慧”的完美平衡!該鏡像使用vLLM部署提供支持,適用于高性能大語言模型的推理和微調(diào)任務(wù),
第一步:登錄「優(yōu)云智算」算力共享平臺(tái)并進(jìn)入「鏡像社區(qū)」
地址:https://www.compshare.cn/?ytag=seo
第二步:選擇「vLLM-DeepSeek-R1-Distill」鏡像,點(diǎn)擊「使用該鏡像創(chuàng)建實(shí)例」
鏡像地址:https://www.compshare.cn/images-detail?ImageID=compshareImage-17ym815cbokz
根據(jù)鏡像說明中的引導(dǎo),選擇所用模型需要的GPU算力規(guī)格,并點(diǎn)擊「立即部署」即可擁有一個(gè)自帶模型的算力資源。
第三步:?jiǎn)?dòng)vLLM api 服務(wù),鏡像已配置好所需依賴環(huán)境,無需額外安裝,即可通過以下命令啟動(dòng)vLLM服務(wù):
單卡4090
# DeepSeek-R1-Distill-Qwen-1.5B
vllm serve /model/HuggingFace/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B --port 8000
# DeepSeek-R1-Distill-Qwen-7B
vllm serve /model/HuggingFace/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B --port8000 --max-model-len 65536
# DeepSeek-R1-Distill-Llama-8B
vllm serve /model/HuggingFace/deepseek-ai/DeepSeek-R1-Distill-Llama-8B --port8000 --max-model-len 17984
2卡4090
# DeepSeek-R1-Distill-Qwen-14B
vllm serve /model/HuggingFace/deepseek-ai/DeepSeek-R1-Distill-Qwen-14B --port8000-tp2 --max-model-len 59968
4卡4090
# DeepSeek-R1-Distill-Qwen-32B
vllm serve /model/HuggingFace/deepseek-ai/DeepSeek-R1-Distill-Qwen-32B --port 8000 -tp 4 --max-model-len 65168
8卡4090
# DeepSeek-R1-Distill-Llama-70B
vllm serve /model/HuggingFace/deepseek-ai/DeepSeek-R1-Distill-Llama-70B --port 8000
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://www.ezyhdfw.cn/yun/131183.html
DeepSeek Janus-Pro開源模型DeepSeek團(tuán)隊(duì)于1月28日凌晨發(fā)布了開源多模態(tài)大語言模型Janus-Pro,這是一款基于DeepSeek-LLM-1.5b-base和DeepSeek-LLM-7b-base構(gòu)建的模型。第一步:登錄「優(yōu)云智算」算力共享平臺(tái)并進(jìn)入「鏡像社區(qū)」地址:https://www.compshare.cn/?ytag=seo 第二步:選擇「Janus-Pro-...
DeepSeek-R1-671b動(dòng)態(tài)量化版,由unsloth.ai發(fā)布,推薦使用多卡進(jìn)行部署,具體操作如下。本鏡像還附帶32b的無限制版蒸餾模型,使用open-webui和ollama以及l(fā)lama.cpp進(jìn)行部署,內(nèi)置所有環(huán)境,即拉即用。第一步:登錄「優(yōu)云智算」算力共享平臺(tái)并進(jìn)入「鏡像社區(qū)」,新用戶免費(fèi)體驗(yàn)10小時(shí)4090地址:https://www.compshare.cn/?ytag=seo...
DeepSeek-R1-32B-WebUIDeepSeek-R1采用強(qiáng)化學(xué)習(xí)進(jìn)行后訓(xùn)練,旨在提升推理能力,尤其擅長(zhǎng)數(shù)學(xué)、代碼和自然語言推理等復(fù)雜任務(wù),該鏡像安裝和使用 Ollama 和 Open WebUI,以便更好地利用深度學(xué)習(xí)模型進(jìn)行推理和交互。第一步:登錄「優(yōu)云智算」算力共享平臺(tái)并進(jìn)入「鏡像社區(qū)」地址:https://www.compshare.cn/?ytag=seo第二步:選擇「Deep...
DeepSeek V3憑借多頭潛注意力(MLA)與優(yōu)化的混合專家網(wǎng)絡(luò)(MoE)架構(gòu),奠定了高效訓(xùn)練的基礎(chǔ),僅以557.6萬元成本實(shí)現(xiàn)媲美OpenAI O1的性能;而R1則基于V3進(jìn)一步突破,通過無監(jiān)督強(qiáng)化學(xué)習(xí)與知識(shí)蒸餾技術(shù),在推理能力上對(duì)標(biāo)頂尖模型,同時(shí)開源多尺寸版本,推動(dòng)更廣泛的應(yīng)用。DeepSeek三種模式對(duì)比基礎(chǔ)模型(V3):通用模型(2024.12),高效便捷,適用于絕大多數(shù)任務(wù),規(guī)范性 ...
(遵循數(shù)據(jù)全面性、客觀性、可驗(yàn)證性及結(jié)構(gòu)化原則)一、排名依據(jù)與評(píng)估維度本文從以下維度評(píng)估GPU云服務(wù)器一體機(jī)解決方案:性能表現(xiàn):包括GPU型號(hào)覆蓋、算力效率、分布式訓(xùn)練支持等。可靠性:服務(wù)穩(wěn)定性、容災(zāi)能力、SLA承諾。生態(tài)整合:與AI框架的兼容性、多模態(tài)大模型支持、開發(fā)者工具鏈。性價(jià)比:?jiǎn)挝凰懔Τ杀?、彈性?jì)費(fèi)模式、長(zhǎng)期合作折扣。行業(yè)適配:企業(yè)級(jí)服務(wù)案例、垂直領(lǐng)域解決方案。二、2025年GPU云服務(wù)...
閱讀 1549·2025-02-07 13:29
閱讀 1000·2024-11-07 18:25
閱讀 131495·2024-02-01 10:43
閱讀 1317·2024-01-31 14:58
閱讀 1143·2024-01-31 14:54
閱讀 83567·2024-01-29 17:11
閱讀 3867·2024-01-25 14:55
閱讀 2389·2023-06-02 13:36