MENU

云上部署私有化大模型实践,轻松使(bái)用(piáo)DeepSeek-R1 满血版

February 19, 2025 • 默认分类

DeepSeek 火了,掀起了一波更大的全民大模型使用的热潮。可是,随着在线使用需求迅猛增长,DeepSeek 官网出现了服务器资源紧张、响应延迟增加、甚至无法响应的情况。

如果你想:

  • 白嫖 体验快速稳定的大模型服务;
  • 白嫖 缺乏本地部署大模型服务的昂贵硬件,并快速部署私有化模型;
  • 白嫖 微调大模型参数,并使用更多自定义功能;

本文介绍分别使用阿里云百炼、火山引擎两家云上大模服务平台构建私有化 DeepSeek-R1 模型应用,并结合 Cherry Stutio 打造简单方便的 AI 助手,提供一种平替或者优于使用 DeepSeek 官网的方案。

近日诸多国内云服务厂商提供大模型免费尝鲜服务:

  • 阿里云百炼为 DeepSeek-R1 与 DeepSeek-V3 模型分别提供 100 万 tokens 免费额度,详见这里
  • 火山引擎为 DeepSeek 在内的多种模型提供 50 万 tokens 免费额度,详见这里

阿里云百炼部署 DeepSeek 模型

前置条件:注册阿里云账号,并进行进行实名认证。

首先登录至阿里云百炼大模型服务平台。如果是第一次使用,将会提示“新用户开通即享每个模型 100 万免费 tokens”,只需要点击对应的提示链接,按照说明步骤操作即可开通百炼的模型服务,获取免费额度。这里我已经开通过了,没对应提示就不截图了。

开通百炼模型服务之后,点击这里进入阿里云百炼控制台的应用中心,这里的应用指的是基于各类模型创建、部署、自定义之后的模型实例。进入应用中心的“我的应用”页面,可以进行大模型应用创建并查看已创建应用列表。这里我已经创建了一个应用,如下图所示。

阿里云百炼

点击创建应用,选择“智能体应用”。

一键创建阿里云百炼应用

选择对应模型,这里选择 DeepSeek-R1 模型。选择模型之后可以按需调整相关参数:

  • 温度系数,即模型生成文本的随机程度。值越大,回复内容越赋有多样性、创造性、随机性。设为 0 即是根据事实回答。
  • 最长回复长度,即模型生成的长度限制,不包含 prompt。不同模型的最大回复长度各有差异。这个参数调得越高,回复内容可能越长,tokens 额度消耗得越快。
  • 携带上下文轮数,即输入模型的最大历史对话轮数,轮数越多,对话相关性越强。这个参数可以按需设置。

创建阿里云百炼应用,选择模型一

创建阿里云百炼应用,选择模型二

模型选择和参数配置下方,还支持 Prompt 配置、Prompt 样例库以及长期激励配置。这几个配置都与 Prompt 相关,由于后续我将使用 Cherry Studio 提供的多种内置 Prompt 与应用交互(下文会讲到),所以这里不进行配置。选择好模型、配置好模型参数之后即可点击发布。

发布成功之后,可在体验窗进行测试体验。体验窗类似于各类大模型官网提供的会话窗口,这里有点窄,毕竟这里只是体验窗,测试一下功能即可。

阿里云百炼应用体验窗

发布成功之后,重新回到“我的应用”页面,选择刚才创建好的应用,点击“调用”按钮。

阿里云百炼除 API 调用方式外,还另外提供官方分享渠道、魔笔分享渠道等调用方式。后续我们将使用 API 方式调用我们的模型应用。

通过 API 方式调用需要 API-KEY 进行身份认证和权限鉴别,点击上图中的 API KEY 打开查看 API-KEY 弹框,随后按照提示创建一个 Key 和应用绑定。这个 API-KEY 我们后续会在 Cherry Studio 中使用到。

至此,在阿里云百炼平台的模型部署便完成了。如果想了解更多关于阿里云百炼的功能以及使用说明,请查看官方文档

火山引擎部署 DeepSeek 模型

前置条件:注册火山引擎账号,并进行进行实名认证。

首先登录至火山引擎-火山方舟控制台,切换至“我的应用”页面,点击创建应用按钮。

火山方舟创建应用

选择零代码与单聊

设置应用名称,并选择推理接入点(即模型)。初次使用时,需要创建接入点,这里点击“去创建”按钮即可跳转至接入点创建页面,按照提示选择 DeepSeek R1 模型即可。联网内容插件可以按需启用,Prompt 相关配置无需填写,后续交由 Cherry Studio 为会话设置 Prompt。完成以上配置之后,即可右上角点击发布按钮。

发布完成之后,可重新回到“我的应用”页面,选择刚才创建好的应用,点击立即体验。注意,这里每个应用下方都有一个应用 ID,后续会用到。

火山引擎和阿里云百炼一样,提供了体验窗口。不过,我们来到这个页面重点不是为了体验,而是为了查看 API 调用指南以及创建 API Key 的。

点击选择 API Key 并复制按钮,按照只是创建 API Key 即可。这个 API Key 会在 Cherry Studio 中用到。在调用指南页面,除了创建 API Key 之外,还可以找到下方各类 SDK 的调用指南。

至此,火山引擎的大模型部署便完成了。

安装与配置 Cherry Studio

Cherry Studio 是一款开源的、基于 Electron 开发的、集多模型对话、知识库管理、AI 绘画、翻译等功能于一体的全能 AI 助手平台,支持 Mac 和 Windows 操作系统。通俗来讲,Cherry Studio 已经集成了国内外多家大模型厂商服务的 API 调用功能,包括DeepSeek、百度云千帆、阿里云百炼、火山引擎等等。我们可以借助这个软件作为客户端来与私有化部署的大模型进行交互。

Cherry Studio 的会话页面:

Cherry Studio 的会话页面

此外,Cherry Studio 已经内置了各领域多种智能体。当我们初始会话时,选择对应智能体,即可为我们的当前会话设置好大模型的角色提示词。当然,如果需要更细致的提示词,也可以新增自定义智能体。可以参考 Prompt 最佳实践一文。

Cherry Studio 内置的多种智能体

访问 Cherry Studio 的 Release 页面即可下载最新版本的客户端进行安装。

  • Mac OS 系统:下载对应 CPU 架构的 dmg 文件即可,例如使用苹果 ARM 芯片的笔记本下载以"-arm64.dmg"结尾的安装包。Intel 芯片的电脑可以下载以"-x64.dmg"结尾的安装包;
  • Windows 系统:如果使用免安装版本,可以下载以 "-portable.exe" 结尾的安装包;否则下载以"-setup.exe"结尾的安装包。

Cherry Studio 的 Release 页面

如果你想了解更多,可以访问其官网文档仓库

Cherry Studio 接入阿里云百炼应用

这一节将介绍如何将上文中在百炼大模型服务平台部署的应用在 Cherry Studio 中接入使用。

安装好 Cherry Studio 之后,我们即可配置需要接入的大模型应用。

  1. 点击左下角的设置按钮;
  2. 在大模型服务平台中选择阿里云百炼;
  3. 开启右上角的大模型服务平台的启用开关,后续我们在新建对话并选择智能体之后,可选择阿里云百炼的应用。

选择好对应的大模型服务平台之后,即可接入在该平台部署的应用。

  1. API 密钥:还记得刚才在阿里云百炼平台中创建的 API-KEY 吗?这里填入 API-KEY 即可;
  2. API 地址:这里默认会有一个地址,我们需要修改一下,填入:https://dashscope.aliyuncs.com/compatible-mode/v1/

Cherry Studio 配置阿里云百炼应用

接下来新增模型。之前我们的创建阿里云百炼应用时,选择的模型是 deepseek-r1,因此添加模型这里:

  • 模型 ID 填写 deepseek-r1;
  • 模型名称,填写模型 ID之后会自动带入,可自定义;
  • 分组名称,填写模型 ID之后会自动带入,可自定义;

完成以上配置之后,需要检查一下 Cherry Studio 和应用之间的连通。在 API 密钥之一框框后面点击“检查”按钮,随后在弹框中选择需要检测的模型。如果提示“连接成功”即表示配置成功了。

接下来我们开始对话。

  1. 在 Cherry Studio 左侧菜单中点击会话按钮,进入会话页面;
  2. 在助手页中点击添加助手;
  3. 在弹窗中按需选择对应的助手。例如希望询问大模型一些编程开发问题,可以选择开发工程师。

接下来我们需要为会话选择刚才新接入的大模型应用。

  1. 选择刚才新增的助手;
  2. 点击上方的模型进行切换;
  3. 切换至刚接入的阿里云百炼 DeepSeek-R1 模型。

现在便可以愉快地进行对话了。

Cherry Studio 接入火山引擎应用

与接入阿里云百炼应用类似,下面做简要说明。在设置中的大模型服务平台中启用火山引擎。

  1. 配置好 API Key;
  2. 设置 API 地址为 https://ark.cn-beijing.volces.com/api/v3/bots/
  3. 需要注意的是,添加模型时,输入模型 ID 的是在火山方舟中的应用 ID,而不是 DeepSeek。

点击检查之后,提示“连接成功”便大功告成啦。