Dify 接入万模API
适用协议:OpenAI Chat / Embeddings | 适合:LLM 应用编排、工作流、知识库和团队应用
Dify 不是普通聊天客户端,它通常会同时用到 LLM 模型 和 Embedding 模型。接入万模API时,先把对话模型跑通,再配置知识库向量模型,避免把两个问题混在一起排查。
开始前确认
推荐配置顺序
- 先配置 LLM 模型。
- 创建一个最简单的 Chat 应用并测试。
- 再配置 Embedding 模型。
- 创建知识库并上传一小段文本测试索引。
- 最后再接入复杂工作流。
配置 LLM 模型
- 进入 Dify 工作区。
- 打开模型供应商设置。
- 选择 OpenAI-API-compatible、OpenAI Compatible 或自定义 OpenAI。
- Base URL 填:
https://www.wanmoapi.com/v1。 - API Key 填:你的
sk-...。 - 模型名填控制台可用 Chat 模型。
- 保存并启用。

先把 LLM / Chat 模型跑通,再按下文单独配置 Embedding。示意图中的 API Key 已打码。
配置 Embedding 模型
知识库检索需要单独配置 Embedding,不能直接拿聊天模型当向量模型。
验证方式
验证 Chat 应用
- 新建 Chat 应用。
- 选择刚配置的 LLM 模型。
- 发送“你好,用一句话介绍你自己”。
- 到万模API控制台查看调用日志。
验证知识库
- 新建一个测试知识库。
- 上传一个很短的 txt 或 markdown 文件。
- 等待索引完成。
- 在应用里引用知识库提问。
常见问题
Chat 能用,知识库索引失败
通常是 Embedding 模型没有配置、模型名不对、或令牌分组无权访问 Embedding 模型。先单独配置 Embedding。
工作流节点报模型不存在
Dify 的不同节点可能使用不同模型。检查每个节点的模型选择,不要只看全局默认模型。
自部署 Dify 不生效
修改供应商或环境变量后,可能需要重启服务。确认服务端容器能访问 https://www.wanmoapi.com。
消耗比普通聊天高
知识库索引、批量运行和工作流会产生多次请求。建议给 Dify 单独创建令牌,并设置额度上限。
