添加知识库
本文介绍如何在知识库列表页面添加知识库。知识库功能允许您将外部专业文档或私有数据关联至 AI Agent,通过知识库集成,Agent 在执行任务时可以检索相关上下文,从而显著提升回答的准确性和时效性。目前支持通过 RAGFlow 接入知识库。
核心概念
知识库:对后端 RAG 服务的逻辑封装,定义了数据集来源、访问凭证和检索配置。
RAGFlow:一款开源的深度文档理解引擎,支持文档解析、向量检索和知识问答。
检索配置:控制知识库检索行为的参数,包括相似度阈值和向量相似度权重。
查看知识库列表
登录智能体引擎控制台。
左侧菜单选择知识库,查看已添加的知识库列表。
页面右上角提供添加知识库按钮和搜索知识库名称搜索框,支持快速查找已有知识库。列表展示知识库名称、类型、Endpoint、创建时间、更新时间,以及查看和编辑操作。
进入创建页面
登录智能体引擎控制台,在左侧菜单中选择知识库。
在知识库列表页面,点击右上角的添加知识库按钮。
配置知识库信息
在弹出的创建知识库对话框中,配置以下信息:
| 字段 | 是否必填 | 说明 |
|---|---|---|
| 知识库名称 | 必填 | 输入自定义的知识库显示名称,最多 100 个字符 |
| 功能描述 | 选填 | 简述该知识库的用途或涵盖的数据范围,最多 500 个字符 |
| 服务提供商 | 必填 | 选择连接已有知识库 |
| 知识库类型 | 必填 | 选择 RAGFlow |
| Endpoint | 必填 | 填写 RAGFlow 服务的 API 端点地址 |
| 数据集 ID | 必填 | 填写需要关联的 RAGFlow 数据集 ID,支持多个 ID,每个 ID 占一行 |
| 凭证类型 | 必填 | 选择凭证配置方式:已有凭证(从凭证管理中选择已创建的凭证)或 API 密钥(直接输入密钥,仅用于当前知识库) |
| 凭证名称 | 必填 | 选择或输入对应的凭证名称。凭证名称下拉框下方提供刷新和创建凭证快捷操作 |
| API 密钥 | 必填 | 选择 API 密钥凭证类型时显示,填写 RAGFlow 的 API Key |
| 检索配置 | 必填 | 配置知识库检索行为,包含相似度阈值、向量相似度权重、跨语言搜索三项参数,详见下方检索配置说明 |
检索配置说明
| 配置项 | 说明 |
|---|---|
| 相似度阈值 | 设置检索结果的最小相似度分数,低于该阈值的结果将被过滤 |
| 向量相似度权重 | 调整向量检索在混合检索中的权重占比 |
| 跨语言搜索 | 选择跨语言搜索的语言类型,支持中文和英文;不选择时默认不启用跨语言搜索 |
说明:
使用 RAGFlow 前请先在 CAE 完成应用部署。
如果凭证下拉框中没有可选凭证,可点击创建凭证快捷跳转至凭证管理页面,详情请参考 身份凭证管理。
关于如何获取 Endpoint、API 密钥和数据集 ID,请参考下方获取 RAGFlow 配置信息章节。
完成创建
点击创建按钮完成知识库的添加。
获取 RAGFlow 配置信息
通过 CAE 部署 RAGFlow 后,需登录 RAGFlow 平台提取以下配置信息。
获取 Endpoint
点击 RAGFlow 右上角用户头像,进入个人设置/账户管理页面。
找到 API 部分,查看基础请求地址 API Server,即为 Endpoint。
获取 API 密钥
在 RAGFlow 个人 API 设置页面中,找到 API KEY。
复制已有的 API KEY,如果没有创建过,点击 Create new key 按钮进行创建。
获取数据集 ID
点击 RAGFlow 顶部菜单栏的 Knowledge Base。
在列表中找到您想要关联的数据集,点击进入。
检查浏览器地址栏的 URL,或在页面的配置信息栏中找到该数据集的 UUID,即为 数据集 ID。
常见问题
没有 RAGFlow 知识库怎么办?
可前往云应用引擎(CAE)应用中心部署 RAGFlow 应用,部署完成后即可在知识库页面添加。
调用知识库失败怎么办?
确认已在 CAE 完成 RAGFlow 应用部署。
确认 Endpoint 地址可以正常访问,确保 AgentEngine 服务所在的环境能够正常访问该地址。
检查 API 密钥是否正确且有效。
检索结果不准确怎么办?
建议知识库所采用的 Embedding 模型与 Agent 实际使用的 LLM 在语义理解能力上保持匹配,以获得最佳的检索召回效果。
尝试调整检索配置中的相似度阈值和向量相似度权重参数。
API 密钥失效怎么办?
若在 RAGFlow 中重置了 Key,需同步在知识库编辑页面进行更新。