Halo RAG!
RAG 问答(Retrieval-Augmented Generation)是一种结合搜索和生成的智能问答方式,它先从知识库或文档中检索出相关资料,再由大语言模型根据这些资料生成回答,既能保证答案内容贴合事实,又能让知识的更新和维护更灵活。
在最新版本的Halo AI 助手插件中,我们为 Halo 深度集成了 RAG 问答功能,支持将文章或者 Docsme 插件中的文档作为知识库,然后在前台提供智能问答的界面。
创建知识库
在安装最新版本插件(2.0.0+)后,会在 Console 的侧边菜单添加一个智能问答的菜单项,点击进入知识库页面,然后点击新建知识库按钮。
参数详解:
-
名称:为知识库起一个名字,符合内容的意义即可
-
嵌入模型:设置嵌入模型,用于将知识库中的内容向量化
-
模型供应商:选择一个配置好的供应商,需要确保此供应商包含了嵌入模型,常见的有 OpenAI 的 text-embedding-3-small、Qwen 的 text-embedding-v4、Google 的 gemini-embedding-001
-
模型:选择一个嵌入模型
-
向量维度:部分嵌入模型支持设置向量维度,可能需要查看对应模型的文档,如果不知道模型是否支持,可以置空
-
-
内容:用于选择 Halo 中的内容范围
-
类型:目前支持文章和 Docsme 文档
-
文章/限定分类:用于选择具体分类添加到知识库,如果要选择所有文章,留空即可
-
Docsme 文档/限定文档项目:用于选择具体文档项目添加到知识库,如果要选择所有文档项目,留空即可
-
填写完成之后点击创建按钮即可开始创建索引,这个过程可能会持续较长时间,与模型生成速度和内容数量有关,索引完成之后可以进入详情页面:
在这里可以看到具体的索引数据,还可以在这里测试数据检索。
创建应用
点击侧边菜单的智能问答->应用进入应用管理页面,点击新建应用按钮:
-
名称:根据实际需求命名即可,需要注意的是,这个名称会显示在聊天界面的标题中。
点击创建按钮之后会进入到应用详细配置页面:
在这个页面可以边配置边测试,以下是配置参数详解:
-
图标:可以作为聊天窗口的 AI 机器人的头像
-
知识库:选择一个知识库,后续 AI 问答的上下文范围将限定在这个知识库
-
聊天模型:配置一个聊天模型,模型建议选择和嵌入模型相同的厂商
-
系统角色:将放置在 AI 会话提示词的最开头位置,用于为 AI 限定一个角色
-
自定义系统提示词:你可以根据示例微调提示词,如不填写,将使用默认的提示词
-
开场白:访客打开 AI 聊天窗口时,AI 机器人发送的第一条对话
-
预设问题:可以在这里为访客预设一些问题,使用换行分割多个问题,设置之后会在输入框的上方显示
-
空回复提示词:自定义空回复提示词,在知识库没有找到相关内容时使用
-
开启流式输出:关闭之后会等待模型返回所有的内容之后再显示内容
-
多轮对话:开启之后会携带用户和 AI 的历史对话
-
携带对话条数:限制历史对话条数
-
相似度阈值:设置检索结果的最低相似度要求(范围:0-1,通常建议0.5-0.8)。低于此值的知识片段将被忽略,帮助过滤无关内容,提高答案质量。如果设得太高,可能导致检索结果过少,太低则可能引入噪声
-
检索结果数量 (Top K) :指定从知识库中检索并使用的相似结果数量(例如,5表示取前5个最相似的片段)。较大的K值可以提供更多上下文,提高答案全面性,但可能增加响应时间。建议从3-10开始,根据应用场景调整
-
访问控制:在默认情况下,应用只有超级管理员可以访问
-
允许访问的角色:限定可以访问此应用的角色,如果需要让任何访客都可以使用,可以选择未登录用户
-
在配置以及测试完毕后,可以点击右上角的启用按钮,就代表此应用已经可以投入使用。
在前台展示
在配置完应用之后,我们会希望将应用放置在前台,以供访客使用,以下是具体配置方式。
点击侧边菜单的智能问答->应用进入应用管理页面,然后点击右上角的场景配置按钮:
具体配置详解:
-
搜索弹窗:用于覆盖页面中原有的搜索弹窗,配置之后会将搜索界面覆盖为 AI 智能问答 + 传统搜索引擎界面
-
页面范围:用于限定覆盖页面范围,如果你想在全局覆盖,选项所有页面即可,如果想在具体的页面范围中覆盖,可以自行填写路径,可以是具体页面,也可以添加通配符,比如
/docs/**
-
应用:选择一个已启用的应用
-
-
全局悬浮气泡:添加之后会在页面的底部添加一个 AI 智能问答入口的按钮
-
页面范围:用于限定在哪些页面上添加按钮,如果想在所有页面添加,选择所有页面即可,如果想在具体的页面范围中添加,可以自行填写路径,可以是具体页面,也可以添加通配符,比如
/docs/**
-
-
悬浮气泡样式:用于自定义悬浮气泡的样式
-
位置:目前支持右下角和左下角,如果你网站的右下角有其他元素,推荐放置在左下角
-
横向偏移:自定义靠左或者靠右的距离
-
纵向偏移:自定义靠底的距离
-
大小:自定义气泡的大小
-
圆角:自定义气泡的圆角,默认为 9999px(圆形)
-
-
搜索弹窗样式
-
默认选项:用于配置搜索弹窗中默认的选项,如果你期望默认显示传统搜索页面,可以选择为传统搜索
-
配置完毕之后,访问前台页面就可以看到效果:
编辑器集成
除了在上述提到的场景配置中将应用提供到前台,还可以自行在 Halo 的默认编辑器中添加,进入 Halo 的默认编辑器,在顶部工具栏中选择添加 RAG 智能问答面板,然后选择一个应用即可。
👇 使用专业版解锁新功能
🎁 现已加入国庆 8天乐~