跳到主要内容

🔎 检索增强生成 (RAG)

检索增强生成(RAG)是一项前沿技术,通过整合来自各种来源的上下文信息,提升聊天机器人的对话能力。它的工作原理是从本地和远程文档、网页内容,甚至是像YouTube视频这样的多媒体资源中检索相关信息。检索到的文本会与预定义的RAG模板结合,并添加到用户的提示前,从而提供更加丰富且上下文相关的回复。

RAG的一个关键优势在于其能够访问并整合来自多种来源的信息,使其成为处理复杂对话场景的理想解决方案。例如,当用户提出与特定文档或网页相关的问题时,RAG可以从该来源检索并整合相关信息到聊天回复中。RAG还可以从多媒体资源如YouTube视频中检索并整合信息。通过分析这些视频的字幕或转录,RAG可以提取相关内容并将其融入聊天回复。

本地和远程RAG集成

要使用本地文档,首先需要通过工作区区域的“文档”部分上传这些文档,然后在查询前使用 # 符号进行访问。点击出现在聊天框上方的格式化URL。选择后,文档图标会显示在“发送消息”按钮上方,表示成功检索。

您也可以通过在提示开头加上 # 和URL来将文档加载到工作区区域。这有助于直接将网页内容融入您的对话中。

RAG中的网络搜索

为了整合网页内容,可以在聊天中以 # 开头,随后是目标URL。点击出现在聊天框上方的格式化URL。选择后,文档图标会显示在“发送消息”按钮上方,表示成功检索。Open WebUI会从URL中获取并解析信息(如果可能的话)。

提示

网页通常包含导航栏和页脚等多余信息。为了获得更好的结果,请链接到页面的原始版本或适合阅读的版本。

RAG模板自定义

您可以通过 管理员面板 > 设置 > 文档 菜单自定义RAG模板。

RAG嵌入支持

您可以直接在 管理员面板 > 设置 > 文档 菜单中更改RAG嵌入模型。此功能支持Ollama和OpenAI模型,使您能够根据需求优化文档处理。

RAG中的引用功能

RAG功能允许用户轻松跟踪提供给语言模型的文档上下文,并附带引用以供参考。这确保了在聊天中使用外部来源时的透明性和责任感。

增强的RAG流程

我们为RAG嵌入功能提供的可切换混合搜索子功能,通过 BM25 增强了RAG的功能,并由 CrossEncoder 提供重新排序支持,同时配置了相关性评分阈值。这为您的具体用例提供了更精确和定制化的RAG体验。

YouTube RAG流程

通过视频URL专门设计的RAG流程,可以平滑地与视频转录内容互动。这一创新功能使您能够将视频内容融入聊天中,进一步丰富您的对话体验。

文档解析

多种解析器用于从本地和远程文档中提取内容。更多详情请参阅 get_loader 函数。

Google Drive集成

当与启用了Google Picker API和Google Drive API的Google Cloud项目配对时,此功能允许用户直接从聊天界面访问其Drive文件,并上传文档、幻灯片、表格等作为聊天的上下文。可以通过 管理员面板 > 设置 > 文档 菜单启用。必须设置 GOOGLE_DRIVE_API_KEY 和 GOOGLE_DRIVE_CLIENT_ID 环境变量才能使用。