🔎 检索增强生成 (RAG)
检索增强生成(RAG)是一项前沿技术,通过整合来自各种来源的上下文信息,提升聊天机器人的对话能力。它的工作原理是从本地和远程文档、网页内容,甚至是像YouTube视频这样的多媒体资源中检索相关信息。检索到的文本会与预定义的RAG模板结合,并添加到用户的提示前,从而提供更加丰富且上下文相关的回复。
RAG的一个关键优势在于其能够访问并整合来自多种来源的信息,使其成为处理复杂对话场景的理想解决方案。例如,当用户提出与特定文档或网页相关的问题时,RAG可以从该来源检索并整合相关信息到聊天回复中。RAG还可以从多媒体资源如YouTube视频中检索并整合信息。通过分析这些视频的字幕或转录,RAG可以提取相关内容并将其融入聊天回复。
本地和远程RAG集成
要使用本地文档,首先需要通过工作区区域的“文档”部分上传这些文档,然后在查询前使用 #
符号进行访问。点击出现在聊天框上方的格式 化URL。选择后,文档图标会显示在“发送消息”按钮上方,表示成功检索。
您也可以通过在提示开头加上 #
和URL来将文档加载到工作区区域。这有助于直接将网页内容融入您的对话中。
RAG中的网络搜索
为了整合网页内容,可以在聊天中以 #
开头,随后是目标URL。点击出现在聊天框上方的格式化URL。选择后,文档图标会显示在“发送消息”按钮上方,表示成功检索。Open WebUI会从URL中获取并解析信息(如果可能的话)。
网页通常包含导航栏和页脚等多余信息。为了获得更好的结果,请链接到页面的原始版本或适合阅读的版本。
RAG模板自定义
您可以通过 管理员面板
> 设置
> 文档
菜单自定义RAG模板。
RAG嵌入支持
您可以直接在 管理员面板
> 设置
> 文档
菜单中更改RAG嵌入模型。此功能支持Ollama和OpenAI模型,使您能够根据需求优化文档处理。
RAG中的引用功能
RAG功能允许用户轻松跟踪提供给语言模型的文档上下文,并附带引用以供参考。这确保了在聊天中使用外部来源时的透明性和责任感。
增强的RAG流程
我们为RAG嵌入功能提供的可切换混合搜索子功能,通过 BM25
增强了RAG的功能,并由 CrossEncoder
提供重新排序支持,同时配置了相关性评分阈值。这为您的具体用例提供了更精确和定制化的RAG体验。
YouTube RAG流程
通过视频URL专门设计的RAG流程,可以平滑地与视频转录内容互动。这一创新功能使您能够将视频内容融入聊天中,进一步丰富您的对话体验。