在本博文中,您将了解到
- 我们是如何从标准 RAG 发展到 Agentic RAG 的。
- 代理 RAG 实际上是什么?
- 它的工作原理以及最常见的实施架构。
- 传统 RAG 与代理 RAG 的比较。
- 其主要用途包括
- 它带来的主要挑战,以及如何像专家一样应对这些挑战。
让我们深入了解一下!
从 RAG 到代理 RAG
RAG(Retrieval-Augmented Generation,检索增强生成)是一种通过提供相关外部上下文来增强 LLM 应用程序的技术。它的工作原理是在查询时通过数据源检索文档,并将其输入 LLM。
这有助于将模型的反应固定在准确的信息上,降低产生幻觉的风险。然而,传统的RAG 应用有两大局限性:
- 它们通常只依赖一个或有限的几个外部知识源。
- 它们采用的是一次性方法:只检索一次上下文,不对检索到的信息进行反复推理或验证。
与此同时,随着人工智能代理的兴起,人工智能领域也在迅速发展。这些基于 LLM 的系统能够进行推理、规划、记忆和使用外部工具(如通过 MCP)。这些代理可以执行复杂的多步骤任务,适应新的输入,并根据观察结果做出决策。
这种转变需要一种更先进的方法:代理 RAG。是时候探索检索增强生成的新时代了!
什么是代理 RAG?
Agentic RAG是一种由人工智能代理驱动的 RAG 架构。其核心是将静态的检索生成管道转变为动态的代理驱动流程。
与传统的 RAG 不同,它不依赖于检索和生成步骤的固定顺序。相反,代理 RAG 将控制权交给了一个能够进行推理、规划和使用工具的自主代理。
在这种设置下,RAG 代理负责决定如何检索信息、使用哪些工具以及何时完善对用户查询的理解。它可以与多个数据源交互、验证结果、迭代步骤,甚至在需要时与其他代理协作。
这种架构为更灵活、更自适应、更智能的基于代理的人工智能系统打开了大门。Agentic RAG 设计用于处理复杂的多步骤任务,具有更强的情境感知能力和自主性。
代理 RAG 如何工作
代理式 RAG 的工作原理是将人工智能代理嵌入 RAG 管道的检索阶段。这种方法不是被动地从单一来源获取文档,而是依靠检索代理主动选择获取信息的方式和地点。
这些代理可以访问各种工具,包括矢量数据库、网络搜索引擎、外部 API、计算器等。例如,它们可以连接到MCP 服务器,该服务器提供 20 多种工具,用于从任何网页中实时提取数据。
RAG 代理掌管一切。它可以决定是否需要检索、使用哪种工具、如何措辞查询,以及检索到的上下文是否足够好–或者是否需要再试一次。
在更复杂的情况下,多个专门的 RAG 代理可能会相互协作。一个代理可能会查询结构化数据库,而另一个代理则会从电子邮件或网页中搜刮数据。
虽然这个概念还很新,但顶级人工智能代理库已经提供了实现代理 RAG 工作流所需的一切。接下来,让我们探讨两种流行的架构,以便更好地了解这种机制是如何运作的!
单一代理 RAG
代理 RAG 的最简单形式是使用一个作为路由器的单一代理系统来实现的。这种代理通常被称为代理 RAG 路由器或RAG 路由代理。
在这种架构中,一个人工智能代理接收用户查询,并决定使用哪个外部知识源或工具进行检索。路由器代理可以连接一个或多个来源,没有严格的限制–从矢量数据库到刮擦应用程序接口。
RAG 代理将查询路由到最相关的来源,检索必要的信息,并将检索到的上下文传递给 LLM。换句话说,它将检索到的数据与用户查询结合起来,帮助 LLM 生成最终的准确响应。
这种设计简单有效,非常适合使用数量有限的工具或数据源。
多代理 RAG 系统
对于更复杂的任务,应首选多代理架构。在这种情况下,一个主代理负责协调多个专门的检索代理。
在整个代理 RAG 流程中,每个代理负责一个特定的数据域或任务。例如,一个代理可能会检索内部专有文件,另一个代理可能会从网上收集信息,而其他代理可能会汇总或验证数据。
这种分工使系统能够更有效地处理多方面的查询。这是因为代理可以并行工作,收集和处理来自不同来源的信息。
多代理 RAG 系统通常包括各种专门代理,如
- 路由代理:根据用户的查询决定使用哪些数据源和工具,并引导数据流通过最相关的 RAG 管道。
- 查询规划代理:将复杂的查询分解为子任务,在代理之间进行分配,并将结果整合为一致的响应。
- ReAct 代理:根据ReAct 模式,使用推理和行动步骤迭代地解决任务。它们可以根据中间结果动态地选择工具和改进行动。
- 计划和执行代理:独立执行整个多步骤工作流程,提高效率,减少返回中央计划器的需要。
这种模块化协作架构使得多代理 RAG 具有高度的适应性和强大的功能。因此,它非常适合复杂的现实世界人工智能应用。
RAG 与代理 RAG
RAG 可在较窄的范围内工作,但由于其一次性检索、缺乏适应性以及无法验证或完善其输出结果而受到限制。
另一方面,代理 RAG 将人工智能代理集成到管道中,以创建一个更智能、更灵活的系统。这更好地反映了人类在利用来自可信渠道的信息解决复杂任务时的思维和操作方式。
如需快速比较,请参阅下面的 RAG 与代理 RAG 汇总表:
方面 | 传统的 RAG | 代理 RAG |
---|---|---|
使用外部工具 | ❌ | ✅ |
代理之间的合作 | ❌ | ✅ |
查询预处理 | ❌ | ✅ |
多步骤信息检索 | ❌ | ✅ |
验证检索到的信息 | ❌ | ✅ |
适应不断变化的环境 | ❌ | ✅ |
可扩展性 | 有限公司 | 高 |
注:即使是最强大的 RAG 系统–无论是传统的还是代理的–也无法完全消除人工智能幻觉的风险。
代理 RAG 是否总是优于标准 RAG?
简要说明:不一定。在某些情况下,传统的 RAG 仍然是更好的选择。
鉴于我们所讨论的所有优势,您可能会问,是否还有理由使用普通的传统 RAG 管道。答案是肯定的。
虽然代理 RAG 带来了之前强调的所有好处,但它也会带来一些权衡。更多的代理意味着更高的复杂性、更高的成本和更大的出错或失败空间。由于协调开销,代理系统可能更难调试,运行速度也更慢。此外,还很难了解幕后发生了什么以及如何获得特定响应。
传统的 RAG 仍是速度和成本效益最为重要的简单、定义明确的使用案例的理想选择。相反,代理 RAG 在其他情况下大放异彩。了解它们!
代理 RAG 用例
在需要与各种信息源进行动态交互的场景中,Agentic RAG 表现出色,例如
- 跨数据孤岛的企业搜索:让代理从电子邮件、数据库、内部文档和应用程序接口中检索和整合信息–所有这些都在一个综合响应中完成。
- 自动化客户支持:自主处理日常咨询,同时在需要时将复杂问题智能升级至人工座席。
- 复杂的研究和分析:综合不同知识库和来源的信息,回答复杂的研究问题或进行深入分析。
- 个性化内容生成:将用户特定信息与更广泛的知识相结合,创建高度定制化的内容,如个性化报告或学习材料。
- 多模态数据处理:跨文本、图像和音频进行推理,用于合规性审查、保险索赔等。
代理 RAG 面临的挑战和如何克服这些挑战
在管理带有一个或多个 RAG 代理的架构所带来的所有新挑战中,Agentic RAG 仍与传统 RAG 系统中的许多核心难题相同。
原因在于,无论采用何种架构,大部分复杂性都源于检索高质量、可信任的数据。
然而,Agentic RAG 更进一步。它不仅仅是跨行业获取可靠数据的问题。它还需要工具、应用程序和系统来检索、分析、转换和处理这些数据。
因此,您需要访问完整的人工智能数据基础设施。这正是 Bright Data 通过其人工智能解决方案提供的服务,其中包括
- 数据提供商:与值得信赖的提供商建立联系,大规模地获取高质量的人工智能就绪数据集。
- 自主人工智能代理:使用一套功能强大的应用程序接口,实时搜索、访问任何网站并与之互动。
- 垂直 AI 应用程序:建立可靠的自定义数据管道,从特定行业来源提取网络数据。
- 基础模型:访问符合要求的网络规模数据集,以便进行预训练、评估和微调。
- 多模态人工智能:利用世界上最大的图像、视频和音频资源库,为人工智能进行优化。
- 数据包:获取精心策划、随时可用、结构化、丰富和注释的数据集。
结论
在人工智能驱动的世界中,智能代理发展迅速,代理 RAG 代表了传统 RAG 工作流程的自然发展。它通过引入能够对检索到的上下文数据进行推理和验证的人工智能代理,改进了标准的 RAG 流程。
正如本文所述,主要挑战不仅来自于获取高质量数据。它们还需要有代理就绪的工具来进行检索、验证和转换。这正是Bright Data 的人工智能基础设施所要提供的。
创建一个免费的 Bright Data 账户,现在就开始尝试使用我们的人工智能数据基础设施!
支持支付宝等多种支付方式