什么是 Agentic RAG？人工智能中基于代理的检索指南

在本博文中，您将了解到

让我们深入了解一下！

从 RAG 到代理 RAG

RAG（Retrieval-Augmented Generation，检索增强生成）是一种通过提供相关外部上下文来增强 LLM 应用程序的技术。它的工作原理是在查询时通过数据源检索文档，并将其输入 LLM。

这有助于将模型的反应固定在准确的信息上，降低产生幻觉的风险。然而，传统的RAG 应用有两大局限性：

与此同时，随着人工智能代理的兴起，人工智能领域也在迅速发展。这些基于 LLM 的系统能够进行推理、规划、记忆和使用外部工具（如通过 MCP）。这些代理可以执行复杂的多步骤任务，适应新的输入，并根据观察结果做出决策。

这种转变需要一种更先进的方法：代理 RAG。是时候探索检索增强生成的新时代了！

Agentic RAG是一种由人工智能代理驱动的 RAG 架构。其核心是将静态的检索生成管道转变为动态的代理驱动流程。

与传统的 RAG 不同，它不依赖于检索和生成步骤的固定顺序。相反，代理 RAG 将控制权交给了一个能够进行推理、规划和使用工具的自主代理。

在这种设置下，RAG 代理负责决定如何检索信息、使用哪些工具以及何时完善对用户查询的理解。它可以与多个数据源交互、验证结果、迭代步骤，甚至在需要时与其他代理协作。

这种架构为更灵活、更自适应、更智能的基于代理的人工智能系统打开了大门。Agentic RAG 设计用于处理复杂的多步骤任务，具有更强的情境感知能力和自主性。

代理式 RAG 的工作原理是将人工智能代理嵌入 RAG 管道的检索阶段。这种方法不是被动地从单一来源获取文档，而是依靠检索代理主动选择获取信息的方式和地点。

这些代理可以访问各种工具，包括矢量数据库、网络搜索引擎、外部 API、计算器等。例如，它们可以连接到MCP 服务器，该服务器提供 20 多种工具，用于从任何网页中实时提取数据。

RAG 代理掌管一切。它可以决定是否需要检索、使用哪种工具、如何措辞查询，以及检索到的上下文是否足够好–或者是否需要再试一次。

在更复杂的情况下，多个专门的 RAG 代理可能会相互协作。一个代理可能会查询结构化数据库，而另一个代理则会从电子邮件或网页中抓取数据。

虽然这个概念还很新，但顶级人工智能代理库已经提供了实现代理 RAG 工作流所需的一切。接下来，让我们探讨两种流行的架构，以便更好地了解这种机制是如何运作的！

代理 RAG 的最简单形式是使用一个作为路由器的单一代理系统来实现的。这种代理通常被称为代理 RAG 路由器或RAG 路由代理。

在这种架构中，一个人工智能代理接收用户查询，并决定使用哪个外部知识源或工具进行检索。路由器代理可以连接一个或多个来源，没有严格的限制–从矢量数据库到抓取应用程序接口。

RAG 代理将查询路由到最相关的来源，检索必要的信息，并将检索到的上下文传递给 LLM。换句话说，它将检索到的数据与用户查询结合起来，帮助 LLM 生成最终的准确响应。

这种设计简单有效，非常适合使用数量有限的工具或数据源。

对于更复杂的任务，应首选多代理架构。在这种情况下，一个主代理负责协调多个专门的检索代理。

在整个代理 RAG 流程中，每个代理负责一个特定的数据域或任务。例如，一个代理可能会检索内部专有文件，另一个代理可能会从网上收集信息，而其他代理可能会汇总或验证数据。

这种分工使系统能够更有效地处理多方面的查询。这是因为代理可以并行工作，收集和处理来自不同来源的信息。

多代理 RAG 系统通常包括各种专门代理，如

这种模块化协作架构使得多代理 RAG 具有高度的适应性和强大的功能。因此，它非常适合复杂的现实世界人工智能应用。

RAG 可在较窄的范围内工作，但由于其一次性检索、缺乏适应性以及无法验证或完善其输出结果而受到限制。

另一方面，代理 RAG 将人工智能代理集成到管道中，以创建一个更智能、更灵活的系统。这更好地反映了人类在利用来自可信渠道的信息解决复杂任务时的思维和操作方式。

如需快速比较，请参阅下面的 RAG 与代理 RAG 汇总表：