AI

使用 Bright Data 为 Boomi AI Agents 提供网页数据探索能力

探索 Bright Data 如何使 Boomi AI agents 访问并探索实时网页数据,解锁强大的自动化可能性。
3 分钟阅读
使用 Bright Data 为 Boomi AI Agents 提供网页数据探索能力

在这篇博客文章中,你将了解:

  • Boomi AI agents 是什么,以及 Boomi AgentStudio 能带来什么。
  • 为什么 Boomi AI agents 在没有网页访问的情况下会受限,以及 Bright Data Web MCP 如何解决这一点。
  • 如何通过分步教程将 Web MCP 连接到 Boomi AI agent。

让我们开始吧!

什么是 Boomi AI Agents?

Boomi 是一个云原生 iPaaS,帮助企业在碎片化系统中连接应用程序、API、数据源和工作流。具体来说,它使组织能够自动化流程并同步 CRM、ERP 和数据库等工具。

Boomi AI 代理智能体

Boomi 还通过 Boomi AgentStudio 支持 AI agents,这是一种用于设计、测试、部署和治理智能 agent 的无代码解决方案。在 AgentStudio 中,你可以使用自然语言定义 agent 指令、个性和防护栏。你还可以将 agent 连接到外部工具和企业系统,并通过可观测性功能监控其行为。

Boomi 为 AI agent 开发与管理提供的主要能力包括:

  • 预构建 AI agents:访问可直接使用的 agent,用于文档、故障排除、集成和知识检索。
  • 自然语言自动化:将普通英文指令转换为集成、工作流、API 定义和映射。
  • 企业集成:通过内置连接器将 agent 连接到应用、API、数据库和业务系统。
  • 对话记忆:在交互中保持上下文,以实现更连贯的推理和任务执行。
  • 结构化输入与输出:交换可预测、机器可读的数据,以实现可靠的自动化和 agent 链式调用。
  • 安全与治理:执行策略、监控决策、管理访问,并支持企业合规要求。
  • 跨环境部署:在云、混合和本地环境中运行 agent,以支持数据主权需求。

常规 Boomi AI Agents 的问题

Boomi AI agents 具有大多数由 LLM 驱动的解决方案共有的局限性:

  1. 知识过时LLM 在静态数据集上训练,这意味着它们的知识代表过去的一个快照,并不反映近期事件。
  2. 无法与外部世界交互:没有工具时,LLM 只能基于其现有知识生成响应。它们无法自行浏览网页或与第三方服务交互。

为了克服这些限制,AI agents 需要用于落地(grounding)的网页访问工具,以及与第三方系统的集成。这就是为什么 Boomi 原生支持连接到外部服务的连接器

具体而言,你可以通过将 Boomi AI agent 连接到一个实时网页数据基础设施来同时解决知识差距和网页交互限制。这正是 Bright Data 发挥作用的地方!

解决方案:Bright Data Web MCP

Bright Data 通过远程连接其官方 Web MCP 服务器来支持 Boomi。

Web MCP 暴露了 70+ 个工具,旨在简化与 Bright Data 网页数据基础设施的交互。这些工具支持网页搜索、发现、抓取、浏览器交互、自动化等更多功能。

即使在免费层级(每月免费 5,000 次请求),你也可以使用这些有用的工具:

工具 描述
search_engine + 其批处理版本 以 JSON 或 Markdown 格式检索 Google、Bing 或 Yandex 结果
scrape_as_markdown + 其批处理版本 将任何网页转换为干净的 Markdown,同时绕过反抓取和反机器人保护
discover 执行 AI 驱动的网页搜索,并返回排序后的相关结果

尽管如此,[专业模式](https://github.com/bright-cn/brightdata-mcp?tab=readme-ov-file#-pricing, modes) 才是真正解锁 Web MCP 全部能力的关键。它为从 40+ 平台(如 Amazon、LinkedIn、Yahoo Finance、YouTube、Zillow、GitHub、NPM 和 Google Maps)提取结构化数据提供高级工具。它还包含用于与网页交互的浏览器自动化能力。

这些工具共同显著扩展了 Boomi AI agent 的能力,以克服 LLM 的知识与网页访问限制。

如何将 Boomi Agent 连接到 Bright Data Web MCP

在这个分步章节中,你将学习如何创建一个 Boomi Agent 并将其连接到 Bright Data Web MCP 远程服务器。这将为该 agent 配备 70+ 个工具,用于网页搜索、抓取以及自动化交互。

请按照以下说明操作!

先决条件

要跟随本教程部分,请确保你具备:

第 1 步:创建一个新的 Boomi AI Agent

首先登录你的 Boomi 账号,然后点击 “Create AI Agent” 开始:

点击 “Create AI Agent” 按钮

接着选择 “Blank Template” 选项:

选择 “Blank Template” 选项

你将被重定向到 Boomi Agentstudio,在那里你可以通过设置向导配置和自定义你的 AI agent:

Boomi Agentstudio AI agent 创建向导

做得好!你现在拥有一个空白的 Boomi AI agent,已准备好进行 Bright Data 集成。

第 2 步:配置 AI Agent 配置文件

首先为你的 AI agent 设定一个清晰的目标。在这种情况下,假设你想构建一个用于网页相关任务的通用助手。例如:

Research, retrieve, and analyze web information using connected tools to provide more accurate responses and support decision-making.

接下来,为你的 agent 命名,例如 “Web Access Agent”。

配置 Boomi AI agent 配置文件

如需更详细的行为配置,可考虑更改模型配置和 agent 模式,并设置个性、语音和对话开场白。

完成后,按下底部居中的 “Save and continue” 按钮进入下一步。太棒了!

第 3 步:开始使用 Bright Data Web MCP

在继续设置向导的 “Tasks” 步骤之前,先花点时间熟悉 Bright Data Web MCP 服务器。由于 Boomi 在云端运行,你必须连接到 Web MCP 的远程版本。

重要:Bright Data Web MCP 远程服务器已为企业就绪。它支持无限并发连接和高可扩展性,构建于一个拥有超过 4 亿 IP 的住宅代理网络之上。

这就是通过 Streamable HTTP 协议的 Bright Data Web MCP 远程连接 URL 的样子:

https://mcp.brightdata.com/mcp?token=<YOUR_BRIGHT_DATA_API_KEY>&pro=1

请记住,&pro=1 参数是可选的:

  • 使用 &pro=1:你可以访问完整的 70+ 工具套件和高级能力,但会产生使用费用。
  • 不使用 &pro=1:你只能访问 Rapid mode 中的免费工具(每月 5,000 次请求)。

如果你想要更细粒度的控制,例如仅启用特定工具或工具组,你可以直接从 Bright Data 控制面板生成自定义远程 MCP URL。

登录你的 Bright Data 账号,并导航到 “AI Gateways > MCP” 页面。按照设置向导配置你的 MCP 服务器访问权限。在流程结束时,你将获得一个自定义连接 URL,如下方截图所示:

注意已配置的 Web MCP 连接 URL

复制 “Streamable HTTP” 连接 URL,因为你很快就需要它来在 Boomi 中配置 Bright Data Web MCP 连接。太棒了!

第 3 步:在 Boomi 中添加 Web MCP Source

为了在 Boomi AgentStudio 中提供对 Web MCP 工具的访问,你首先需要定义一个新的 MCP source。为此,打开 agent 向导并点击左侧的 “Sources” 图标:

进入 “Sources” 页面

注意:不必担心离开向导。所有配置都会在你操作时自动保存。

在 “Sources” 页面,点击 “Create New Source”:

按下 “Create New Source” 按钮

选择 “Model Context Protocol (MCP)” 选项:

选择 “Model Context Protocol (MCP)” 选项

按如下方式填写表单:

  • Name: Bright Data Web MCP
  • Description: 一个 MCP 服务器,为 AI agents 提供对公共网页数据的实时访问
  • Transport Type: Streamable HTTP
  • URL: 粘贴之前获取的 Web MCP 远程 URL
  • Authentication: None
注意 Bright Data Web MCP 配置

然后,按下 “Test Connection” 按钮。如果一切设置正确,你应该会看到 “Successfully connected” 消息。接下来,点击 “Discover Tools” 以从远程 MCP 服务器加载工具。

如果你处于 Pro mode,你将看到全部 70+ 工具。否则,在 Rapid mode 中,你将只看到免费工具。无论哪种情况,选择所有可用工具并点击 “Continue” 以导入它们:

导入所有 Bright Data Web MCP 工具

注意:确保在所有页面中选择所有工具。否则,只会选择前 10 个。

最后,检查信息并点击 “Save”。Web MCP 现在将显示为一个 source:

注意 Bright Data Web MCP 条目

太棒了!Bright Daa Web MCP 工具现在可用于你所有 Boomi agents 的集成。

第 4 步:将 Web MCP 工具连接到你的 Agent

通过左侧菜单打开 “Agent” 页面,点击 agent 名称并选择 “Edit”,返回到你的 “Web Access Agent”。然后导航到 Tasks 选项卡并点击 “Add New Task”:

按下 “Add New Task” 选项

按如下方式填写任务详情:

  • Name: Web access
  • Description: 通过搜索、抓取、网页自动化以及直接网页数据馈送访问网页。
  • Instructions:
Use the Bright Data Web MCP tools whenever you need to perform web-related tasks, such as:
- Fetching, reading, or scraping web pages
- Searching the web
- Extracting structured data from supported platforms
- Running browser or web automation workflows
- Handling any task involving URLs, links, or conducting research, investigations, fact-checking, and news lookups

按下 “Add Task” 确认:

添加 “Web access” 任务

“Web access” 任务现在将出现在你的 agent 的 “Tasks” 部分。点击 “Manage Tools (0)” 按钮,将其连接到 Bright Data Web MCP 工具:

按下 “Manage Tools (0)” 按钮

点击 “Add New Tool”,然后选择相关的 Bright Data Web MCP 工具:

选择相关的 Bright Data Web MCP 工具

注意:一个 Boomi AI agent 最多支持 25 个工具,因此只选择对你的用例有用的工具。在此示例中,我们选择了用于通用搜索、抓取、发现和网页自动化的工具。

检查导入的工具,确认其权限和数据直通设置,然后点击 “Save”:

添加 Bright Data Web MCP 工具

Web MCP 工具现在已连接到该任务:

注意 “Web access” 任务中的 18 个工具

任务完成!按下 ”Save and Continue”,你现在已成功将 Bright Data 集成到你的 Boomi AI agent 中。

第 5 步:完成 Agent 定义

通过 “Guardrails” 部分完成 Boomi AI agent 向导设置。如果不需要,你可以将其留空。

然后进入 “Review” 选项卡,在那里你将看到你的 agent 的所有信息。确保一切正确,最后再按一次 “Save”:

检查 AI agent 并最后一次保存

太棒了!现在只剩下用一个网页相关任务来测试 AI agent。

第 6 步:测试 Agent

你的由 Bright Data 驱动的 Boomi AI agent 可以覆盖广泛的用例。假设 Nike 是你的竞争对手,而你想监控他们在做什么。

在 “Talk to your agent” 部分运行下面的提示词来测试你的 AI agent:

What are the latest news articles about Nike today? Search for the 3 most relevant news articles from trusted sources, access them, and provide a summary with original links to learn more.

这是你应该得到的结果:

你的 Boomi agent 生成的回复

如果你检查 agent 的 traces,你将看到导致该结果的工作流:

  1. AI agent 首先创建一个实现目标的计划。
  2. 它调用 Web MCP 的 search_engine 工具来搜索最新的 Nike 新闻。该工具返回表示实际 Google SERP 的结构化 JSON。
  3. 它分析 JSON 响应并选择三篇最相关的文章。
  4. 它使用 scrape_as_markdown 工具抓取这些文章(由 Bright Data 网络解锁器 API 提供支持)。
  5. 它将收集到的信息汇总成最终报告,并包含原始来源链接以供进一步阅读。

如果你检查 search_engine 工具调用,你会看到类似这样的内容:

注意该工具以 JSON 格式返回的 SERP

注意该工具返回的 JSON 结构化 SERP 响应,它在幕后连接到 Bright Data 搜索引擎 API

现在,假设你还想了解 Nike 最新的畅销产品信息。试试下面的提示词:

Now visit Nike’s Women’s Best Sellers page and return a report of the best-selling products of the month.

和之前一样,Boomi AI agent 将使用 Bright Data Web MCP 工具来完成任务:

提示词执行

请注意,生成的报告包含当前在 Nike 官方 “女士畅销榜” 页面上列出的相同产品:

目标 “女士畅销榜” 页面

该报告还包含定价信息以及 Nike 产品的直接链接。

重要:这些是标准 LLM 无法自行完成的任务,因为它们需要网页搜索、发现和抓取能力。得益于与 Bright Data Web MCP 的集成,该 agent 能够处理它们。

Et voilà!Boomi + Bright Data 集成运行得非常顺畅。这只是一个示例,所以请随意用更多其他网页相关场景来测试你的 AI agent。

结论

在这篇博客文章中,你了解了 Boomi 如何通过其无代码 AgentStudio 解决方案支持 AI agent 开发。特别是,你看到了如何以及为什么使用 Bright Data Web MCP 来扩展 Boomi AI agent。

此集成将 Boomi agents 提升到新的水平。它使它们能够搜索网页、发现并提取结构化数据,并实时与真实世界的网站交互。

立即创建一个免费的 Bright Data 账号,并开始集成我们为 AI 准备的网页数据工具!

支持支付宝等多种支付方式

Antonello Zanini

技术写作

5.5 years experience

Antonello是一名软件工程师,但他更喜欢称自己为技术传教士。通过写作传播知识是他的使命。

Expertise
Web 开发 网页抓取 AI 集成