AI

通过 Bright Data Web MCP 扩展 Cursor AI 能力

通过在 IDE 中集成 Bright Data Web MCP,为 Cursor 的 AI 引入实时网页数据与高级编码工具。
3 分钟阅读
Cursor AI × Bright Data 的 MCP 集成

在本教程中,你将学到:

  1. 什么是 Cursor,以及它为何如此受欢迎。
  2. 为何要为 Cursor 添加像 Bright Data 这样的「改变游戏规则」的 MCP 服务器。
  3. 如何将 Cursor 连接到 Bright Data Web MCP。
  4. 如何在 Visual Studio Code 中实现同样的效果。

开始吧!

什么是 Cursor?

Cursor 是基于 Visual Studio Code 分叉而来的 AI 驱动代码编辑器。与任何文本编辑器一样,它的核心功能是提供编写代码的界面。但它的特别之处在于深度内置了 AI 集成。

Cursor 不只是基础的自动补全,它使用 LLMs 理解你的整个代码库与上下文,从而提供智能特性,例如:

  • 对话式提示:用自然语言描述你的需求,Cursor 会为你编写或编辑代码。
  • 多行自动补全:不仅补全单行,还能建议并完成整段代码块。
  • AI 驱动的重构:基于项目全局上下文,智能优化、清理并修复你的代码。
  • 调试协助:请 AI 查找并解释代码中的错误。

Cursor 将标准代码编辑器变成一个主动、智能的结对程序员。它支持来自多家供应商的多种 LLM,并内置了通过 MCP 使用工具的支持

为什么要将 Bright Data 的 Web MCP 添加到 Cursor

在幕后,Cursor 依赖已知的 LLM 模型。尽管其集成比大多数工具更深入、更完善,但它仍然面临与任何 LLM 相同的核心限制:AI 的知识是静态的!

毕竟,AI 训练数据只是在某个时间点的快照。尤其在软件开发这类快速演进的领域,它很快就会过时。现在,想象一下,让Cursor 的 AI agent具备以下能力:

  • RAG 工作流拉取最新的教程与文档,
  • 在编写代码时参考实时指南,
  • 像浏览本地文件一样轻松浏览实时网站。

这正是将 Cursor 连接到Bright Data 的 Web MCP后所解锁的能力!

Web MCP 提供对60+ 个面向 AI 的工具的访问,这些工具为实时网页交互与数据采集而构建,且由强大的 Bright Data AI 基础设施驱动。

即使在免费层,你的 Cursor agent 也能使用两个强大工具:

工具 描述
search_engine 以 JSON 或 Markdown 形式从 Google、Bing 或 Yandex 获取搜索结果。
scrape_as_markdown 将任意网页抓取为干净的 Markdown 格式,绕过机器人检测和 CAPTCHA。

除此之外,Web MCP 还包含用于云端浏览器自动化,以及从 Amazon、YouTube、LinkedIn、TikTok、Google 地图等平台提取结构化数据的工具。

以下是将 Cursor 与 Bright Data 的 Web MCP 扩展后能实现的部分示例:

  1. 获取最新的 API 参考或框架教程,然后自动生成可运行的代码或项目脚手架。
  2. 即时抓取最新搜索引擎结果,并将其嵌入文档或代码注释。
  3. 采集实时网页数据,生成逼真的测试 mock、分析仪表盘或自动化内容管线。

想要了解完整能力范围,请查阅 Bright Data MCP 文档

如何将 Web MCP 集成到 Cursor,增强 AI 编码体验

本节将逐步演示如何将本地运行的 Bright Data Web MCP 服务器实例连接到 Cursor。完成后,你将在 IDE 内直接使用 60+ 个工具,获得超强 AI 体验。

我们将使用 Web MCP 工具创建一个 Express 后端,构建一个返回来自 Amazon 的真实世界数据的模拟 API。这只是该集成所支持的众多用例之一。

按以下步骤操作!

前置条件

要跟随本教程,请确保你具备:

  • 一个 Cursor 账户(免费计划即可)。
  • 一个拥有有效 API Key 的 Bright Data 账户。

现在无需着急完成 Bright Data 的设置。阅读过程中会一步步引导你!

MCP 的工作方式、Cursor 的运行机制以及 Web MCP 提供的工具有基本了解会有所帮助。

步骤一:开始使用 Cursor

安装适用于你操作系统的Cursor 版本,打开并登录你的账户。
若是首次启动,请完成引导向导。

你将看到类似这样的界面:

Cursor 界面

很好!现在打开你的项目文件夹,准备使用集成了 Web MCP 的内置 AI 编码助手。

步骤二:配置你的 LLM

撰写本文时,Cursor 默认使用 Claude 4.5 模型(通过“Auto” 模式)。如果你不介意,直接跳到下一节即可。请记住,Claude 也可以与 Web MCP 集成

若要更改默认模型,搜索“cursor settings”,并选择对应选项:

选择 “Cursor Settings” 选项

在打开的标签页中,切换到 “Models” 选项卡:

切换到 “Models” 选项卡

在这里,你可以配置 Cursor 的 AI agent 应使用哪种 LLM。请注意,免费用户作为高级模型只能在 GPT-4.1 和 “Auto” 之间选择。

要切换到 GPT‑4.1,搜索 “gpt”,找到 “gpt-4.1” 模型并启用:

启用 “gpt-4.1” 选项

如果你拥有 Pro 或 Business 订阅,可以启用其他任一受支持的 LLM。此外,你还可以为所选提供商提供自己的 API Key。

接着,打开右侧的 “New Chat” 面板。点击 “Auto” 下拉开关,将其关闭,并选择 “gpt-4.1”:

关闭 “Auto” 模型并选择 “gpt-4.1”

很好!Cursor 现在已通过你配置的 LLM 运行。

步骤三:在本机测试 Bright Data 的 Web MCP

在将 Cursor 连接到 Bright Data Web MCP 之前,先确认你可以在本地运行该服务器。因为 MCP 服务器将通过 STDIO 配置。

首先注册 Bright Data。如果你已有账户,直接登录即可。快速设置可按照控制台中 “MCP” 部分的指引:

Bright Data 账户中的 “MCP” 区域

想要更多引导,请参阅下方步骤。

首先生成你的 Bright Data API Key 并妥善保存。下一步会用到。我们假定你的 API Key 拥有 Admin 权限,以便简化 Web MCP 集成。

现在,通过以下 npm 命令在你的机器上全局安装 Web MCP:

npm install -g @brightdata/mcp

通过启动它来验证 MCP 服务器是否正常工作:

API_TOKEN="<YOUR_BRIGHT_DATA_API_KEY>" npx -y @brightdata/mcp

或在 PowerShell 中等效地:

$Env:API_TOKEN="<YOUR_BRIGHT_DATA_API_KEY>"; npx -y @brightdata/mcp

<YOUR_BRIGHT_DATA_API> 占位符替换为你的 Bright Data API Token。上述命令会设置必需的 API_TOKEN 环境变量,并通过 @brightdata/mcp 包在本地启动 Web MCP。

如果成功,你会看到类似如下输出:

Bright Data Web MCP 的启动日志

首次启动时,Web MCP 会在你的 Bright Data 账户中创建两个默认的 Zone:

  • mcp_unlocker:用于 Web Unlocker
  • mcp_browser:用于 Browser API
    Web MCP 依赖这两项 Bright Data 服务来驱动其 60+ 个工具。

如果你想检查这些 Zone 是否已设置,请访问 Bright Data 账户中的 “Proxies & Scraping Infrastructure” 页面。你应能在表格中看到这两个 Zone:

Web MCP 启动时创建的 mcp_unlocker 与 mcp_browser 区域

注意:如果你的 API Token 没有 Admin 权限,这两个 Zone 将不会自动创建。此时请手动创建,并按照 GitHub 文档所述通过环境变量进行设置。

请记住,在免费层,Web MCP 仅开放 search_enginescrape_as_markdown(及其批量版本)。若要解锁其他工具,请启用 Pro 模式 **通过设置 PRO_MODE="true" 环境变量:

API_TOKEN="<YOUR_BRIGHT_DATA_API>" PRO_MODE="true" npx -y @brightdata/mcp

或在 Windows 上:

$Env:API_TOKEN="<YOUR_BRIGHT_DATA_API>"; $Env:PRO_MODE="true"; npx -y @brightdata/mcp

Pro 模式将解锁全部 60+ 个工具,但不包含在免费层中,也就是说会产生额外费用

太棒了!你刚刚确认了 Web MCP 服务器在本地可以正常工作。结束该 MCP 进程,因为接下来将配置由 Cursor 来启动并连接它。

步骤四:在 Cursor 中配置 Web MCP

先搜索 “>mcp”,并选择 “View: Open MCP Settings” 选项:

选择 “View: Open MCP Settings” 选项

在 “Tools & MCP” 区域,点击 “Add Custom MCP” 按钮:

点击 “Add Custom MCP” 按钮

这将打开如下的 mcp.json 配置文件:

mcp.json 的默认配置

如你所见,默认是空的。针对 Bright Data 的 Web MCP,按如下填写:

{
  "mcpServers": {
    "Bright Data": {
      "command": "npx",
      "args": ["-y", "@brightdata/mcp"],
      "env": {
        "API_TOKEN": "<YOUR_BRIGHT_DATA_API_KEY>",
        "PRO_MODE": "true"
      }
    }
  }
}

然后使用 Ctrl + S(macOS 为 Cmd + S)保存:

Cursor 中填写完成的 mcp.json 配置

上述配置等同于我们先前测试的 npx 命令,通过环境变量传入凭据与设置:

  • API_TOKEN 为必填。设为你之前生成的 Bright Data API Key。
  • PRO_MODE 为可选。如果不打算启用 Pro 模式可移除。

换言之,Cursor 会根据 mcp.json 的配置执行之前的 npx 命令:在本地运行一个 Web MCP 进程、连接它并获取所暴露的工具。

关闭 mcp.json 标签页,至此 Cursor + Bright Data Web MCP 集成完成!

注意:若你不想使用 STDIO,而是想用 SSE 或可流式的 HTTP,请注意 Bright Data 的 Web MCP 也提供远程服务器选项。

步骤五:验证 MCP 集成的工具可用性

现在检查 Cursor 是否已成功连接到 Web MCP 服务器并能访问其所有工具。

返回 “Cursor Settings” 标签页中的 “Tools & MCP” 区域。你现在应能看到已配置的 “Bright Data” 选项,并列出所有可用工具:

“Tools” 区域中的 “Bright Data” MCP 选项

展开 “N tools enabled”(其中 N 为已启用工具的数量)下拉菜单,查看全部可用工具:

Web MCP 暴露并在 Cursor 中可用的工具

注意,Cursor 会自动连接到服务器并获取其 60+ 个工具。
如果未启用 Pro 模式,你只会看到 4/5 个免费工具。在此也可根据需要启用或禁用工具。默认均为启用状态。

确认无误后,关闭 “Cursor Settings” 标签页。准备好利用这些工具,获得更强大的 AI 编码体验!

步骤六:运行一个由增强型 AI 编码助手驱动的任务

为了测试你在 Cursor 中的编码助手能力,你需要一个能运用新配置的网页数据获取能力的提示词。

例如,你正在为电商应用构建一个 Express.js 后端,想要模拟一个返回 Amazon 商品真实数据的 API。

使用如下提示词即可实现:

Scrape the data from the following Amazon products:
1. https://www.amazon.com/Clean-Skin-Club-Disposable-Sensitive/dp/B07PBXXNCY/
2. https://www.amazon.com/Neutrogena-Cleansing-Towelettes-Waterproof-Alcohol-Free/dp/B00U2VQZDS/
3. https://www.amazon.com/Medicube-Zero-Pore-Pads-Dual-Textured/dp/B09V7Z4TJG/

Then, save the scraped data to a local JSON file. Next, create a simple Express.js project with an endpoint that accepts an ASIN (representing an Amazon product) and returns the corresponding data read from the JSON file.

假设你处于 Pro 模式。在 Cursor 中执行上述提示词。

随后会发生如下步骤:

  1. Cursor 中配置的 LLM 识别到 web_data_amazon_product 是用于获取 Amazon 商品数据的工具。
  2. 对于提示中三个 Amazon 商品中的每一个,系统会请求你授权运行 web_data_amazon_product 以抓取数据。
  3. 你为每次调用授予权限,从而触发异步数据采集任务(其底层调用 Bright Data Amazon Scraper)。
  4. 每个商品的返回数据会以 JSON 格式展示。
  5. GPT‑4.1 处理获取到的数据,并将其写入 products.json 文件。
  6. Cursor 创建 npm 项目结构,定义 package.json 与包含 Express 服务逻辑的 index.js
  7. 系统会请求你授权通过 npm install 安装项目依赖。完成后会生成 package.jsonnode_modules/ 文件夹。
  8. 系统会请求你授权通过 npm start 运行服务器。

注意:即使提示词未明确要求,GPT‑4.1 也会请求安装依赖并启动服务器。这是一个很贴心的补充!

在本例中,最终生成的项目结构如下:

your-project/
├── node_modules/
├── index.js
├── package.json
├── package-lock.json
└── products.json

完美!让我们检查一下结果是否达到了预期目标。

步骤七:查看产出的项目

AI 编码助手生成文件的同时,它们会出现在 Cursor 左侧的文件栏中。

声明:你的文件可能与下图有所不同,因为不同的 AI 运行可能会生成不同的结果。

首先查看 products.json 文件:

products.json 文件

可以看到,它包含了 web_data_amazon_product 工具返回的抓取数据的简化版本:

一次 web_data_amazon_product 工具调用的输出示例

重要web_data_amazon_product 实际上会返回该 Amazon 页面上的所有商品数据,而不只是少数字段。不过,AI 选择只保留最相关的字段。通过优化提示词,你也可以指示 AI 包含全部字段。

接着打开 index.js,查看 Express.js 服务器逻辑:

index.js 文件

其中,获取商品数据的模拟端点路径为 /product/:asin

继续检查其他文件,通常都没有问题。点击 “Keep All” 按钮确认 AI 生成的输出,准备开始测试你的项目!

步骤八:测试生成的项目

你的 Express.js 应用应该已经在运行,因为 GPT‑4.1 已请求通过 npm start 启动。如果还未运行,可手动执行:

npm start

你的 Express.js 后端现在应在 http://localhost 运行。

接下来运行以下cURL 命令,测试 GET /product/:asin 端点:

curl "http://localhost/ product/B07PBXXNCY

其中 B07PBXXNCY 是提示词中某个 Amazon 商品的 ASIN。

你应能看到如下所示的结果:

API 返回的输出示例

太好了!数据已正确写入生成的 products.json 文件。该结果对应于原 Amazon 页面数据的(简化版)。

如果你曾尝试抓取 Amazon 的商品数据,就会知道由于其著名的CAPTCHA 与其他反爬策略,这并不容易。显然,单靠普通的 GPT‑4.1 无法即时从 Amazon 获取数据。

这正体现了将 Web MCP 与 Cursor 结合的威力。当然,上面的示例非常基础。不过借助 60+ 个可用工具与合适的提示词,你可以直接在 IDE 中处理更复杂的场景

搞定!借助 Cursor + Bright Data Web MCP 集成,我们成功创建了一个带有模拟 API 端点的 Express 后端。

【额外】在 Visual Studio Code 中的替代方案

如果你希望在 Visual Studio Code 中实现类似 Cursor 的体验,可以使用 ClineRoo Code 等扩展。

特别是,关于在 VS Code 中集成 Web MCP,可参考以下指南:

结论

本文介绍了如何在 Cursor 中充分利用 MCP 集成。IDE 内置的 AI 编码助手本已十分好用,但连接 Bright Data 的 Web MCP 后,它会变得更加强大、更加机敏。

该集成让 Cursor 能够执行实时网页搜索、提取结构化数据、消费动态数据源,甚至自动化浏览器交互——这一切都在你的编码环境中完成。

若想构建更高级的 AI 工作流,请探索 Bright Data 的 AI 生态中提供的全套服务与数据方案。

立即创建一个免费的 Bright Data 账户,开始体验我们的面向 AI 的网页数据工具吧!

支持支付宝等多种支付方式

Antonello Zanini

技术写作

5.5 years experience

Antonello是一名软件工程师,但他更喜欢称自己为技术传教士。通过写作传播知识是他的使命。

Expertise
Web 开发 网页抓取 AI 集成