在本指南中,我们将学习如何在 5 分钟内将 Bright Data 的 Web MCP 接入 ChatGPT Atlas,开始构建真正能够使用真实网页数据运行的 AI 工作流。
AI Agent 与网页数据的问题
AI Agent 在推理、写作、分析方面很强,但在获取最新网页数据方面却很糟糕。原因如下:
- 容易被封锁:大多数网站都有机器人检测。普通 AI 工具无法绕过 Cloudflare、验证码(CAPTCHA) 或 限流。
- 无法解析复杂网站:动态 JavaScript 应用、无限滚动、懒加载——这些都会让传统爬虫崩溃。
- 你被迫浪费时间在结构化上:你需要花数小时写代码提取商品价格或其他字段,而不是直接使用数据。
- 数据过时:ChatGPT 的训练数据有时间截断。没有实时访问能力,你的 Agent 就像在“摸黑行事”。
Bright Data 的 Web MCP 服务器解决了上述所有问题。它是被财富 500 强企业验证过的基础设施,被封装成一个简单的 MCP 连接器,可直接与 ChatGPT Atlas 无缝配合。
Bright Data Web MCP 有何不同?
1. 不再被封
基于 Bright Data 全球 住宅代理网络,覆盖 195+ 个国家/地区。你的请求看起来就像来自真实用户。适用于封锁 AWS、Google Cloud 等所有数据中心 IP 段的网站。
2. 预构建的 60+ 平台
与其自己花时间 爬 LinkedIn,为什么不用专用的提取器?亚马逊、Instagram、TikTok、Facebook、Google 地图、YouTube、Reddit、Zillow、Booking.com 等 50+ 平台都已支持。直接获得结构化 JSON,而不是凌乱的 HTML。
3. 完整浏览器自动化
不仅是 HTTP 请求,而是真实的 Chrome 浏览器,可以点击按钮、填写表单、滚动页面,并处理任何严重依赖 JavaScript 的网站。还能截屏、等待元素加载、抓取网络请求。
4. 免费起步
每月 5,000 次请求,永久免费。无需信用卡。足够用于严肃测试和日常使用。
5. 双模式系统
- Rapid 模式(免费):快速爬取、搜索结果、Markdown 转换
- Pro 模式:包含以上全部 + 60+ 平台提取器 + 完整浏览器自动化
大多数竞品 Web MCP 服务器只能给你其中一种模式。Bright Data 两种都给你。
在 ChatGPT Atlas 中设置 Bright Data MCP
你需要准备什么
- ChatGPT 账号(任意套餐均可)
- Bright Data 账号
- 2 分钟时间
配置步骤(真的很快)
步骤 1:获取你的凭证
注册 Bright Data 后,你会通过邮件收到一个 API Token。找不到?前往 账号设置 页面即可查看。格式类似:2dceb1aa0123456789abcdef
步骤 2:构建你的连接 URL
你的 Web MCP 服务器端点是:
https://mcp.brightdata.com/sse?token=YOUR_API_TOKEN
只需将 YOUR_API_TOKEN 替换为你的实际 Token。
想要高级功能(平台提取器 + 浏览器自动化)?在后面加上 &pro=1:
https://mcp.brightdata.com/sse?token=YOUR_API_TOKEN&pro=1
步骤 3:在 ChatGPT 中接入
- 打开 ChatGPT 设置(点击你的头像)
- 进入 Apps and connectors → Advanced settings
- 打开 Developer mode
- 点击 Create(创建新连接器)
- 填写以下内容:
- Name:如 “Bright Data”(或任意名称)
- Description:”Real-time web data and scraping infrastructure”(实时网页数据与采集基础设施)
- URL:粘贴你在步骤 2 中生成的端点
- 点击 Create 并授权连接
步骤 4:打开 Atlas 并测试
在 ChatGPT 中点击 Atlas 浏览器图标。试试这个:
“Search Google for ‘best mechanical keyboards 2026’ and show me the top 5 results with prices”
你会看到 ChatGPT 使用 Bright Data 获取实时搜索结果并提取数据。没有封锁,没有报错,只有结果。
你现在就能构建的真实工作流
工作流 1:竞品情报看板
场景:你需要跟踪竞争对手在亚马逊、eBay 和沃尔玛上的定价。
提示词:
Monitor these product URLs for price changes:
- [Amazon URL]
- [eBay URL]
- [Walmart URL]
Check them daily and alert me if prices drop by 10% or more.
发生了什么:ChatGPT 使用 web_data_amazon_product、web_data_ebay_product 和 web_data_walmart_product 提取当前价格。无需自己解析 HTML,也不用担心网站一更新选择器就失效。
工作流 2:LinkedIn 潜在客户挖掘
场景:你需要寻找金融科技领域 A 轮创业公司的决策者。
提示词:
Find companies on LinkedIn matching:
- Industry: Financial Services
- Funding: Series A
- Location: San Francisco
For each company, extract:
- Company name and employee count
- Recent job postings (especially C-level roles)
- Employee profiles for founders and VPs
发生了什么:ChatGPT 串联使用 web_data_linkedin_company_profile、web_data_linkedin_job_listings 和 web_data_linkedin_people_search 来构建你的线索列表,并自动将数据整理成表格/表单格式。
工作流 3:社交媒体情绪分析
场景:你在发布一款新产品,希望跟踪社交媒体上的讨论热度。
提示词:
Search X (Twitter) and Reddit for mentions of "ProductName" in the last 24 hours.
Extract post content, engagement metrics, and sentiment.
Create a summary report.
发生了什么:ChatGPT 使用 web_data_x_posts 和 web_data_reddit_posts 收集相关提及,再利用其内置推理能力进行情感分析,最后在同一流程中生成总结报告。
工作流 4:动态表单自动填报
场景:你需要向某个需要登录和多步表单的网页门户提交数据。
提示词:
Go to [portal URL], log in with [credentials], navigate to the submission form,
fill in these fields: [data], and submit. Take screenshots at each step.
发生了什么:ChatGPT 使用 scraping_browser_* 系列工具:
scraping_browser_navigate打开网站scraping_browser_type_ref填写登录表单scraping_browser_click_ref点击各个步骤scraping_browser_screenshot在每一步截屏记录流程
无需 Selenium 脚本,无需 Puppeteer 代码,只要自然语言。
理解底层在做什么
当你连接 Bright Data MCP 时,你将获得 60+ 个专用工具,分为三大类:
通用网页采集(Rapid 模式 – 免费)
search_engine– Google、Bing、Yandex 搜索结果scrape_as_markdown– 任意网页 → 干净文本scrape_as_html– 具备解封能力的原始 HTMLscrape_batch– 一次最多抓取 10 个 URLsearch_engine_batch– 并行运行最多 10 个搜索extract– 任意页面的 AI 驱动数据提取session_stats– 跟踪你的工具使用情况
平台专用提取器(Pro 模式)
49 个针对特定平台的工具,包括:
- 电商:亚马逊(商品、评论、搜索)、eBay、沃尔玛(商品、卖家)、Best Buy、Etsy、Zara、Home Depot 等
- 社交媒体:Instagram(主页、帖子、Reels、评论)、TikTok(主页、视频、店铺、评论)、Facebook(帖子、Marketplace、评论、活动)、X/Twitter、Reddit、YouTube(视频、频道、评论)
- 职场网络:LinkedIn(个人资料、公司主页、职位列表、帖子、人员搜索)
- 房产:Zillow 房源列表
- 旅行:Booking.com 酒店、Google 地图评论
- 商业数据:Crunchbase 公司、ZoomInfo 资料、雅虎财经
- 应用商店:Google Play 商店、Apple App Store
- 比价/购物:Google Shopping
- 新闻:路透社文章
- 开发者工具:GitHub 仓库文件
浏览器自动化(Pro 模式)
13 个强大的自动化工具:
- 页面导航(前进/后退)
- 按引用点击元素
- 填写表单、输入文本
- 截屏(整页或视口)
- 滚动页面并等待元素加载
- 监控网络请求
- 提取页面 HTML 或文本
- 捕获 ARIA 快照以辅助无障碍分析
每个工具都在 docs.brightdata.com/mcp-server/tools 中提供示例文档。
成本与限制:你实际要付什么
免费层(Rapid 模式)
- 5,000 次请求/月——每月重置
- 仅包含通用爬取工具(7 个工具)
- 非常适合:研究、内容收集、搜索引擎结果分析
- 无需信用卡
Pro 模式
- 在免费层用完后按量计费
- 可使用全部 60+ 平台提取器与浏览器自动化
- 不同工具价格不同(通常每次请求 $0.001–$0.01)
- 可在 你的控制面板 中监控用量
使用建议:先从 Rapid 模式开始。只有在需要平台提取器或浏览器自动化时再升级到 Pro。大多数用例在免费层就足够。
调试与监控
通过 MCP 连接发生的一切都会记录在你的 Bright Data 控制面板中:
你可以看到:
- 实时请求日志(URL、状态码、响应时间)
- 工具使用拆分(哪些工具被调用最多)
- 错误跟踪(被封请求、超时、API 错误)
- 成本跟踪(你花了多少钱)
- 限流监控
常见问题:
- “Tool not found” → 你在 Rapid 模式下调用了 Pro 工具。请在 URL 中添加
&pro=1。 - “Rate limit exceeded” → 你已达到每月配额。请升级套餐或等待下月重置。
- “Invalid token” → 请在 设置 中检查你的 API Token 是否正确。
更进一步
在掌握基础用法之后,可以继续探索以下资源:
- GitHub 仓库——源代码、Issue、社区贡献
- 在线 Playground——无需写代码即可测试工具
- 社区示例——其他开发者的真实项目
- 其他 MCP 客户端——在 Claude、Cursor、VS Code、LangChain、n8n 等中使用 Bright Data
为什么这很重要
我们正进入一个新的时代,AI Agent 不只是“聊天”,而是开始真正做事。而“做事”离不开对真实世界数据的访问,而绝大多数数据都在网页上。
Bright Data 的 Web MCP 服务器是这一标准最强大的实现之一,因为它不仅仅是把 AI 接上网络,而是移除了阻碍自动化的所有障碍:封锁、验证码、限流、复杂站点结构、动态内容等。
结果就是:AI 工作流不仅能在 Demo 里运行,更能在生产环境中稳定运行。
准备好开始了吗? 注册 Bright Data,获取你的 API Token,然后接入 ChatGPT Atlas。前 5,000 次请求由我们买单。