Gemini CLI 与 Bright Data 的 Web MCP：分步指南

在本教程中，你将学习：

什么是 Gemini CLI，以及它为何在开发者社区中广受欢迎。
如何通过加入网页交互与数据提取能力把它提升到新水平。
如何将 Gemini CLI 连接到 Bright Data 的 Web MCP 服务器，以构建增强型 AI 编码代理。

让我们开始吧！

什么是 Gemini CLI？

Gemini CLI 是 Google 开发的一款 AI 代理，它将 Gemini 大语言模型的能力直接带到你的终端。该工具旨在提高开发者效率并简化各类任务，尤其是与编码相关的任务。

该开源库可通过 Node.js 包使用。撰文时，它已在 GitHub 收获超 6.7 万星标。尽管发布仅数月，社区热情与采用速度都非常亮眼。

具体来说，Gemini CLI 的特别之处在于：

直接在终端交互：可在命令行中直接与 Gemini 模型交互。
专注编码：帮助调试、生成新功能、提升测试覆盖率，甚至可根据提示或草图创建新应用。
工具集成与可扩展性：利用 ReAct（“推理并行动”）循环，并可集成内置工具（如 grep、terminal、文件读/写）以及外部 MCP 服务器。
免费使用：Google 提供了相当慷慨的免费层，使其更易获得。
多模态能力：支持从图片或草图中生成代码等任务。

为何要为 Gemini CLI 扩展网页交互与数据提取能力？

无论 Gemini CLI 集成的 Gemini 模型多么强大，它们仍然面临所有大语言模型共有的限制。

Gemini 模型只能基于其训练用的静态数据集进行回答。但那只是过去的快照！此外，LLM 无法像人类用户那样渲染或与实时网页交互，因此其准确性与行动范围天然受限。

现在，想象一下，为你的 Gemini CLI 编码助手赋予获取实时教程、文档页面与指南并从中学习的能力。再想象它可以像导航你的文件系统一样与任意在线网站互动。这将是一次能力上的飞跃，而通过集成 Bright Data Web MCP 服务器即可实现。

Bright Data Web MCP 服务器提供 60+ 款面向 AI 的工具，用于实时网页数据采集与网页交互。这些都由 Bright Data 丰富的 AI 数据基础设施驱动。

查看 Bright Data Web MCP 服务器所暴露工具的完整列表，请参阅文档。

将 Gemini CLI 与 Web MCP 结合，你可以做到：

检索搜索引擎结果页（SERP），自动为报告或文章插入上下文链接。
让 Gemini 抓取最新教程或文档，从中学习，然后相应地生成代码或项目模板。
从真实网站抓取数据并保存在本地，用于模拟、测试或分析。

下面通过一个实践示例来展示这种集成！

如何在 Gemini CLI 中集成 Web MCP 服务器

学习如何在本地安装和配置 Gemini CLI，并将其与 Bright Data 的 Web MCP 服务器集成。我们将用该环境来：

抓取一个亚马逊商品页面。
将数据保存在本地。
创建一个 Node.js 脚本来加载并处理这些数据。

按照以下步骤进行！

先决条件

要复现本教程的步骤，请确保你具备：

本地安装 Node.js 20+（推荐使用最新 LTS 版本）。
Gemini API 密钥或 Vertex AI API 密钥（这里我们使用 Gemini API 密钥）。
一个 Bright Data 账号。

现在暂时不需要配置 API 密钥。后续步骤会指导你在合适时机配置 Gemini 与 Bright Data 的 API 密钥。

虽然不是硬性要求，但以下背景知识会有所帮助：

对 MCP 工作原理的基本理解。
对 Bright Data Web MCP 服务器及其可用工具有一定了解。

步骤 1：安装 Gemini CLI

要开始使用 Gemini CLI，首先需要在 Google AI Studio 生成一个 API 密钥。按照官方说明获取你的 Gemini API 密钥。

注意：如果你已有或更倾向使用 Vertex AI API 密钥，请参考官方文档。

拿到 Gemini API 密钥后，打开终端，用以下 Bash 命令将其设置为环境变量：

export GEMINI_API_KEY="<YOUR_GEMINI_API_KEY>"

或在 Windows 的 PowerShell 中：

$env:GEMINI_API_KEY="<YOUR_GEMINI_API_KEY>"

将 <YOUR_GEMINI_API_KEY> 替换为你实际生成的密钥。

接着，通过官方的 @google/gemini-cli 包全局安装 Gemini CLI：

npm install -g @google/gemini-cli

在设置了 GEMINI_API_KEY（或 VERTEX_API_KEY）的同一终端会话中，启动 Gemini CLI：

gemini

你应能看到如下界面：

按下 Enter 选择选项 2（“Use Gemini API key”）。CLI 将自动检测你的 API 密钥并进入提示界面：

在 “Type your message or @path/to/file” 区域，你可以直接输入提示词，或引用一个文件交给 Gemini CLI 执行。

右下角你会注意到 Gemini CLI 正在使用 gemini-2.5-pro 模型。这是默认配置的模型。幸运的是，Gemini API 提供免费层，对 gemini-2.5-pro 模型每天最多 100 次请求，因此即使没有付费计划也能进行测试。

如果你希望使用限速更高的模型，例如 gemini-2.5-flash，可以在启动 CLI 前通过 GEMINI_MODEL 环境变量进行设置。在 Linux 或 macOS 上，执行：

export GEMINI_MODEL="gemini-2.5-flash"

在 Windows 上等效命令为：

$env:GEMINI_MODEL="gemini-2.5-flash"

然后照常用 gemini 命令启动 Gemini CLI。

很好！Gemini CLI 现已就绪。

步骤 2：开始使用 Bright Data Web MCP 服务器

如果你还没有账号，请先注册 Bright Data。已有账号则直接登录。

然后按照官方说明生成 Bright Data API 密钥。为简化起见，此步骤默认你使用的是具有管理员权限的令牌。

通过以下命令全局安装 Bright Data Web MCP 服务器：

npm install -g @brightdata/mcp

然后，用下面的 Bash 命令测试一切是否正常：

API_TOKEN="<YOUR_BRIGHT_DATA_API>" npx -y @brightdata/mcp

在 Windows 的 PowerShell 中等效命令为：

$env:API_TOKEN="<YOUR_BRIGHT_DATA_API>"; npx -y @brightdata/mcp

请务必将 <YOUR_BRIGHT_DATA_API> 占位符替换为你之前获取的实际 API 令牌。两条命令都会设置所需的 API_TOKEN 环境变量，并通过 @brightdata/mcp npm 包启动 MCP 服务器。

如果一切正常，你应该能看到如下日志：

首次启动时，MCP 服务器会在你的 Bright Data 账号中自动创建两个默认代理区域（zone）：

mcp_unlocker：用于 Web Unlocker。
mcp_browser：用于 Browser API。

这两个区域是启用 MCP 服务器全套工具所必需的。

要确认这些区域已创建，请登录 Bright Data 控制台并进入“Proxies & Scraping Infrastructure”页面。你应能看到两者都已列出：

MCP 服务器启动时创建的 mcp_unlocker 与 mcp_browser 区域

注意：如果你使用的 API 令牌不具备管理员权限，这些区域不会自动创建。在这种情况下，你需要手动创建它们，并通过环境变量指定它们的名称，具体请参见官方文档。

默认情况下，MCP 服务器仅暴露 search_engine 与 scrape_as_markdown 工具。若要解锁浏览器自动化与结构化数据提取等高级功能，请在启动 MCP 服务器前设置环境变量 PRO_MODE=true 以启用专业模式：

API_TOKEN="<YOUR_BRIGHT_DATA_API>" PRO_MODE="true" npx -y @brightdata/mcp

在 Windows 上：

$env:API_TOKEN="<YOUR_BRIGHT_DATA_API>"; $env:PRO_MODE="true"; npx -y @brightdata/mcp

太棒了！你已经在本机验证了 Bright Data Web MCP 服务器运行正常。现在可以结束该进程，因为接下来将配置由 Gemini CLI 来启动它。

步骤 3：在 Gemini CLI 中配置 Web MCP 服务器

Gemini CLI 支持通过配置文件集成 MCP。该文件位于 ~/.gemini/settings.json，其中 ~ 表示你的主目录；在 Windows 上为 $HOME/.gemini/settings.json。

你可以用 VS Code 打开该文件：

code "~/.gemini/settings.json"

或在 Windows 上：

code "$HOME/.gemini/settings.json"

注意：如果 settings.json 尚不存在，你可能需要手动创建。

在 settings.json 中，配置 Gemini CLI 以子进程方式自动启动 Bright Data Web MCP 服务器并连接到它。确保 settings.json 包含：

{
  "mcpServers": {
    "brightData": {
      "command": "npx",
      "args": [
        "-y",
        "@brightdata/mcp"
      ],
      "env": {
        "API_TOKEN": "<YOUR_BRIGHT_DATA_API_KEY>",
        "PRO_MODE": "true"
      }
    }
  }
}

上述配置中：

mcpServers 对象告诉 Gemini CLI 如何启动外部 MCP 服务器。
brightData 条目定义了运行 Bright Data Web MCP 服务器所需的命令和环境变量（启用 PRO_MODE 可选但推荐）。注意，这与之前你测试的命令完全一致，只是现在由 Gemini CLI 在后台自动执行。

重要：将 <YOUR_BRIGHT_DATA_API_KEY> 占位符替换为你的实际 Bright Data API 令牌，以完成认证。

添加 MCP 服务器配置后，保存文件。现在你已准备好在 Gemini CLI 内测试 MCP 集成！

步骤 4：验证 MCP 连接

如果 Gemini CLI 仍在运行，请使用 /quit 退出，然后重新启动。此时它应会自动连接到 Bright Data Web MCP 服务器。

要验证连接情况，请在 Gemini CLI 中输入 /mcp 命令：

然后选择 list 选项以查看已配置的 MCP 服务器与可用工具。按下 Enter，你应能看到类似如下的内容：

如你所见，Gemini CLI 已连接到 Bright Data Web MCP 服务器，并可访问其提供的 60+ 个工具。干得漂亮！

提示：在文档中探索其他所有Gemini CLI 命令。

步骤 5：在 Gemini CLI 中运行一个任务

要测试你的 Gemini CLI 设置的网页能力，可以使用如下提示词：

Scrape data from "https://www.amazon.com/AmazonBasics-Pound-Neoprene-Dumbbells-Weights/dp/B01LR5S6HK/" and store the resulting JSON data in a local data.json file. Then, create a Node.js index.js script to load and print its contents.

这代表一个真实世界用例，有助于为分析、API 模拟或测试收集实时数据。

将该提示词粘贴到 Gemini CLI 中：