技术栈

  • Bright Data SDK
  • OpenAI GPT
  • SendGrid
  • Python
  • Pydantic

功能特性

  • 自动化新闻发现:使用 Bright Data 的 SERP API 查找与你的品牌查询相关的 Google News 页面。
  • 智能内容提取:通过 Bright Data 的 Web Unlocker API 进行并行处理,实现大规模抓取新闻文章。
  • AI 驱动分析:借助 OpenAI GPT-5-mini 进行情感分析、洞察提取,并识别最相关的品牌监测新闻。
  • 智能内容筛选:自动选择与品牌声誉最相关的头部新闻文章。
  • 专业邮件报告:生成精美排版的 HTML 邮件报告,包含情感分析与可执行洞察。
  • 自动化投递:通过 SendGrid 将监测报告直接发送给相关干系人。
  • 可配置监测:通过 JSON 配置轻松自定义搜索查询与收件人列表。

工作原理

  1. 加载配置:从 config.json 读取监测设置
  2. 新闻发现:使用品牌查询搜索 Google SERP,找到 Google News 页面 URL
  3. 内容提取:并行抓取所有相关新闻页面并获取 Markdown 内容
  4. 内容筛选:AI 从抓取页面中识别最重要的新闻文章
  5. 逐篇抓取:抓取每篇被选中的新闻文章以获取详细内容
  6. 深度分析:对每篇文章进行情感分析与品牌洞察提取
  7. 生成报告:创建专业的 HTML 邮件报告
  8. 自动投递:通过邮件将报告发送给你的团队

前置要求


安装

  1. 克隆此仓库:
    git clone https://github.com/brightdata/brand-reputation-monitoring-workflow cd brand-reputation-monitoring-workflow
  2. 创建并激活虚拟环境:
    python -m venv .venv
    在 Linux/macOS 上,使用以下命令激活:
    source .venv/bin/activate
    在 Windows 上,运行:
    .venvScriptsactivate
  3. 安装依赖:
    pip install python-dotenv brightdata-sdk openai sendgrid pydantic
  4. 在项目根目录创建 .env 文件并写入你的 API keys:
    BRIGHT_DATA_API_TOKEN=your_bright_data_api_token OPENAI_API_KEY=your_openai_api_key SENDGRID_API_KEY=your_sendgrid_api_key

配置

在根目录创建 config.json 以自定义品牌监测工作流:

{
 "search_queries": [
 "your_brand news",
 "your_brand reviews",
 "your_brand controversy",
 "your_company announcement"
 ],
 "num_news": 5,
 "sender": "[email protected]",
 "recipients": [
 "[email protected]",
 "[email protected]",
 "[email protected]"
 ]
}

配置字段

  • search_queries:用于监测品牌的搜索词列表(支持多个查询)
  • num_news:需要深入分析的头部文章数量(默认:5
  • sender:发送报告的发件人邮箱(必须在 SendGrid 中完成验证)
  • recipients:接收监测报告的收件人邮箱列表

项目结构

brand-reputation-monitoring-workflow/
 .venv/
 .env
 config.json
 workflow.py

使用方法

运行品牌监测工作流:

python workflow.py

该工作流将会:

  1. 根据已配置的查询搜索 Google SERP,并提取 Google News URL
  2. 抓取 Google News 页面以获取所有可用的文章 URL
  3. 使用 AI 选择与品牌监测最相关的文章
  4. 抓取单篇新闻文章以获取详细内容
  5. 为每篇文章生成 AI 驱动洞察与情感分析
  6. 向团队发送专业的 HTML 报告

示例输出:

Retrieving Google News page URLs for the following search queries: nike, nike shoes
2 Google News page URL(s) retrieved!

Scraping content from each Google News page...
Google News pages scraped!

Extracting the most relevant news URLs...
5 news articles found:
- https://www.espn.com/wnba/story/_/id/46075454/caitlin-clark-becomes-nike-newest-signature-athlete
- https://wwd.com/footwear-news/sneaker-news/nike-acg-radical-airflow-ultrafly-release-dates-1238068936/
- https://www.runnersworld.com/news/a65881486/cooper-lutkenhaus-professional-contract-nike/
- https://hypebeast.com/2025/8/nike-kobe-3-protro-low-reveal-info
- https://wwd.com/footwear-news/sneaker-news/nike-air-diamond-turf-must-be-the-money-release-date-1238075256/

Scraping the selected news articles...
5 news articles scraped!

Analyzing each news for brand reputation monitoring...
News analysis complete!

Generating HTML email body...
HTML email body generated!

Sending the email with the brand reputation monitoring HTML report...
Email sent!

邮件报告功能

每份自动化报告包含:

  • 文章摘要:每条新闻 30 词的精炼摘要
  • 情感分析:正向/负向/中性情感分类,并带有颜色标签
  • 可执行洞察:3-5 条用于品牌声誉管理的关键要点(每条 10-12 词)
  • 直达链接:便于访问原始文章以进行更深入审阅
  • 专业排版:干净、响应式的 HTML 设计,适合直接发给干系人

高级配置

自定义搜索参数

可在 config.json 中修改搜索查询以适配不同监测场景,并配置发件人、收件人以及新闻条数。

定时自动化

使用 cron 定时任务进行自动监测:

# Run every Monday at 9 AM
0 9 * * 1 /usr/bin/python3 /path/to/your/project/workflow.py

自定义分析提示词

通过修改 process_news_list() 函数中的 system prompts 来微调 AI 分析,以获得更贴合行业的洞察。

下一步与增强

  • 增加记忆层:避免对同一文章重复分析
  • SendGrid 模板化:使用统一的邮件模板以标准化报告
  • 云存储:将报告归档到 S3 以便进行历史分析

API 集成详情

该工作流通过 Bright Data SDK 调用强大的 API:

  • Bright Data SERP API:用于从搜索结果中发现 Google News URL
  • Bright Data Web Unlocker API:用于并行提取内容,并输出适配 LLM 的 Markdown 格式
  • OpenAI GPT-5-mini:用于内容分析与 HTML 报告生成
  • SendGrid Email API:用于专业报告投递

故障排查与建议

  • API Keys:确保所有 API key 都已在 .env 文件中正确设置
  • 邮箱验证:发件人邮箱必须在 SendGrid 控制台完成验证
  • 搜索查询:使用更具体的品牌关键词及其变体,以获得更全面的监测
  • 内容质量:更具体的查询通常能带来更好的分析结果

常见问题:

  • 未找到新闻:尝试更宽泛的搜索查询,或检查你的品牌近期是否有报道
  • 邮件未送达:在 SendGrid 中验证发件人邮箱,并检查收件人的垃圾邮件箱
  • 分析质量:优化搜索查询以获取更相关的文章
  • 403 Forbidden 错误:确保发件人邮箱已在 SendGrid 账号中完成验证

使用场景

  • 危机管理:提前发现负面品牌提及
  • 竞争情报:监测竞品新闻与市场定位
  • 公关活动追踪:衡量营销活动的曝光与情感倾向
  • 产品发布监测:追踪新品发布后的反馈与口碑
  • 高管简报:为管理层提供定期品牌健康度报告

让你的品牌声誉始终快人一步!

基于 Bright Data 的 AI 基础设施 构建,用于获取实时网络数据解决方案。