- 超过 3.5M 条记录可用
- 100% 合规且符合道德规范的数据采集
- 免费 GitHub 数据示例可供下载
- 起始价格为 $250/100K 条记录
全球 超20000 位客户信赖
可用的 GitHub 及相关数据集
- JSON/CSV 格式的演示数据
- 最新记录
- 自定义、丰富并格式化数据
LinkedIn people profiles
Amazon products
LinkedIn company information
Instagram - Profiles
Crunchbase companies information
Linkedin job listings information
Zillow properties listing information
Instagram - Posts
LinkedIn posts
X (formerly Twitter) - Posts
Google Maps full information
TikTok - Profiles
Facebook - Pages Posts by Profile URL
Youtube - Videos posts
Amazon Reviews
TikTok - Posts
Indeed job listings information
Shopee - products
Walmart - products
Companies information enriched dataset
Employees business enriched dataset
TikTok Shop
YouTube - Profiles
Glassdoor companies overview information
IMDB media
Airbnb Properties Information
X (formerly Twitter) - Profiles
Google News
Yahoo Finance business information
Google maps reviews
Reddit- Posts
Instagram - Reels
Booking Hotel Listings
Shein- Products
Yelp businesses overview
LinkedIn profiles Jobs Listings
Instagram - Comments
Facebook - Comments
Glassdoor companies reviews
Zoominfo companies information
pitchbook companies information
Glassdoor job listings information
Otodom Poland
Google Shopping
Amazon products global dataset
Amazon sellers info
eBay
G2 software product overview
Github repository
Amazon best seller products
Facebook - Posts by group URL
Australia real estate properties
Home Depot US
Facebook Marketplace
Facebook - Posts by post URL
TikTok - Comments
Google Play Store
Trustpilot business reviews
Etsy
G2 software - product reviews
Amazon products search
Booking Listings Search
Goodreads books
Yelp businesses reviews
Reddit - Comments
Amazon Walmart
Zara - Products
Zillow price history
World population
Indeed companies info
Zoopla properties listing information
Target
Wikipedia articles
Lazada - Products
Pinterest - Posts
Youtube - Comments
NBA players' stats
Best Buy products
Walmart sellers info
Ikea - Products
Facebook Events
Realtor international properties listings
Sephora products
OLX Brazil - marketplace ads
Lowes.com
BBC news
Ozon.ru products
Facebook - Profiles
Facebook - Reels by profile URL
Google Play Store reviews
Xing social network
Myntra products
Facebook Company Reviews
Google Shopping products search US
Creative Commons Images
Owler companies information
H&M - Products
Slintel 6sense company information
Wayfair products
Naver products
Webmotors Brasil - Cars Listings
US lawyers directory
Tokopedia Products
Apple App Store reviews
CNN news
Manta businesses
Digikey - Products
Agoda Properties Listings
Wildberries.ru products
Mouser - Products
Zonaprop Argentina - Properties Listing
Quora posts
Carsales Cars Listings search page information
Pinterest - Profiles
Chileautos Chile - Cars Listings
VentureRadar company information
Facebook - Pages and Profiles
Zalando products
Inmuebles24 Mexico - Properties Listings
carsales.com.au - Cars Listings
Yapo Chile - marketplace ads
Asos - Products
Trustradius product reviews
Lazada - Reviews
Hermes- Products
Vimeo - Videos posts
Bluesky - Posts
Lego - Products
World zipcodes
Metrocuadrado - Properties Listings
Chanel Products
Home Depot CA
Lazada products search (GMV)
Toctoc - Properties Listings
Dior - Products
Top 500 Bluesky Profiles
Apple App Store
Creative Commons 3D Models
Ashleyfurniture - Products
AE.com - Complete Products
Properati Argentina and Colombia - Properties Listings
Infocasas Uruguay - Properties Listings
Mango Products
Balenciaga.com - Products
mercadolivre.com.br products
Mediamarkt.de products
Fanatics.com - Products
Toysrus - Products
Carters.com - Products
Twitch - streams dataset
Zara Home Products
Loewe.com - Products
Kroger.com
Rona.ca products
Prada.com - Products
Crateandbarrel - Products
ChatGPT Search
Ysl.com - Products
Delvaux - Products
Fendi Products
Massimo Dutti - Products
Bottegaveneta.com - Products
Mattressfirm - Products
Raymourflanigan.com - Products
llbean.com - Products
Sleepnumber.com - Products
Celine.com - Products
Mybobs.com - Products
La-z-boy.com - Products
Berluti.com - Products
Montblanc - Products
Moynat.com - Products
Walmart - products zipcodes
Google SERP - 100 Results
Google AI Mode Search
Threads - Posts
Zillow Full Properties Information
Agoda Listings Search
Threads - Profiles
Gemini Search
Perplexity Search
LinkedIn people search
Grok Search
Zillow properties search page
Walmart products search
Falabella.com
Bing Copilot Search
Snapchat posts
Goodreads reviews
TikTok - Posts by URL Fast API
Snapchat profile
Agoda Properties Listings with Pricing
TikTok - Posts by Search URL Fast API
TikTok - Posts by Profile Fast API
Coupang products
TikTok Shop Category Products
Booking Hotel Listings with Pricing
Google Hotel
Reddit - Profiles
通过战略性成本节约最大化价值
智能数据更新
仅访问“新记录”或“已更新记录”,确保您只为真正需要的内容付费
数据集捆绑包
通过一次购买两个或更多数据集并享受专属折扣,获取更高价值。
批量折扣
在购买大型数据集或更新订阅时享受大幅优惠,用更少的投入获取更多数据
富化数据集
使用预构建的数据集,将多个来源整合为一个干净的数据集,为您节省时间和资源
数据集定价
- 干净并已验证
- 每月更新
- JSON/CSV/Parquet
即时增强 AI Agent 能力
我们的 GitHub 数据集已针对 AI/LLM 进行优化:结构清晰、文档完善,并提供代码和示例,便于 LLM/聊天机器人集成。
结构化且干净
预处理数据,具有一致的模式,非常适合 AI 模型训练和推理。
代码示例
提供可直接使用的 Python、Node.js、cURL、PHP、Go、Java 和 Ruby 代码片段,轻松集成到 AI 工作流中。
文档资料
curl --request GET
--url https://api.brightdata.com/datasets/snapshots/{id}/download
--header 'Authorization: Bearer '
import requests
url = "https://api.brightdata.com/datasets/snapshots/{id}/download"
headers = {"Authorization": "Bearer "}
response = requests.get(url, headers=headers)
print(response.json())
const url = 'https://api.brightdata.com/datasets/snapshots/{id}/download';
const options = {method: 'GET', headers: {Authorization: 'Bearer '}, body: undefined};
try {
const response = await fetch(url, options);
const data = await response.json();
console.log(data);
} catch (error) {
console.error(error);
}
HttpResponse response = Unirest.get("https://api.brightdata.com/datasets/snapshots/{id}/download")
.header("Authorization", "Bearer ")
.asString();
require 'uri'
require 'net/http'
url = URI("https://api.brightdata.com/datasets/snapshots/{id}/download")
http = Net::HTTP.new(url.host, url.port)
http.use_ssl = true
request = Net::HTTP::Get.new(url)
request["Authorization"] = 'Bearer '
response = http.request(request)
puts response.read_body
GitHub 数据集定制
数据订阅
订阅即可以大幅降低的成本访问数据集。
文件输出格式
JSON、NDJSON、JSON Lines、CSV、Parquet。可选.gz压缩格式。
灵活交付
Snowflake、Amazon S3存储桶、Google Cloud、Azure和SFTP。
可扩展数据
扩展过程无需担心基础架构、代理服务器或屏蔽问题。
节省成本
使用筛选条件和格式选项来自定义任何数据集。
代码维护
数据集根据网站结构的变化进行维护。
简化集成
受益于与Snowflake和AWS的集成。
全天候支持
由数据专业人员组成的专属团队随时提供帮助。
数据质量保证
数据获取方式合乎道德,符合所有隐私法律。
获取结构化且可靠的 GitHub 数据
我们将提供数据 ,而您则专注于其余部分
大量网络数据
凭借我们的解封功能和全天候的IP轮换,我们可以确保访问网站上的所有数据点。
数据可供立即使用
作为我们强大的数据验证流程的一部分,数据收集过程的各个方面都经过了彻底验证。
自动数据流
创建自定义计划,进而自动传输数据,并监视数据无缝流入您的存储装置。
企业如何使用 GitHub 数据集
GitHub 数据集常见问题
我可以为已购买的 GitHub 数据集获取更新吗?
可以,你可以按每日、每周、每月或自定义频率来获取 GitHub 数据集的更新。
我可以只购买 GitHub 数据集的一个子集吗?
可以,你可以购买只包含所需数据点的 GitHub 子集。通过购买子集,可以大幅降低成本。
我会以什么格式收到 GitHub 数据集?
数据集格式包括 JSON、NDJSON、JSON Lines、CSV 或 Parquet。文件也可选压缩为 .gz。
我可以获取数据示例吗?
可以,你可以申请数据示例,以评估所提供信息的质量和相关性。这是确保数据在购买完整数据集前满足你需求的好方式。
我可以请求 GitHub 数据集中的特定数据点吗?
可以,你可以根据自身的独特需求,指定 GitHub 数据集中的具体数据点,确保你获得项目所需的精准信息。
是否可以将 GitHub 数据集直接集成到我现有的系统中?
当然可以,GitHub 数据集支持无缝 API 集成,你可以轻松将数据接入到 CRM、分析工具或其他系统中,从而简化和优化业务流程。