公司数据富集工具

使用、Google Gemini AI 与 Streamlit，瞬间为公司列表补充可执行的商业数据。非常适合潜在客户获取、市场调研或竞品分析。只需上传你的 CSV——几分钟内即可获取 CEO、融资、产品等信息。

ryanding_brd

815人浏览 · 2025-11-24 08:00:00

ryanding_brd · 2025-11-24 08:00:00 发布

使用 Bright Data Web Scraper API、Google Gemini AI 与 Streamlit，瞬间为公司列表补充可执行的商业数据。非常适合潜在客户获取、市场调研或竞品分析。只需上传你的 CSV——几分钟内即可获取 CEO、融资、产品等信息。

https://github.com/user-attachments/assets/4d25c7e3-18c1-4c92-9521-848d03ec9443

功能特性 🚀

自动化富集：每家公司采集 13+ 个数据点，包括 CEO、融资与产品。
CSV 上传：一次性处理多条公司记录。
进度跟踪：在工具处理数据时实时监控富集进度。
友好界面：简洁、专业的仪表盘，轻松访问数据。

如需更强大的研究与数据富集能力，试试 Deep Lookup。该工具可跨 1000+ 个公共来源搜索，并以自然语言查询返回可直接使用的结构化数据。

端到端工作流 🔄

用户输入：通过 Streamlit 界面上传包含公司名称的 CSV。
数据准备：Pandas 校验公司名称有效性并去重。
网页抓取：Requests 将数据发送到 Bright Data Web Scraper API，由 Bright Data 抓取公司信息。
AI 处理：Google Gemini AI 标准化格式并去除不一致性。
结果展示：在交互式 Streamlit 表格中展示富集数据。可下载结果或继续富集更多字段。

数据字段 ℹ️

根据公开数据可用性，每条公司记录可能包含：

领导层：CEO、创始人、高管。
公司信息：LinkedIn URL、服务、联系邮箱、总部、成立时间。
融资信息：融资、投资方、Trustpilot 评分（如有）。
更新动态：新闻、产品、招聘岗位（如有）。

前置条件 🛠️

快速开始 ⚙️

第一步 – 克隆仓库

git clone https://github.com/triposat/ai-company-enrichment.git

第二步 – 进入目录

cd ai-company-enrichment

第三步 – 创建并激活虚拟环境

# Create virtual environment
python -m venv .venv

# Activate virtual environment
# Windows:
.venv\Scripts\activate
# macOS/Linux:
source .venv/bin/activate

第四步 – 安装依赖

pip install -r requirements.txt

第五步 – 创建 `.env` 文件并填写

BRIGHT_DATA_API_KEY=your_bright_data_api_key_here
GEMINI_API_KEY=your_gemini_api_key_here
DATASET_ID=your_dataset_id_here

第六步 – 运行应用

streamlit run app.py

第七步

上传包含 “Company Name” 列的 CSV，并选择要富集的字段。

下一步

要进一步掌握 AI 数据富集，请利用 Bright Data 的强大工具与支持：

使用先进的 Web Access APIs 为你的 AI 模型提供无缝数据访问能力。
探索终极 MCP 工具，将 AI 连接至网页，每月免费享受 5,000 次 MCP 请求。
使用拥有数十亿记录的预采集数据集获取高质量数据。
与 n8n、CrewAI 等 AI 平台集成，连接并构建 AI 代理。
在 Bright Data 的博客页面了解更多 AI 数据解决方案。

如需专家指导，请联系 Bright Data 支持团队。

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

致远OA10.0版本【1.0.0.7注册机，仅限用于个人学习用】

致远OA 10.0是基于云原生架构的新一代智能协同运营平台，融合AI技术，实现企业高效协作与业务创新。其核心功能包括：云原生微服务架构支持弹性扩展和多环境部署；智能审批流程通过可视化设计和AI审核提升效率；AI赋能公文处理、合同管理等办公场景；文档与知识管理系统实现全生命周期管理；移动办公支持多端同步和离线操作；深度集成人事、采购等业务系统；提供低代码开发平台快速构建应用；数据决策功能提供智能分析

2048 AI社区

17、【C++】异常

内置类型：如int，简单但信息有限。标准异常派生类，提供what()方法返回错误信息。自定义类型：继承，实现自定义错误信息。示例// 内置类型异常try {// const char*类型// 标准异常try {自定义异常应继承，并重写what()private:public:// 重写what()，返回错误信息try {connect();// 输出"Error 404: connection