一个全自动化的内容工作流 SDK-信息聚合神器 WeFlow
WeFlow是一款全自动化内容工作流SDK,通过智能整合热门技术文章,实现从抓取到发布的一站式处理。系统采用多模态技术,集成Qwen-VL模型解析图片内容,支持AI自动配图,并能将多篇文章融合为Tech Crunch风格的深度报道。其核心功能包括:自动抓取RSS源内容、智能分析聚合、图片本地化处理、微信公众平台自动发布以及飞书通知推送。项目采用模块化架构,支持自定义RSS源配置,并提供Docker
·
WeFlow
这是一个全自动化的内容工作流 SDK:自动发现热门技术文章、使用 Firecrawl 抓取内容、通过 DeepSeek 进行深度总结与融合、调用 Qwen-VL 理解图片、生成 AI 配图,并最终将图文并茂的“每日技术精选”推送到微信公众号草稿箱与飞书群。
项目地址: https://github.com/twwch/weflow
核心功能
- 多模态智能 (Multimodal):
- 视觉分析: 集成 Qwen-VL 模型,自动“看懂”文章中的图片并生成描述,用于 Markdown 插图。
- AI 配图: 支持通过 Qwen (Wanx) 或 Gemini 生成高质量封面图与插图。
- 统一日报风 (Unified Digest):
- Tech Crunch 风格: 不是简单的文章堆砌,而是将多篇同类文章融合为一篇连贯、专业的深度报道。
- AI 标题生成: 根据当日热点自动生成吸引人的中文标题 (e.g., “AI 日报: GPT-5 传闻与 Qwen 新突破”)。
- 稳健发布 (Robust Publishing):
- 图片本地化: 自动下载原文图片并上传至微信服务器,解决防盗链导致的图片裂开问题。
- 全局去重: 智能追踪图片使用情况,确保整篇日报中没有重复图片。
- 智能通知:
- 飞书卡片: 推送成功后,自动向飞书群发送包含状态、摘要和草稿 ID 的精美卡片。
架构概览
RSS 配置详解
WeFlow 采用以下优先级逻辑加载 RSS 源:
- 优先级最高:环境变量
RSS_FEEDS。如果.env中配置了此项(非空),系统将仅使用这里指定的源,忽略默认列表。 - 默认回退:内置源列表。如果
.env中未配置RSS_FEEDS或为空,系统将自动加载以下内置的高质量技术源:- OpenAI Blog
- BAIR (Berkeley AI Research)
- DeepMind
- Distill
- MIT Technology Review
- Hugging Face Blog
- AI Shift
- Ethics and Society
- The Gradient
- Machine Learning Mastery
- KDnuggets
- Artificial Intelligence News
自定义配置示例
在 .env 文件中配置,使用逗号分隔多个 URL:
# 覆盖默认源,仅抓取以下列表
RSS_FEEDS=https://tech.meituan.com/feed/,https://www.solidot.org/index.rss,https://feeds.feedburner.com/PythonInsider
效果展示




环境要求
- Python 3.12+
- uv (推荐)
- PostgreSQL 数据库
安装指南
-
克隆代码库
git clone <repository_url> cd message-topai -
安装依赖
uv sync
数据库设置 (Docker 快速启动)
如果你本地没有 PostgreSQL,可以使用 Docker 快速启动一个:
docker run -d \
--name weflow-db \
-e POSTGRES_USER=weflow \
-e POSTGRES_PASSWORD=weflow \
-e POSTGRES_DB=weflow \
-p 5432:5432 \
postgres:15
配置指南
-
初始化环境变量
cp .env.example .env -
编辑
.env文件:API Key 获取地址:
- Firecrawl: firecrawl.dev
- DeepSeek: platform.deepseek.com
- DashScope (Qwen): dashscope.console.aliyun.com
# 核心服务 FIRECRAWL_API_KEY=fc_... # 网页抓取 (Firecrawl) DEEPSEEK_API_KEY=sk-... # LLM (深度总结与融合) # 数据库连接 (对应上述 Docker 配置) DATABASE_URL=postgresql://weflow:weflow@localhost:5432/weflow # 微信公众号 WECHAT_APP_ID=wx... WECHAT_APP_SECRET=... WECHAT_AUTHOR="WeFlow Bot" # 文章作者名 # 多模态配置 (视觉分析与绘图) # 提供商: 'qwen' (推荐) 或 'gemini' IMAGE_PROVIDER=qwen DASHSCOPE_API_KEY=sk-... # 阿里云 DashScope (Qwen-VL & Wanx) # 通知 (可选) FEISHU_WEBHOOK_URL=https://open.feishu.cn/... # 飞书机器人 Webhook
使用方法
运行每日自动流:
uv run python src/weflow/main.py
系统将自动执行以下步骤:
- 抓取: 获取 昨天 (T-1) 发布的所有技术文章。
- 分析: 使用 Vision 模型理解图片,使用 LLM 分析文本。
- 融合: 生成一篇统一风格的 Markdown 日报 (Unified Daily Digest)。
- 上传: 将文中所有嵌入图片上传至微信素材库。
- 发布: 推送最终草稿至公众号,并发送飞书通知。
更多推荐



所有评论(0)