NovelReel:上传小说 TXT,AI 全自动生成漫剧视频(开源)
NovelReel是一款开源AI小说转漫剧工具,支持从TXT文件到视频的全自动生成。核心功能包括:AI剧本拆解、角色DNA系统(5维度结构化描述)、场景资产库、多引擎图像生成(5种提供商×5种风格)、ComfyUI参考图一致性控制、4种TTS配音引擎及视频合成(支持BGM和字幕)。技术栈基于React+FastAPI,支持本地部署,工作流程涵盖从小说上传到最终视频输出的全链路处理。该项目已在Git
项目简介
NovelReel 是一个开源的小说转漫剧视频工具。只需上传一个 TXT 小说文件,AI 就能自动完成从剧本拆解、角色生成、分镜渲染、配音到视频合成的全流程。
上传小说 → AI 剧本拆解 → 角色/场景资产生成 → 分镜渲染 → 配音合成 → 漫剧视频输出
GitHub 仓库:https://github.com/awch-D/NovelReel
效果预览
分镜脚本
AI 自动将小说章节拆解为结构化的分镜脚本,包含画面描述、角色、场景、对白、镜头类型等信息。

角色资产库
每个角色通过 5 维度 DNA 结构化描述,支持多候选图、版本管理、三视图生成,确保跨镜头角色一致性。

场景资产库
自动提取小说中的场景并生成参考图,支持多视角(全景/平视/特写/细节)生成。

核心特性
1. Character DNA 结构化角色系统
告别"AI 画的角色每帧都不一样"的问题。NovelReel 独创 5 维度角色 DNA 描述体系:
base_identity → 年龄/性别/体型
facial → 眼/鼻/唇/脸型/疤痕
hair → 发色/长度/造型
outfit → 上装/下装/鞋/配饰
visual_hooks → 最具辨识度的 2-3 个视觉标识
DNA 在前端可视化编辑,修改后一键重新生成角色图和关联分镜。
2. 5 种图像引擎 × 5 种视觉风格
图像生成支持 5 种 Provider 自由切换:
| Provider | 说明 |
|---|---|
| OpenAI Images API | DALL·E 3 等 |
| Chat 图片生成 | qwen-vl 等多模态模型 |
| 即梦 Seedream 4.0 | 火山引擎,中文理解强 |
| ComfyUI | 本地部署,支持 IPAdapter 参考图控制 |
| Mock | 开发调试用,不消耗 API |
视觉风格支持:动漫赛璐璐 / 写实漫画 / 中国水墨 / 韩漫 / 3D 皮克斯
3. ComfyUI IPAdapter 参考图一致性
接入 ComfyUI 工作流时,角色参考图通过 IPAdapter 注入生成过程,ref_weight 可在项目设置中自由调节(0-1),实现角色外貌在分镜帧中的高度一致。
4. 全链路配音
支持 4 种 TTS 引擎(GPT-SoVITS / CosyVoice / Fish Speech / Mock),上传角色参考音频后按集批量生成对白语音,自动合并到对应镜头。
5. 视频合成
4 种视频 Provider(Ken Burns 静态缩放 / 即梦 i2v 3.0 Pro / ComfyUI AnimateDiff / 无视频),FFmpeg 合成最终漫剧视频,支持 BGM、字幕叠加、多分辨率输出。
技术栈
| 层 | 技术 |
|---|---|
| 前端 | React 18 + TypeScript + Vite + Tailwind CSS + Shadcn/ui |
| 后端 | FastAPI (Python) |
| LLM | OpenAI 兼容 API(支持任意兼容服务) |
| 图像生成 | 即梦 / OpenAI / Chat / ComfyUI / Mock |
| 视频生成 | 即梦 i2v / Ken Burns / ComfyUI / 无 |
| TTS | GPT-SoVITS / CosyVoice / Fish Speech / Mock |
| 视频合成 | FFmpeg |
快速开始
环境要求
- Node.js >= 18
- Python >= 3.10
启动后端
cd backend
pip install -r requirements.txt
cp .env.example .env
# 编辑 .env 填入 API 密钥
uvicorn main:app --reload --port 8001
启动前端
cd frontend
npm install
npm run dev
浏览器访问 http://localhost:5174 即可使用。
工作流程
- 上传小说 TXT(支持多文件,自动识别章节格式)
- 选择章节,运行管线 → AI 拆解剧本,提取角色 DNA、场景、对白
- 资产库中审核角色/场景参考图,编辑 DNA,锁定满意版本
- 三视图生成,支持单视图独立重新生成
- 自动生成分镜帧,可选中批量重新生成
- 配音 → 上传角色参考音频,批量生成 TTS 对白
- 视频合成 → 选择 BGM、字幕,按集或全量输出漫剧视频
开源地址
GitHub:https://github.com/awch-D/NovelReel
欢迎 Star 和 PR!
更多推荐

所有评论(0)