引言

你是否也曾在深夜为第二天的汇报PPT焦头烂额?是否脑中有绝妙想法,却被排版设计耗尽热情?传统AI PPT工具要么模板僵化,要么修改麻烦,始终难以兼顾"快速制作"与"美观专业"。而今天要介绍的banana-slides项目,正试图用AI技术打破这种困境——基于nano banana pro模型,它让PPT创作真正实现"Vibe like coding"的流畅体验。

项目简介

banana-slides是一款原生AI PPT生成应用,核心目标是降低PPT制作门槛,让任何人都能快速创作出兼具专业性与设计感的演示文稿。

该项目支持从想法、大纲、页面描述三种路径起步,满足不同用户的创作习惯。无论是输入一句话主题让AI自动生成完整框架,还是通过自然语言实时修改内容(如"把第三页改成案例分析"),都能轻松实现。同时具备强大的素材处理能力,可解析PDF、Docx等多种格式文件,自动提取关键信息与图表,并支持上传参考图片定制风格。最终成果可一键导出为PPTX或PDF,无需二次调整即可直接使用。

适用场景广泛覆盖职场人士、学生、教育工作者等群体,既适合零设计经验的小白快速出稿,也能为专业人士提供设计灵感。

创新特性与核心优势

相较于传统PPT生成工具,banana-slides的突破点体现在三个方面:

1. 真正的"Vibe式"交互体验
摒弃复杂菜单操作,支持纯自然语言修改指令。无论是局部重绘(如"把这个图换成饼图")还是整页优化,都能通过口头式表达实现,让创作过程更贴近思维流动节奏。

2. 灵活度与专业性的平衡
解决了传统工具"模板僵化"痛点,基于nano banana pro模型生成的页面不仅风格统一,还能精确遵循prompt要求,同时保留手动调整空间,避免成品同质化。

3. 全链路素材处理能力
从多格式文件解析到图表智能提取,从参考图风格迁移到自定义素材上传,形成完整的素材管理闭环,让AI生成内容更贴合用户实际需求。

技术架构与部署指南

技术栈构成

  • 前端:采用React 18 + TypeScript构建,结合Vite 5实现快速开发,使用Zustand管理状态,Tailwind CSS负责UI渲染,通过@dnd-kit实现拖拽交互
  • 后端:基于Python 3.10+与Flask 3.0框架,使用uv进行包管理,SQLite + Flask-SQLAlchemy处理数据存储,集成Google Gemini API提供AI能力,借助python-pptx实现PPT生成

部署方式

推荐使用Docker Compose一键部署:

  1. 克隆仓库并进入目录:git clone https://github.com/Anionex/banana-slides && cd banana-slides
  2. 配置环境变量:复制.env.example.env,填入API密钥(支持Gemini/OpenAI格式)
  3. 启动服务:docker compose up -d
  4. 访问应用:前端http://localhost:3000,后端API http://localhost:5000

也可选择从源码部署,需分别配置前端(npm install + npm run dev)与后端(uv sync + 启动服务)环境。

该项目及相关内容已 AladdinEdu课题广场同步发布,欢迎前往了解更多技术实现与资源

项目地址:AladdinEdu课题广场

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐