26K Star！NotebookLM 开源平替来了：本地 AI + 数据自主，5 分钟跑起来。

Open Notebook 是 Google NotebookLM 的开源平替，26K Star，MIT 协议。数据完全自托管，支持 18+ AI 提供商（含 Ollama 本地免费运行）。三层知识架构管理研究资料，支持播客生成、MCP 集成与完整 REST API。5 分钟 Docker 部署即可上手，隐私顾虑彻底解决。

yfj-unicorn

88人浏览 · 2026-06-07 14:04:06

yfj-unicorn · 2026-06-07 14:04:06 发布

先问你一个问题：你用过 Google NotebookLM 吗？

如果用过，你大概知道那种感觉——把一堆 PDF、网页链接丢进去，AI 帮你梳理脉络、生成播客对话，有时候真有点魔法的感觉。

但你有没有想过，那份竞品调研报告、那篇还没发表的论文草稿、那堆精心整理的行业资料……全都悄悄躺在谷歌的服务器上了？

谷歌怎么用这些数据？会不会用来训练模型？我不知道，你也不知道。

这就是 Open Notebook 存在的理由。

26K Star 的 NotebookLM 平替

Open Notebook 是 NotebookLM 的完全开源平替，GitHub 目前 26.6K Star，MIT 协议，官网在 open-notebook.ai。

一句话定位：自托管、隐私优先、支持 18+ AI 提供商的 AI 研究助手。

不是"差不多能用"的平替，而是在某些功能上真的比 NotebookLM 更强的那种。

技术栈是 Python + FastAPI + Next.js + React + SurrealDB + LangChain。支持多语言界面，中文简繁体都有。

数据主权不是口号

"数据主权"这词听起来很宏大，但落地很具体。

你有没有遇到过这些情况：

公司内部的竞品分析，想用 AI 帮忙整理，但不敢传到云端
还没发表的研究成果，不确定传给第三方服务是否合适
客户合同、内部会议纪要，想让 AI 提炼要点，但规定不允许上传外部服务

Open Notebook 的方案是：全部跑在你自己的机器或服务器上，数据不离本地。

搭配 Ollama，连 AI 模型都不用联网——真正做到 100% 本地运行。

核心设计：三层知识架构

Open Notebook 有一个设计得相当清晰的数据模型，理解它是用好这个工具的关键。

┌─────────────────────────────────────┐
│  NOTEBOOK（笔记本）                 │
│  "我的 AI 安全研究 2026"            │
├─────────────────────────────────────┤
│                                     │
│  SOURCES（原始来源）                │
│  ├─ safety_paper.pdf               │
│  ├─ alignment_video.mp4            │
│  └─ prompt_injection_article.html  │
│                                     │
│  NOTES（处理后的洞察）              │
│  ├─ AI 生成摘要                    │
│  ├─ 关键概念提取（变换操作）        │
│  ├─ 我自己写的研究笔记              │
│  └─ 对话中保存的洞察               │
└─────────────────────────────────────┘

三层，逻辑清晰：

Notebook（笔记本） 是项目容器，彼此完全隔离。竞品调研和个人学习笔记不会混在一起，可以同时开 10 个项目互不干扰。

Sources（来源） 是原始素材。一旦添加就不再变动，系统自动建立全文索引和向量索引。支持 PDF、视频、音频、网页、Office 文档，基本上你能想到的格式都能处理。

Notes（笔记） 是处理后的产出——AI 生成的摘要、你自己写的笔记、从对话中保存的洞察。这才是知识沉淀的地方，带引用来源，可以追溯每个结论从哪来的。

这个设计有点 Zettelkasten 的味道：素材永久保留，洞察不断积累。

和 NotebookLM 到底差在哪？

直接上对比表：

特性	Open Notebook	NotebookLM
数据隐私	完全自托管	谷歌云端
AI 模型	18+ 提供商自由选	仅谷歌模型
播客说话者	1–4 个，可定制声音	固定 2 个
API 访问	完整 REST API	无
部署方式	Docker / 云 / 本地	仅谷歌托管
费用	仅付 AI 调用费	免费 + 月订阅
可定制性	完全开源可修改	封闭系统

播客功能特别值得说一下。NotebookLM 的播客是它的明星特性，两个固定主播，效果确实不错。但 Open Notebook 支持 1–4 个说话者，每个可以自定义声音配置，还支持 ElevenLabs 和 Google TTS 引擎。灵活程度差了不是一点点。

18+ AI 提供商，随便选

这个支持列表我看了一遍，主流的都覆盖了：

提供商	LLM	向量嵌入	语音转文字	文字转语音
OpenAI	✅	✅	✅	✅
Anthropic (Claude)	✅	❌	❌	❌
Google (Gemini)	✅	✅	✅	✅
Ollama（本地免费）	✅	✅	❌	❌
Groq（有免费额度）	✅	❌	✅	❌
DeepSeek（R1 推理）	✅	❌	❌	❌
DashScope (Qwen3)	✅	❌	❌	❌
ElevenLabs	❌	❌	✅	✅
Azure OpenAI	✅	✅	✅	✅
Mistral / xAI / OpenRouter…	✅	部分	部分	部分

底层靠作者自研的 Esperanto 库做统一抽象。

值得注意的是：DeepSeek-R1 和 Qwen3 这类推理模型也支持，可以在需要深度思考的任务上用上这些"慢但准"的模型。

想省钱的策略：日常对话用 Groq 的 Llama（有免费额度，速度极快），嵌入用 Ollama，播客 TTS 用 Google，整体成本能压很低。

5 分钟把它跑起来

前置条件只有一个：装好 Docker Desktop。

# 第一步：下载配置文件
curl -o docker-compose.yml \
  https://raw.githubusercontent.com/lfnovo/open-notebook/main/docker-compose.yml

# 第二步：编辑文件，把这行改成自己的密钥
# OPEN_NOTEBOOK_ENCRYPTION_KEY=change-me-to-a-secret-string

# 第三步：启动
docker compose up -d

等 15–20 秒，打开 http://localhost:8502。

进去之后：Settings → API Keys → Add Credential → 填入你的 API Key → Discover Models → Register Models，就能开始用了。

想完全本地，连 API 费用都省掉？ 换一个包含 Ollama 的配置文件：

curl -o docker-compose.yml \
  https://raw.githubusercontent.com/lfnovo/open-notebook/main/examples/docker-compose-ollama.yml
docker compose up -d

这样连 AI 调用费都没有，完全零成本运行。

几个用起来会喜欢的设计细节

上下文精细控制

每个来源可以独立设置三个档位：不进上下文 / 仅摘要 / 完整内容。你不用把所有资料都砸给 AI，可以精确控制每次对话用哪些信息——对 token 消耗控制友好，对隐私控制也友好。

Chat vs Ask 两种模式

Chat：你手动选哪些资料进上下文，然后自由对话。适合深度探索，你控制全局。
Ask：输入问题，系统自动用 RAG 检索相关片段再回答。适合快速查找，适合资料多的大笔记本。

两种模式面向不同场景，设计很务实，不是为了堆功能而堆。

Transformations（内容变换）

对单份资料做结构化提取：主要观点、关键概念、方法论、行动要点……有内置模板，也可以自定义。比让 AI "帮我总结一下"要精准得多，输出结果是真正可以复用的知识片段。

MCP 集成

Open Notebook 支持 MCP（Model Context Protocol），可以直接接入 Claude Desktop 或 VS Code。研究数据沉淀在 Open Notebook，AI 对话在 Claude Desktop，两者通过 MCP 打通——这个组合很香。

说说我的保留意见

引用功能目前还比较基础，和 NotebookLM 的精准引用有差距。你问它"这个结论在哪篇文章里？"，它能给出来源，但精确到具体段落的能力还需要打磨。作者在 roadmap 里也承认了这个问题，说会持续改进。

另外，部署本身对普通用户还是有点门槛——虽然有 Docker 一键启动，但配置 AI 提供商、理解三层架构、调试环境变量，对不懂技术的用户还是需要一定学习成本。作者甚至专门做了一个 CustomGPT 安装助手来帮助用户上手，可见这个问题他们也意识到了。

适合谁用？

强烈推荐：

有数据隐私顾虑的研究者和从业者
想控制 AI 成本、可以自己选模型的用户
想深度定制、有开发能力的工程师
NotebookLM 重度用户，想要更强的播客功能和 API 能力

可以继续用 NotebookLM：

只是轻量使用，不在意数据隐私
不想折腾任何部署，要开箱即用
高度依赖 NotebookLM 的精准引用功能

最后

在一个越来越多工具要求你"把数据交给我"的时代，Open Notebook 选择了反其道而行：你的数据，你说了算。

26.6K Star 不是噱头，MIT 协议不是限制——这是真正意义上你可以 fork、可以魔改、可以永久自托管的工具。

感兴趣的话，GitHub 地址：https://github.com/lfnovo/open-notebook

你现在用什么工具管理研究资料？用过 NotebookLM 或类似的 AI 知识库工具吗？欢迎评论区聊聊你的工作流，顺便说说有没有什么数据隐私上的顾虑。

我是顾北，关注我，获取更多好玩有趣的开源仓库！

谢谢你阅读我的文章~

我们下期再见！

PS：本文部分内容由AI辅助创作

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

我让AI的记忆系统“抄袭”了你的CPU，效果拔群

2048 AI社区

我选了 Oxigraph 做 AI 的大脑，然后整个系统开挂了

2048 AI社区

Typora插件开发指南：打造专属IDE式写作环境

**从编辑器到“写作IDE”的愿景**：将Typora从一个优秀的Markdown编辑器，升级为集写作、管理、发布于一体的个性化工作台。- **了解Typora插件架构**：核心文件（`plugin.json`, `main.js`）、生命周期与API边界。- **操作文档内容**：读取、修改、插入Markdown与HTML。## 8. 从插件到生态：创意拓展方向 - **与外部工具链集成**：G