26K Star!NotebookLM 开源平替来了:本地 AI + 数据自主,5 分钟跑起来。
Open Notebook 是 Google NotebookLM 的开源平替,26K Star,MIT 协议。数据完全自托管,支持 18+ AI 提供商(含 Ollama 本地免费运行)。三层知识架构管理研究资料,支持播客生成、MCP 集成与完整 REST API。5 分钟 Docker 部署即可上手,隐私顾虑彻底解决。
先问你一个问题:你用过 Google NotebookLM 吗?
如果用过,你大概知道那种感觉——把一堆 PDF、网页链接丢进去,AI 帮你梳理脉络、生成播客对话,有时候真有点魔法的感觉。
但你有没有想过,那份竞品调研报告、那篇还没发表的论文草稿、那堆精心整理的行业资料……全都悄悄躺在谷歌的服务器上了?
谷歌怎么用这些数据?会不会用来训练模型?我不知道,你也不知道。
这就是 Open Notebook 存在的理由。

26K Star 的 NotebookLM 平替
Open Notebook 是 NotebookLM 的完全开源平替,GitHub 目前 26.6K Star,MIT 协议,官网在 open-notebook.ai。
一句话定位:自托管、隐私优先、支持 18+ AI 提供商的 AI 研究助手。
不是"差不多能用"的平替,而是在某些功能上真的比 NotebookLM 更强的那种。
技术栈是 Python + FastAPI + Next.js + React + SurrealDB + LangChain。支持多语言界面,中文简繁体都有。

数据主权不是口号
"数据主权"这词听起来很宏大,但落地很具体。
你有没有遇到过这些情况:
-
公司内部的竞品分析,想用 AI 帮忙整理,但不敢传到云端
-
还没发表的研究成果,不确定传给第三方服务是否合适
-
客户合同、内部会议纪要,想让 AI 提炼要点,但规定不允许上传外部服务
Open Notebook 的方案是:全部跑在你自己的机器或服务器上,数据不离本地。
搭配 Ollama,连 AI 模型都不用联网——真正做到 100% 本地运行。
核心设计:三层知识架构
Open Notebook 有一个设计得相当清晰的数据模型,理解它是用好这个工具的关键。
┌─────────────────────────────────────┐
│ NOTEBOOK(笔记本) │
│ "我的 AI 安全研究 2026" │
├─────────────────────────────────────┤
│ │
│ SOURCES(原始来源) │
│ ├─ safety_paper.pdf │
│ ├─ alignment_video.mp4 │
│ └─ prompt_injection_article.html │
│ │
│ NOTES(处理后的洞察) │
│ ├─ AI 生成摘要 │
│ ├─ 关键概念提取(变换操作) │
│ ├─ 我自己写的研究笔记 │
│ └─ 对话中保存的洞察 │
└─────────────────────────────────────┘
三层,逻辑清晰:
Notebook(笔记本) 是项目容器,彼此完全隔离。竞品调研和个人学习笔记不会混在一起,可以同时开 10 个项目互不干扰。
Sources(来源) 是原始素材。一旦添加就不再变动,系统自动建立全文索引和向量索引。支持 PDF、视频、音频、网页、Office 文档,基本上你能想到的格式都能处理。
Notes(笔记) 是处理后的产出——AI 生成的摘要、你自己写的笔记、从对话中保存的洞察。这才是知识沉淀的地方,带引用来源,可以追溯每个结论从哪来的。
这个设计有点 Zettelkasten 的味道:素材永久保留,洞察不断积累。

和 NotebookLM 到底差在哪?
直接上对比表:
|
特性 |
Open Notebook |
NotebookLM |
|---|---|---|
| 数据隐私 |
完全自托管 |
谷歌云端 |
| AI 模型 |
18+ 提供商自由选 |
仅谷歌模型 |
| 播客说话者 |
1–4 个,可定制声音 |
固定 2 个 |
| API 访问 |
完整 REST API |
无 |
| 部署方式 |
Docker / 云 / 本地 |
仅谷歌托管 |
| 费用 |
仅付 AI 调用费 |
免费 + 月订阅 |
| 可定制性 |
完全开源可修改 |
封闭系统 |
播客功能特别值得说一下。NotebookLM 的播客是它的明星特性,两个固定主播,效果确实不错。但 Open Notebook 支持 1–4 个说话者,每个可以自定义声音配置,还支持 ElevenLabs 和 Google TTS 引擎。灵活程度差了不是一点点。

18+ AI 提供商,随便选
这个支持列表我看了一遍,主流的都覆盖了:
|
提供商 |
LLM |
向量嵌入 |
语音转文字 |
文字转语音 |
|---|---|---|---|---|
|
OpenAI |
✅ |
✅ |
✅ |
✅ |
|
Anthropic (Claude) |
✅ |
❌ |
❌ |
❌ |
|
Google (Gemini) |
✅ |
✅ |
✅ |
✅ |
|
Ollama(本地免费) |
✅ |
✅ |
❌ |
❌ |
|
Groq(有免费额度) |
✅ |
❌ |
✅ |
❌ |
|
DeepSeek(R1 推理) |
✅ |
❌ |
❌ |
❌ |
|
DashScope (Qwen3) |
✅ |
❌ |
❌ |
❌ |
|
ElevenLabs |
❌ |
❌ |
✅ |
✅ |
|
Azure OpenAI |
✅ |
✅ |
✅ |
✅ |
|
Mistral / xAI / OpenRouter… |
✅ |
部分 |
部分 |
部分 |
底层靠作者自研的 Esperanto 库做统一抽象。
值得注意的是:DeepSeek-R1 和 Qwen3 这类推理模型也支持,可以在需要深度思考的任务上用上这些"慢但准"的模型。
想省钱的策略:日常对话用 Groq 的 Llama(有免费额度,速度极快),嵌入用 Ollama,播客 TTS 用 Google,整体成本能压很低。
5 分钟把它跑起来
前置条件只有一个:装好 Docker Desktop。
# 第一步:下载配置文件
curl -o docker-compose.yml \
https://raw.githubusercontent.com/lfnovo/open-notebook/main/docker-compose.yml
# 第二步:编辑文件,把这行改成自己的密钥
# OPEN_NOTEBOOK_ENCRYPTION_KEY=change-me-to-a-secret-string
# 第三步:启动
docker compose up -d
等 15–20 秒,打开 http://localhost:8502。
进去之后:Settings → API Keys → Add Credential → 填入你的 API Key → Discover Models → Register Models,就能开始用了。
想完全本地,连 API 费用都省掉? 换一个包含 Ollama 的配置文件:
curl -o docker-compose.yml \
https://raw.githubusercontent.com/lfnovo/open-notebook/main/examples/docker-compose-ollama.yml
docker compose up -d
这样连 AI 调用费都没有,完全零成本运行。

几个用起来会喜欢的设计细节
上下文精细控制
每个来源可以独立设置三个档位:不进上下文 / 仅摘要 / 完整内容。你不用把所有资料都砸给 AI,可以精确控制每次对话用哪些信息——对 token 消耗控制友好,对隐私控制也友好。
Chat vs Ask 两种模式
-
Chat:你手动选哪些资料进上下文,然后自由对话。适合深度探索,你控制全局。
-
Ask:输入问题,系统自动用 RAG 检索相关片段再回答。适合快速查找,适合资料多的大笔记本。
两种模式面向不同场景,设计很务实,不是为了堆功能而堆。
Transformations(内容变换)
对单份资料做结构化提取:主要观点、关键概念、方法论、行动要点……有内置模板,也可以自定义。比让 AI "帮我总结一下"要精准得多,输出结果是真正可以复用的知识片段。
MCP 集成
Open Notebook 支持 MCP(Model Context Protocol),可以直接接入 Claude Desktop 或 VS Code。研究数据沉淀在 Open Notebook,AI 对话在 Claude Desktop,两者通过 MCP 打通——这个组合很香。
说说我的保留意见
引用功能目前还比较基础,和 NotebookLM 的精准引用有差距。你问它"这个结论在哪篇文章里?",它能给出来源,但精确到具体段落的能力还需要打磨。作者在 roadmap 里也承认了这个问题,说会持续改进。
另外,部署本身对普通用户还是有点门槛——虽然有 Docker 一键启动,但配置 AI 提供商、理解三层架构、调试环境变量,对不懂技术的用户还是需要一定学习成本。作者甚至专门做了一个 CustomGPT 安装助手 来帮助用户上手,可见这个问题他们也意识到了。
适合谁用?
强烈推荐:
-
有数据隐私顾虑的研究者和从业者
-
想控制 AI 成本、可以自己选模型的用户
-
想深度定制、有开发能力的工程师
-
NotebookLM 重度用户,想要更强的播客功能和 API 能力
可以继续用 NotebookLM:
-
只是轻量使用,不在意数据隐私
-
不想折腾任何部署,要开箱即用
-
高度依赖 NotebookLM 的精准引用功能
最后
在一个越来越多工具要求你"把数据交给我"的时代,Open Notebook 选择了反其道而行:你的数据,你说了算。
26.6K Star 不是噱头,MIT 协议不是限制——这是真正意义上你可以 fork、可以魔改、可以永久自托管的工具。
感兴趣的话,GitHub 地址:https://github.com/lfnovo/open-notebook
你现在用什么工具管理研究资料?用过 NotebookLM 或类似的 AI 知识库工具吗?欢迎评论区聊聊你的工作流,顺便说说有没有什么数据隐私上的顾虑。
我是顾北,关注我,获取更多好玩有趣的开源仓库!
谢谢你阅读我的文章~
我们下期再见!
PS:本文部分内容由AI辅助创作
更多推荐


所有评论(0)