先问你一个问题:你用过 Google NotebookLM 吗?

如果用过,你大概知道那种感觉——把一堆 PDF、网页链接丢进去,AI 帮你梳理脉络、生成播客对话,有时候真有点魔法的感觉。

但你有没有想过,那份竞品调研报告、那篇还没发表的论文草稿、那堆精心整理的行业资料……全都悄悄躺在谷歌的服务器上了?

谷歌怎么用这些数据?会不会用来训练模型?我不知道,你也不知道。

这就是 Open Notebook 存在的理由。


26K Star 的 NotebookLM 平替

Open Notebook 是 NotebookLM 的完全开源平替,GitHub 目前 26.6K Star,MIT 协议,官网在 open-notebook.ai。

一句话定位:自托管、隐私优先、支持 18+ AI 提供商的 AI 研究助手

不是"差不多能用"的平替,而是在某些功能上真的比 NotebookLM 更强的那种。

技术栈是 Python + FastAPI + Next.js + React + SurrealDB + LangChain。支持多语言界面,中文简繁体都有。


数据主权不是口号

"数据主权"这词听起来很宏大,但落地很具体。

你有没有遇到过这些情况:

  • 公司内部的竞品分析,想用 AI 帮忙整理,但不敢传到云端

  • 还没发表的研究成果,不确定传给第三方服务是否合适

  • 客户合同、内部会议纪要,想让 AI 提炼要点,但规定不允许上传外部服务

Open Notebook 的方案是:全部跑在你自己的机器或服务器上,数据不离本地

搭配 Ollama,连 AI 模型都不用联网——真正做到 100% 本地运行。


核心设计:三层知识架构

Open Notebook 有一个设计得相当清晰的数据模型,理解它是用好这个工具的关键。

┌─────────────────────────────────────┐
│  NOTEBOOK(笔记本)                 │
│  "我的 AI 安全研究 2026"            │
├─────────────────────────────────────┤
│                                     │
│  SOURCES(原始来源)                │
│  ├─ safety_paper.pdf               │
│  ├─ alignment_video.mp4            │
│  └─ prompt_injection_article.html  │
│                                     │
│  NOTES(处理后的洞察)              │
│  ├─ AI 生成摘要                    │
│  ├─ 关键概念提取(变换操作)        │
│  ├─ 我自己写的研究笔记              │
│  └─ 对话中保存的洞察               │
└─────────────────────────────────────┘

三层,逻辑清晰:

Notebook(笔记本) 是项目容器,彼此完全隔离。竞品调研和个人学习笔记不会混在一起,可以同时开 10 个项目互不干扰。

Sources(来源) 是原始素材。一旦添加就不再变动,系统自动建立全文索引和向量索引。支持 PDF、视频、音频、网页、Office 文档,基本上你能想到的格式都能处理。

Notes(笔记) 是处理后的产出——AI 生成的摘要、你自己写的笔记、从对话中保存的洞察。这才是知识沉淀的地方,带引用来源,可以追溯每个结论从哪来的。

这个设计有点 Zettelkasten 的味道:素材永久保留,洞察不断积累。


和 NotebookLM 到底差在哪?

直接上对比表:

特性

Open Notebook

NotebookLM

数据隐私

完全自托管

谷歌云端

AI 模型

18+ 提供商自由选

仅谷歌模型

播客说话者

1–4 个,可定制声音

固定 2 个

API 访问

完整 REST API

部署方式

Docker / 云 / 本地

仅谷歌托管

费用

仅付 AI 调用费

免费 + 月订阅

可定制性

完全开源可修改

封闭系统

播客功能特别值得说一下。NotebookLM 的播客是它的明星特性,两个固定主播,效果确实不错。但 Open Notebook 支持 1–4 个说话者,每个可以自定义声音配置,还支持 ElevenLabs 和 Google TTS 引擎。灵活程度差了不是一点点。


18+ AI 提供商,随便选

这个支持列表我看了一遍,主流的都覆盖了:

提供商

LLM

向量嵌入

语音转文字

文字转语音

OpenAI

Anthropic (Claude)

Google (Gemini)

Ollama(本地免费)

Groq(有免费额度)

DeepSeek(R1 推理)

DashScope (Qwen3)

ElevenLabs

Azure OpenAI

Mistral / xAI / OpenRouter…

部分

部分

部分

底层靠作者自研的 Esperanto 库做统一抽象。

值得注意的是:DeepSeek-R1 和 Qwen3 这类推理模型也支持,可以在需要深度思考的任务上用上这些"慢但准"的模型。

想省钱的策略:日常对话用 Groq 的 Llama(有免费额度,速度极快),嵌入用 Ollama,播客 TTS 用 Google,整体成本能压很低。


5 分钟把它跑起来

前置条件只有一个:装好 Docker Desktop

# 第一步:下载配置文件
curl -o docker-compose.yml \
  https://raw.githubusercontent.com/lfnovo/open-notebook/main/docker-compose.yml

# 第二步:编辑文件,把这行改成自己的密钥
# OPEN_NOTEBOOK_ENCRYPTION_KEY=change-me-to-a-secret-string

# 第三步:启动
docker compose up -d

等 15–20 秒,打开 http://localhost:8502

进去之后:Settings → API Keys → Add Credential → 填入你的 API Key → Discover Models → Register Models,就能开始用了。

想完全本地,连 API 费用都省掉? 换一个包含 Ollama 的配置文件:

curl -o docker-compose.yml \
  https://raw.githubusercontent.com/lfnovo/open-notebook/main/examples/docker-compose-ollama.yml
docker compose up -d

这样连 AI 调用费都没有,完全零成本运行。


几个用起来会喜欢的设计细节

上下文精细控制

每个来源可以独立设置三个档位:不进上下文 / 仅摘要 / 完整内容。你不用把所有资料都砸给 AI,可以精确控制每次对话用哪些信息——对 token 消耗控制友好,对隐私控制也友好。

Chat vs Ask 两种模式

  • Chat:你手动选哪些资料进上下文,然后自由对话。适合深度探索,你控制全局。

  • Ask:输入问题,系统自动用 RAG 检索相关片段再回答。适合快速查找,适合资料多的大笔记本。

两种模式面向不同场景,设计很务实,不是为了堆功能而堆。

Transformations(内容变换)

对单份资料做结构化提取:主要观点、关键概念、方法论、行动要点……有内置模板,也可以自定义。比让 AI "帮我总结一下"要精准得多,输出结果是真正可以复用的知识片段。

MCP 集成

Open Notebook 支持 MCP(Model Context Protocol),可以直接接入 Claude Desktop 或 VS Code。研究数据沉淀在 Open Notebook,AI 对话在 Claude Desktop,两者通过 MCP 打通——这个组合很香。


说说我的保留意见

引用功能目前还比较基础,和 NotebookLM 的精准引用有差距。你问它"这个结论在哪篇文章里?",它能给出来源,但精确到具体段落的能力还需要打磨。作者在 roadmap 里也承认了这个问题,说会持续改进。

另外,部署本身对普通用户还是有点门槛——虽然有 Docker 一键启动,但配置 AI 提供商、理解三层架构、调试环境变量,对不懂技术的用户还是需要一定学习成本。作者甚至专门做了一个 CustomGPT 安装助手 来帮助用户上手,可见这个问题他们也意识到了。


适合谁用?

强烈推荐

  • 有数据隐私顾虑的研究者和从业者

  • 想控制 AI 成本、可以自己选模型的用户

  • 想深度定制、有开发能力的工程师

  • NotebookLM 重度用户,想要更强的播客功能和 API 能力

可以继续用 NotebookLM

  • 只是轻量使用,不在意数据隐私

  • 不想折腾任何部署,要开箱即用

  • 高度依赖 NotebookLM 的精准引用功能


最后

在一个越来越多工具要求你"把数据交给我"的时代,Open Notebook 选择了反其道而行:你的数据,你说了算

26.6K Star 不是噱头,MIT 协议不是限制——这是真正意义上你可以 fork、可以魔改、可以永久自托管的工具。

感兴趣的话,GitHub 地址:https://github.com/lfnovo/open-notebook


你现在用什么工具管理研究资料?用过 NotebookLM 或类似的 AI 知识库工具吗?欢迎评论区聊聊你的工作流,顺便说说有没有什么数据隐私上的顾虑。

我是顾北,关注我,获取更多好玩有趣的开源仓库!

谢谢你阅读我的文章~

我们下期再见!

PS:本文部分内容由AI辅助创作

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐