开源、离线、免费商用的大模型知识库来袭！快速搭建个人和企业私有智能知识库

现在不用再担心了找不到材料文档了，GitHub开源了一款可离线，支持检索增强生成(RAG)大模型的知识库项目。虽然开源时间不长，但是势头很猛，已经斩获25K Star。

AI_小站

617人浏览 · 2026-01-29 10:31:01

AI_小站 · 2026-01-29 10:31:01 发布

你是否也有这样的桌面？为了方便找材料，全部放到了桌面，最后结果就是“用起一时爽，找起火葬场”

（图片来源于网络）

你是否也是盘即个人电脑磁使再怎么不够用，也舍不得删除几年前做的运维方案、架构方案、设计方案文档？最后即使文档都保存了，存云盘了，到用的时候依旧发现找不到，找的也不是想要的。

|大模型知识库来袭

现在不用再担心了找不到材料文档了，GitHub开源了一款可离线，支持检索增强生成(RAG)大模型的知识库项目。虽然开源时间不长，但是势头很猛，已经斩获25K Star。具备以下特点：


* 项目利用 langchain 思想实现的基于本地知识库的问答应用，目标期望建立一套对中文场景与开源模型支持友好、可离线运行的知识库问答解决方案； * 项目支持的开源 LLM 与 Embedding 模型，本项目可实现全部使用开源模型离线私有部署。与此同时，本项目也支持 OpenAI GPT API 的调用，并将在后续持续扩充对各类模型及模型 API 的接入； * 项目方案采用Apache License，可以免费商用，无需付费。

* 项目利用 langchain 思想实现的基于本地知识库的问答应用，目标期望建立一套对中文场景与开源模型支持友好、可离线运行的知识库问答解决方案； * 项目支持的开源 LLM 与 Embedding 模型，本项目可实现全部使用开源模型离线私有部署。与此同时，本项目也支持 OpenAI GPT API 的调用，并将在后续持续扩充对各类模型及模型 API 的接入； * 项目方案采用Apache License，可以免费商用，无需付费。

总结下重点就是：

支持中文，可私有化部署，免费商用！
支持中文，可私有化部署，免费商用！
支持中文，可私有化部署，免费商用！

重要的事情说三遍********

项目名称：Langchain-Chatchat``项目地址：https://github.com/chatchat-space/Langchain-Chatchat

📺 原理介绍视频（点击可看视频）

从文档处理角度来看，实现流程如下：

技术路线图：

Langchain 应用
基础React形式的Agent实现，包括调用计算器等
Langchain 自带的Agent实现和调用
智能调用不同的数据库和联网知识
Bing 搜索
DuckDuckGo 搜索
Metaphor 搜索
接入非结构化文档
结构化数据接入
分词及召回
.txt, .rtf, .epub, .srt
.eml, .msg
.html, .xml, .toml, .mhtml
.json, .jsonl
.md, .rst
.docx, .doc, .pptx, .ppt, .odt
.enex
.pdf
.jpg, .jpeg, .png, .bmp
.py, .ipynb
.csv, .tsv
.xlsx, .xls, .xlsd
接入不同类型 TextSplitter
优化依据中文标点符号设计的 ChineseTextSplitter
本地数据接入
搜索引擎接入
Agent 实现
LLM 模型接入
支持通过调用 FastChat api 调用 llm
支持 ChatGLM API 等 LLM API 的接入
支持 Langchain 框架支持的LLM API 接入
Embedding 模型接入
支持调用 HuggingFace 中各开源 Emebdding 模型
支持 OpenAI Embedding API 等 Embedding API 的接入
支持智谱AI、百度千帆、千问、MiniMax 等在线 Embedding API 的接入
基于 FastAPI 的 API 方式调用
Web UI
基于 Streamlit 的 Web UI

**|**大模型知识库来袭

Docker 部署

一行代码搞定，但是建议网速不好的同学不要尝试

docker run -d --gpus all -p 80:8501 registry.cn-beijing.aliyuncs.com/chatchat/chatchat:0.2.7

常规模式本地部署方案

1. 环境配置

# 首先，确信你的机器安装了 Python 3.8 - 3.10 版本``$ python --version``Python 3.8.13``   ``# 如果低于这个版本，可使用conda安装环境``$ conda create -p /your_path/env_name python=3.8``   ``# 激活环境``$ source activate /your_path/env_name``   ``# 或，conda安装，不指定路径, 注意以下，都将/your_path/env_name替换为env_name``$ conda create -n env_name python=3.8``$ conda activate env_name # Activate the environment``   ``# 更新py库``$ pip3 install --upgrade pip``   ``# 关闭环境``$ source deactivate /your_path/env_name``   ``# 删除环境``$ conda env remove -p  /your_path/env_name

接着，开始安装项目的依赖

# 拉取仓库``$ git clone --recursive https://github.com/chatchat-space/Langchain-Chatchat.git``   ``# 进入目录``$ cd Langchain-Chatchat``   ``# 安装全部依赖``$ pip install -r requirements.txt``   ``# 默认依赖包括基本运行环境（FAISS向量库）。以下是可选依赖：``- 如果要使用 milvus/pg_vector 等向量库，请将 requirements.txt 中相应依赖取消注释再安装。``- 如果要开启 OCR GPU 加速，请安装 rapidocr_paddle[gpu]``- 如果要使用在线 API 模型，请安装对用的 SDK``

此外，为方便用户 API 与 webui 分离运行，可单独根据运行需求安装依赖包。

如果只需运行 API，可执行：

$ pip install -r requirements_api.txt``   ``# 默认依赖包括基本运行环境（FAISS向量库）。如果要使用 milvus/pg_vector 等向量库，请将 requirements.txt 中相应依赖取消注释再安装。

如果只需运行 WebUI，可执行：

$ pip install -r requirements_webui.txt

2. 模型下载

如需在本地或离线环境下运行本项目，需要首先将项目所需的模型下载至本地，通常开源 LLM 与 Embedding 模型可以从 HuggingFace 下载。

以本项目中默认使用的 LLM 模型 THUDM/ChatGLM3-6B 与 Embedding 模型 BAAI/bge-large-zh 为例：

下载模型需要先安装 Git LFS ，然后运行

$ git lfs install``$ git clone https://huggingface.co/THUDM/chatglm3-6b``$ git clone https://huggingface.co/BAAI/bge-large-zh

‍

3. 初始化知识库和配置文件

按照下列方式初始化自己的知识库和简单的复制配置文件

$ python copy_config_example.py``$ python init_database.py --recreate-vs

4. 一键启动

按照以下命令启动项目

$ python startup.py -a

最轻模式本地部署方案

该模式的配置方式与常规模式相同，但无需安装 torch 等重依赖，通过在线API实现 LLM 和 Ebeddings 相关功能，适合没有显卡的电脑使用。

$ pip install -r requirements_lite.txt``$ python startup.py -a --lite

Demo示例

Web UI 对话界面：

Web UI 知识库管理页面：

想入门 AI 大模型却找不到清晰方向？备考大厂 AI 岗还在四处搜集零散资料？别再浪费时间啦！2026 年 AI 大模型全套学习资料已整理完毕，从学习路线到面试真题，从工具教程到行业报告，一站式覆盖你的所有需求，现在全部免费分享！

👇👇扫码免费领取全部内容👇👇

一、学习必备：100+本大模型电子书+26 份行业报告 + 600+ 套技术PPT，帮你看透 AI 趋势

想了解大模型的行业动态、商业落地案例？大模型电子书？这份资料帮你站在 “行业高度” 学 AI：

1. 100+本大模型方向电子书

在这里插入图片描述

2. 26 份行业研究报告：覆盖多领域实践与趋势

报告包含阿里、DeepSeek 等权威机构发布的核心内容，涵盖：

职业趋势：《AI + 职业趋势报告》《中国 AI 人才粮仓模型解析》；
商业落地：《生成式 AI 商业落地白皮书》《AI Agent 应用落地技术白皮书》；
领域细分：《AGI 在金融领域的应用报告》《AI GC 实践案例集》；
行业监测：《2024 年中国大模型季度监测报告》《2025 年中国技术市场发展趋势》。

3. 600+套技术大会 PPT：听行业大咖讲实战

PPT 整理自 2024-2025 年热门技术大会，包含百度、腾讯、字节等企业的一线实践：

在这里插入图片描述

安全方向：《端侧大模型的安全建设》《大模型驱动安全升级（腾讯代码安全实践）》；
产品与创新：《大模型产品如何创新与创收》《AI 时代的新范式：构建 AI 产品》；
多模态与 Agent：《Step-Video 开源模型（视频生成进展）》《Agentic RAG 的现在与未来》；
工程落地：《从原型到生产：AgentOps 加速字节 AI 应用落地》《智能代码助手 CodeFuse 的架构设计》。

二、求职必看：大厂 AI 岗面试 “弹药库”，300 + 真题 + 107 道面经直接抱走

想冲字节、腾讯、阿里、蔚来等大厂 AI 岗？这份面试资料帮你提前 “押题”，拒绝临场慌！

1. 107 道大厂面经：覆盖 Prompt、RAG、大模型应用工程师等热门岗位

面经整理自 2021-2025 年真实面试场景，包含 TPlink、字节、腾讯、蔚来、虾皮、中兴、科大讯飞、京东等企业的高频考题，每道题都附带思路解析：

2. 102 道 AI 大模型真题：直击大模型核心考点

针对大模型专属考题，从概念到实践全面覆盖，帮你理清底层逻辑：

3. 97 道 LLMs 真题：聚焦大型语言模型高频问题

专门拆解 LLMs 的核心痛点与解决方案，比如让很多人头疼的 “复读机问题”：

三、路线必明： AI 大模型学习路线图，1 张图理清核心内容

刚接触 AI 大模型，不知道该从哪学起？这份「AI大模型学习路线图」直接帮你划重点，不用再盲目摸索！

在这里插入图片描述

路线图涵盖 5 大核心板块，从基础到进阶层层递进：一步步带你从入门到进阶，从理论到实战。

L1阶段:启航篇丨极速破界AI新时代

L1阶段：了解大模型的基础知识，以及大模型在各个行业的应用和分析，学习理解大模型的核心原理、关键技术以及大模型应用场景。

L2阶段：攻坚篇丨RAG开发实战工坊

L2阶段：AI大模型RAG应用开发工程，主要学习RAG检索增强生成：包括Naive RAG、Advanced-RAG以及RAG性能评估，还有GraphRAG在内的多个RAG热门项目的分析。

L3阶段：跃迁篇丨Agent智能体架构设计

L3阶段：大模型Agent应用架构进阶实现，主要学习LangChain、 LIamaIndex框架，也会学习到AutoGPT、 MetaGPT等多Agent系统，打造Agent智能体。

L4阶段：精进篇丨模型微调与私有化部署

L4阶段：大模型的微调和私有化部署，更加深入的探讨Transformer架构，学习大模型的微调技术，利用DeepSpeed、Lamam Factory等工具快速进行模型微调，并通过Ollama、vLLM等推理部署框架，实现模型的快速部署。

L5阶段：专题集丨特训篇【录播课】

四、资料领取：全套内容免费抱走，学 AI 不用再找第二份

不管你是 0 基础想入门 AI 大模型，还是有基础想冲刺大厂、了解行业趋势，这份资料都能满足你！
现在只需按照提示操作，就能免费领取：

👇👇扫码免费领取全部内容👇👇

2026 年想抓住 AI 大模型的风口？别犹豫，这份免费资料就是你的 “起跑线”！

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

‌2026年平板设备手动验证：测试从业者的热点指南

2048 AI社区

黑马程序员DeepSeek+Cursor+Devbox+Sealos零代码实战项目开发部署——（11）项目开发——发版上线（Devbox）entrypoint.sh文档、nginx代理、允许源

2048 AI社区

【n8n教程】：MCP Server Trigger节点，让你的工作流秒变AI工具！

2048 AI社区

所有评论(0)

查看更多评论

AI_小站

@python1234567_

已为社区贡献320条内容

开源、离线、免费商用的大模型知识库来袭！快速搭建个人和企业私有智能知识库

AI_小站

技术路线图：

Docker 部署

常规模式本地部署方案

1. 环境配置

2. 模型下载

3. 初始化知识库和配置文件

按照下列方式初始化自己的知识库和简单的复制配置文件

一、学习必备：100+本大模型电子书+26 份行业报告 + 600+ 套技术PPT，帮你看透 AI 趋势

1. 100+本大模型方向电子书

2. 26 份行业研究报告：覆盖多领域实践与趋势

3. 600+套技术大会 PPT：听行业大咖讲实战

二、求职必看：大厂 AI 岗面试 “弹药库”，300 + 真题 + 107 道面经直接抱走

1. 107 道大厂面经：覆盖 Prompt、RAG、大模型应用工程师等热门岗位

2. 102 道 AI 大模型真题：直击大模型核心考点

3. 97 道 LLMs 真题：聚焦大型语言模型高频问题

三、路线必明： AI 大模型学习路线图，1 张图理清核心内容

路线图涵盖 5 大核心板块，从基础到进阶层层递进：一步步带你从入门到进阶，从理论到实战。

L1阶段:启航篇丨极速破界AI新时代

L2阶段：攻坚篇丨RAG开发实战工坊

L3阶段：跃迁篇丨Agent智能体架构设计

L4阶段：精进篇丨模型微调与私有化部署

L5阶段：专题集丨特训篇 【录播课】

四、资料领取：全套内容免费抱走，学 AI 不用再找第二份

所有评论(0)

AI_小站

L5阶段：专题集丨特训篇【录播课】