LangChain 英雄之旅:3小时构建智能文档助手
LangChain“英雄之旅”——基于通义千问构建智能文档助手。
本人非专业程序员(很多技术都是helloworld级别),对如何用构建应用非常感兴趣。之前尝试过用Dify和阿里百炼平台搭建智能文档助手(可以参考这个文档大模型服务平台百炼控制台),对于什么是RAG,什么是构建知识库,有个非常初步的了解。进一步,我非常好奇从代码层面,如何用python,用langchain实现一个简单的RAG系统,从而搭建一个智能文档问答应用。
但是我也不想学的很深,只是想理解概念。我记得之前学习Angular的时候,官方有个叫英雄之旅的demo,可以快速构建一个小应用,帮助我们学习angular的基础知识。我希望能有个类似的可以快速搭建的项目,帮我从代码层面快速获取Langchain,还有rag等的基本概念。于是deepseek给我输出了一个教程,我按照它给我的代码,一步一步做,中间遇到的最大问题是,langchain版本去年10月有非常大的重构,所以很多包的引用方式和调用方式都有改变,需要不断的出错不断修正,我目前整理到文中的代码,至少是我实际跑下来没有问题的。
我们先来看看最终的效果:

智能文档助手 - 智能对话

智能文档助手 - 知识库管理

智能文档助手 - 系统分析
这是一个基于 LangChain 框架和通义千问(Qwen)大语言模型构建的检索增强生成(RAG)智能问答系统。该系统是基于最基础的功能点,如大语言模型调用,文档处理,嵌入模型向量化,向量存储和检索,智能对话,最后用streamlit生成一个web界面,将功能可视化。接下来,进入我们的教程介绍。
教程简介
教程名称:LangChain“英雄之旅”——基于通义千问构建智能文档助手
目标:通过3-4小时实践,构建能与PDF/TXT文档对话的Web应用
核心模型:Qwen-Plus(通义千问)
技术栈:LangChain + Qwen-Plus + FAISS
前置要求:基础Python知识,阿里云百炼/灵积平台API Key

教程章节安排
第0章:环境准备
此教程中,我们使用通义千问的模型(配置简单,免费额度也很高)
目标
配置通义千问开发环境 (大前提是本地按照python环境,教程里不做介绍)
具体步骤
- 创建项目目录
mkdir langchain-qwen-hero
cd langchain-qwen-hero
2. 安装专业依赖 (后续代码运行中,如果有找不到模块的报错,可以重新再做下pip install对应的模块)
pip install langchain>=0.1.0 langchain-community>=0.0.10 dashscope>=1.14.0 openai>=1.12.0 python-dotenv>=1.0.0 pypdf>=3.17.0 faiss-cpu tiktoken langchain-text-splitters streamlit>=1.28.0
3. 获取模型API密钥
- 访问大模型服务平台百炼控制台,注册/登录
- 创建API Key,获取DASHSCOPE_API_KEY

获取千问API Key
4. 整体项目结构

项目结构
5. 配置环境变量
创建 .env文件,粘贴如下代码:
DASHSCOPE_API_KEY=sk-xxx-your-key-xxx
QWEN_MODEL=qwen-plus # 或 qwen-max, qwen-turbo
完成以上配置,我们就可以进入接下来的第一章 客户端封装了。
更多推荐


所有评论(0)