Course 02: AI框架设计与选型

我们使用agent关于tool的定义格式，来定义我们自己的工具。AI会将你给它的tool=》写成一段文字，进行描述=>LLMreponse(告诉你，要不要调用这个工具，如果要调用某个工具，参数是什么)e.g.：Qwen-Agent参数定义：根据JSON结构，每种prompt设置各项的要求。

歪瑞马奇

175人浏览 · 2026-02-03 01:01:10

歪瑞马奇 · 2026-02-03 01:01:10 发布

AI Agent的核心问题

LLM适配层（大脑）

1、LLM统一接口

Model Adapter(适配器模式)

=>抹平不同模型(OpenAI,DeepSeek,Qwen)的API差异，各框架的实现方式:

框架层做了一个中间层，把统一的指令(如invoke("你好"))翻译成特定模型的API调用。

2、Prompt管理

prompt类型：

system instruction、上下文、tool的调用（tool描述、参数、触发情景）、自定义prompt template

Prompt Engineering 工程化：

System Message的动态注入，将人设与上下文解耦:

LLM统一接口的作用:

·统一调用方式

·统一了参数配置(如temperature)

输出格式(统一转为Message对象)

工具注册与调度（执行）

tool的定义格式：

我们使用agent关于tool的定义格式，来定义我们自己的工具。AI会将你给它的tool=》写成一段文字，进行描述=>LLMreponse(告诉你，要不要调用这个工具，如果要调用某个工具，参数是什么)

e.g.：Qwen-Agent参数定义：根据JSON结构，每种prompt设置各项的要求

Thinking:LLM是如何看见工具的?

框架将Python函数的name、docstring(功能描述)和type hints (参数类型)转换成JSONSchema =>LLM;

LangChain:也就是@tool，主要是在使用Python原生特性，最符合直觉。

Qwen-Agent:@register_tool,使用显式定义强约束，适合复杂参数。

3、Context管理机制（记忆）

为什么需要进行Context管理?

LLM是无状态的，它记不住你说过什么Context Window(上下文窗口)是昂贵的资源。

=>有限注意力的管理。

短期记忆:

SessionID很重要，它是多用户并发的基础。

滑动窗口策略一一只保留最近N轮，防止Token爆炸。

长期记忆:

这是RAG的范畴，利用向量数据库进行相关性检索。

记忆系统的架构

1)短期记忆(Window)

对话历史截断

滑动窗口策略

壁免Token爆炸

2)长期记忆(RAG)

VectorStorelndex 向量索引

文档分块与Embedding ，相似度检索

控制流编排（中枢，1）实现形式；2）选择一些tools还是workflow）

4、中枢的编排--控制流的模式

主流Agent框架

LangChain（LangGraph）全能型LLM应用框架

LCEL管道语法

LlamaIndex--私有化数据的最佳选择

1）LlamaIndex的设计哲学

2）ReAct Agent与工具集成

Qwen-Agent-轻量级的全能选手

指令跟随优化: Qwen-Agent是专门为Qwen模型(及其强大的Tool Calling能力)定制的。

它不如LangChain抽象，但跑得快。

Code Interpreter (沙箱):

这是它的杀手锏。不同于其他框架只调用外部API，Qwen-Agent内置了代码执行沙箱，允许LLM自己写Python代码来画图、做数据分析，自我修正错误。

适合什么场景:

想要快速搭建工具调用型或数据分析型Agent，且不想处理复杂抽象层的开发者。

利用Qwen-Agent的长文本优势是强项

AutoGen-多智能体框架

它的核心理念是让Agent之间通过自然语言对话来协作，而非硬编码的函数调用。

框架选型

从业务场景的角度，如何选择适合的Agent框架?

LangChain:如果你要开发通用的AI应用，需要灵活控制流程，或者需要切换多种模型；

Llamalndex:如果你主要做RAG(企业知识库)，手里有一堆PDF/Word/Excel要处理。

Qwen-Agent:如果你主要用Qwen，需要做数据分析(Code Interpreter)或处理超长文档(1MContext)型，

AutoGen:如果任务太复杂，一个人(Agent)干不完，需要团队(多角色)协作才能出结果。

CASE:多文件智能问答Agent

Step1，先从 files里面找到相关的知识 chunks

Step2,system prompt+ chunks + tools说明=>LLM进行推理

Q&A

A：RAG知i识库,langchain, llamaindex,qwen-agent

Q：ai agent自主规划，是不是我们自己写tools函数，不用编排流程，agent根据任务自己规划流程?

A：ReAct:走一步看一步planning:提前规划好要做的所有步骤

Q：多agent协同，agent边界是什么?以前的投顾助手，是不是也可以每个节点都设计成一个agent？

A：看成不同“人”，agent看做是人的JD

Q:企业中的实际项目的常规操作步骤

A：数据处理：80%时间

技术难度，针对你出现的特殊情况，该如何处理项目工程:

1)定义测试数据集，50个问题，包括参考答案，评分规则

2)套用框架=》跑出来结果

3)测试，openeval

Q:llamaindex的检索跟es的检索区别?

A：es数据库，存储和检索信息

Ilamaindex帮你调用数据库，faiss

Q: qwen-agen，短期记忆没有sessionlD，怎么管理不同会话

A：qwen-agent 可以当成服务商，你可以利用fastapi,flask做后端，自己管理sessionlD,然后调用qwen-agent

GUI的页面可以自定义?直接部署到服务器上?

webui 可以修改;基于gradio vue更好看一些

Q:哪个agent能支持多级嵌套目录作为知识库?

A：现在的向量数据库，一般存储关系是扁平的，meta设置元数据

Q:liamaindex和qianwenagent解析文档的能力怎么样?有自己专门做处理的比如用mineru解析中文pdf 切片之后再给这两个框架?

A：liamaindex和qianwenagent原理都是框架+tools，mineru比较合适

Q:agent的工具调用策略，一个问题可能涉及到好几个工具串联或并行处理，如果构建工具链，多工具组合搭配策略是什么样的?

A：agent自主安排，我们只需要提供tool即可如果我们想要干预，写在提示词中

Q:智能OA怎么搞?将公司所有的系统集成，所有的操作记录被记录，使其能执行一些智能提醒类或者报表类操作A：Agent:灵活选Agent，让Agent帮你干活，你需要配置tool即可Workflow:

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

前后端分离校园资产管理系统｜SpringBoot+Vue+MyBatis+MySQL完整源码+部署教程

2048 AI社区

Lighthouse安全组自动化审计与加固：基于MCP协议的智能运维实践

本文介绍了一个简易版网络资源监控器的Rust实现方案。该系统通过读取配置文件中的URL列表，定期发送HTTP请求来监测网站可用性，记录响应时间和状态码，并在网站不可达时发出告警。系统采用reqwest库进行异步HTTP请求，tokio处理异步运行时，clap解析命令行参数，csv库存储监控结果到文件。实现过程包括：1)单个网站监测函数；2)读取监控列表；3)异步定时监控模块；4)CSV日志记录功能

2048 AI社区

Spring Bean介绍（被Spring IoC容器创建、装配、管理的Java对象）IoC容器、控制反转（IoC）、依赖注入（DI）、循环依赖

Spring Bean = 被Spring IoC容器创建、装配、管理的Java对象。IoC容器（Inversion of Control Container）是Spring框架的核心引擎，负责创建、组装、管理所有Bean，并将“控制权”从开发者手中“反转”交给框架。它不一定是“JavaBean”（无参构造+getter/setter），而是一个生命周期由Spring全权负责的对象。你可以把Spr