0. 前言:从“大语言模型”到“大模型系统”

作为高级工程师,我们必须意识到:大模型(LLM)本身不是最终产品,它只是系统中的“推理内核”。 

        RAG(第 7 章):解决模型“不知道”和“瞎说”的问题,是大模型的“知识外挂”。

        Agent(第 8 章):解决模型“不能动”的问题,是大模型的“行动代理”。

将两者结合,才能构建出如“儿科医疗助手”这样既专业又能自主查阅文档、调用工具的闭环应用。

1. RAG 检索增强:让模型“开卷考试”

RAG 的本质是将生成式 AI 的创造力与向量检索的确定性相结合。

1.1 工业级 RAG 的三层架构

高级工程师眼中的 RAG 不仅仅是“向量库 + LLM”,它包含精细的流水线:

  1. 数据层 (Data Layer):不仅仅是切分。需要针对 PDF、表格进行 布局分析(Layout Analysis),避免切分断在逻辑中间。

  2. 检索层 (Retrieval Layer)

    • 语义检索:利用 Embedding 模型计算余弦相似度。

    • 🔥 重排序 (Re-ranking):初检可能找回 10 条,但模型窗口有限。高级工程师会引入 Cross-Encoder 架构的模型进行二次打分,选出最精准的 Top-3。

  3. 生成层 (Generation Layer):构造高效的 Contextual Prompt,强制模型在参考资料缺失时回答“不知道”,有效遏制幻觉。

1.2 高级优化:语义分块(Semantic Chunking)

不要再死板地按 500 字切分。高级工程师会使用 基于语义密度的切分方式:当检测到文本语义发生剧烈变化时再断开。这能显著提升检索回来的上下文完整度。

2. Agent 编排:赋予 AI 自主行动力

如果说 RAG 是让模型看书,那么 Agent(智能体) 就是让模型去实验室做实验。

2.1 Agent 的核心架构:LLM + P + M + T        

  • Planning (规划)

    • 🔥 CoT (思维链):让模型在输出前生成 Thought 过程。

    • ReAct 模式:推理与行动的交替。模型输出:Thought -> Action -> Observation -> Thought... 这是一个动态纠错的过程。

  • Memory (记忆)

    • 短期记忆:通过对话上下文(Context Window)传递。

    • 长期记忆:通过 RAG 或数据库持久化存储用户的偏好和历史决策。

  • Tool Use (工具使用)

    • Function Calling:模型输出特定格式的 JSON,由后台代码执行查询。

2.2 🔥 协议革命:MCP 与 A2A

这是 HCIP-AI V1.0 区别于所有旧版认证的“杀手锏”:

  • MCP (Model Context Protocol):这是一种标准化的“万能适配器”。以前每个工具接口都要写一遍适配代码,现在只要符合 MCP 协议,任何模型(如 DeepSeek-V3)都能无缝接管外部数据源。

  • A2A (Agent-to-Agent):解决的是智能体协作。例如:你的“旅行 Agent”发现没票了,它会自动去呼叫“抢票 Agent”协作,而不是等用户下指令。

3. 工业级挑战:如何评估 RAG 与 Agent?

高级工程师评价一个应用,不能只靠“感觉挺好”。

  • RAG 评估指标 (RAGAS)

    • 忠实度 (Faithfulness):回答是否真的来自参考文档?

    • 相关性 (Relevance):检索出的文档对解决问题是否有帮助?

  • Agent 评估

    • 任务完成率:在给定的工具范围内,模型是否达成了最终目标?

    • 执行效率:模型是否走了“冤枉路”?(重复调用无效工具)。

4. 💡 实战指引:编排你的第一个 Agent

在《实验手册》中,华为以 “儿科医疗知识查询助手” 为例,展示了完整的开发路径。

4.1 核心步骤(高级版逻辑)

  1. 模型选型:选择 DeepSeek-V3-32K 作为大脑,利用其强大的逻辑遵循能力。

  2. RAG 挂载:将权威儿科医学库进行 Embedding 索引。

  3. Role Play (角色设定)

    • 高级 Prompt 技巧:明确定义“要求与限制”。例如:“如果知识库中无相关案例,请提示用户前往医院,不得自行建议用药”。

  4. 调试与观测:在华为云平台观察模型的思维轨迹(Thought),确保其每一步检索都在预期的逻辑内。

5. 总结:构建“以大模型为中心”的新软件架构

  1. RAG 不是过渡技术:即使模型窗口无限大,检索带来的低成本和实时性依然不可替代。

  2. Agent 是未来的入口:应用不再是简单的“点点点”,而是人与智能体的高层意图交换。

  3. 国产化优势:华为昇腾生态配合 DeepSeek,为中国企业提供了从算力到框架、再到应用编排的全链路安全底座。

下一篇预告:我们将进入 第九章:人工智能应用运营与展望,并为你总结 全书避坑指南与模拟题详解。我们将聊聊应用上线后的 MLOps,以及你离高级工程师证书的“最后 100 米”。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐