【华为认证】HCIP-AI V1.0 深度进阶:RAG 与 Agent——构建有灵魂、有手脚的工业级 AI 应用
HCIP-AI 第7,8章解析
0. 前言:从“大语言模型”到“大模型系统”
作为高级工程师,我们必须意识到:大模型(LLM)本身不是最终产品,它只是系统中的“推理内核”。
RAG(第 7 章):解决模型“不知道”和“瞎说”的问题,是大模型的“知识外挂”。
Agent(第 8 章):解决模型“不能动”的问题,是大模型的“行动代理”。
将两者结合,才能构建出如“儿科医疗助手”这样既专业又能自主查阅文档、调用工具的闭环应用。
1. RAG 检索增强:让模型“开卷考试”
RAG 的本质是将生成式 AI 的创造力与向量检索的确定性相结合。
1.1 工业级 RAG 的三层架构
高级工程师眼中的 RAG 不仅仅是“向量库 + LLM”,它包含精细的流水线:
-
数据层 (Data Layer):不仅仅是切分。需要针对 PDF、表格进行 布局分析(Layout Analysis),避免切分断在逻辑中间。
-
检索层 (Retrieval Layer):
-
语义检索:利用 Embedding 模型计算余弦相似度。
-
🔥 重排序 (Re-ranking):初检可能找回 10 条,但模型窗口有限。高级工程师会引入 Cross-Encoder 架构的模型进行二次打分,选出最精准的 Top-3。
-
-
生成层 (Generation Layer):构造高效的 Contextual Prompt,强制模型在参考资料缺失时回答“不知道”,有效遏制幻觉。
1.2 高级优化:语义分块(Semantic Chunking)
不要再死板地按 500 字切分。高级工程师会使用 基于语义密度的切分方式:当检测到文本语义发生剧烈变化时再断开。这能显著提升检索回来的上下文完整度。
2. Agent 编排:赋予 AI 自主行动力
如果说 RAG 是让模型看书,那么 Agent(智能体) 就是让模型去实验室做实验。
2.1 Agent 的核心架构:LLM + P + M + T
-
Planning (规划):
-
🔥 CoT (思维链):让模型在输出前生成
Thought过程。 -
ReAct 模式:推理与行动的交替。模型输出:
Thought->Action->Observation->Thought... 这是一个动态纠错的过程。
-
-
Memory (记忆):
-
短期记忆:通过对话上下文(Context Window)传递。
-
长期记忆:通过 RAG 或数据库持久化存储用户的偏好和历史决策。
-
-
Tool Use (工具使用):
-
Function Calling:模型输出特定格式的 JSON,由后台代码执行查询。
-
2.2 🔥 协议革命:MCP 与 A2A
这是 HCIP-AI V1.0 区别于所有旧版认证的“杀手锏”:
-
MCP (Model Context Protocol):这是一种标准化的“万能适配器”。以前每个工具接口都要写一遍适配代码,现在只要符合 MCP 协议,任何模型(如 DeepSeek-V3)都能无缝接管外部数据源。
-
A2A (Agent-to-Agent):解决的是智能体协作。例如:你的“旅行 Agent”发现没票了,它会自动去呼叫“抢票 Agent”协作,而不是等用户下指令。
3. 工业级挑战:如何评估 RAG 与 Agent?
高级工程师评价一个应用,不能只靠“感觉挺好”。
-
RAG 评估指标 (RAGAS):
-
忠实度 (Faithfulness):回答是否真的来自参考文档?
-
相关性 (Relevance):检索出的文档对解决问题是否有帮助?
-
-
Agent 评估:
-
任务完成率:在给定的工具范围内,模型是否达成了最终目标?
-
执行效率:模型是否走了“冤枉路”?(重复调用无效工具)。
-
4. 💡 实战指引:编排你的第一个 Agent
在《实验手册》中,华为以 “儿科医疗知识查询助手” 为例,展示了完整的开发路径。
4.1 核心步骤(高级版逻辑)
-
模型选型:选择 DeepSeek-V3-32K 作为大脑,利用其强大的逻辑遵循能力。
-
RAG 挂载:将权威儿科医学库进行 Embedding 索引。
-
Role Play (角色设定):
-
高级 Prompt 技巧:明确定义“要求与限制”。例如:“如果知识库中无相关案例,请提示用户前往医院,不得自行建议用药”。
-
-
调试与观测:在华为云平台观察模型的思维轨迹(Thought),确保其每一步检索都在预期的逻辑内。
5. 总结:构建“以大模型为中心”的新软件架构
-
RAG 不是过渡技术:即使模型窗口无限大,检索带来的低成本和实时性依然不可替代。
-
Agent 是未来的入口:应用不再是简单的“点点点”,而是人与智能体的高层意图交换。
-
国产化优势:华为昇腾生态配合 DeepSeek,为中国企业提供了从算力到框架、再到应用编排的全链路安全底座。
下一篇预告:我们将进入 第九章:人工智能应用运营与展望,并为你总结 全书避坑指南与模拟题详解。我们将聊聊应用上线后的 MLOps,以及你离高级工程师证书的“最后 100 米”。
更多推荐


所有评论(0)