学习笔记

1 使用DeepResearch工具进行课题调研

DeepResearch工具(如Gemini Deep Research)能自动化完成从主题拆解、多源检索到报告生成的完整调研流程。对于《Agent应用开发与落地全景》课题,其应用流程与价值如下:

1.1 调研流程

  • 启动研究:输入核心主题(如"Agent应用开发的技术架构与落地挑战"),DeepResearch会自动生成研究大纲(涵盖技术模块、平台对比、落地案例),经确认后执行。
  • 多源检索:并行检索数百个网络来源(包括学术论文、技术博客、行业报告),使用权威信源(如arXiv、LangChain文档、企业白皮书)。
  • 分析整合:借助大上下文能力(如Gemini的100万token)进行多轮推理,提取关键技术观点(如MCP架构的优势)、对比平台差异(如LangChain vs 毕昇),并生成结构化报告

1.2 关键优势

  • 效率提升:将传统需数日的文献回顾压缩至几分钟,且报告包含引用来源,可信度高。
  • 深度适配:通过调整提示词聚焦特定方向,例如:
    # 示例提示词框架(基于Gemini Deep Research)
    角色:你是一名AI架构师,正在进行Agent系统研究。
    任务:对比工作流(Workflow)与自主智能体(Autonomous Agent)的架构差异,需包含:
          1. 核心架构特点
          2. 典型应用场景
          3. 代表平台(国内外各3个)
    输出格式:Markdown表格,附资料来源引用。
    
  • 输出灵活:支持一键导出为Google Docs或Markdown,便于后续精炼。

💡 提示:DeepResearch虽高效,但关键决策点仍需人工验证(如架构选择权衡),它更适合快速构建调研基础,而非完全替代深度思考。

2 Agent应用产品盘点与理解

我对企业级智能体应用领域尤为感兴趣。该领域产品注重落地实效、数据安全与稳定性,正推动各行业数字化转型。以下是对代表性产品的盘点:

产品名称 核心定位 关键技术特点 典型应用场景 代表企业/平台
数字员工平台 RPA与AI融合,端到端自动化 计算机视觉理解屏幕(CV)、NLP解析指令、智能决策引擎 财务对账、客户服务、数据录入 来也科技(LAIYE)
智能体开发平台 低代码企业级Agent构建 NeuroFlow框架、多模态知识库、Multi-Agent协同 零售智能库存、金融风控、私有化部署 BetterYeah AI
数据分析智能体 自然语言交互的数据洞察 语义解析引擎、主动预警、自动可视化 经营分析、销售趋势预测、实时报表生成 北极九章DataGPT
营销智能体 全流程自动化营销 动态创意优化、ROI预测预算分配、A/B测试引擎 广告投放优化、个性化营销策略 Marketingforce
代码助手智能体 软件开发全生命周期赋能 多语言代码生成、安全扫描、单元测试生成 代码编写、重构、漏洞检测 商汤代码小浣熊
深度研究智能体 自动化研究与报告生成 自主规划检索路径、权威源筛选、引用生成 市场调研、学术文献回顾、竞争分析 Gemini DeepResearch

核心观察

  1. 从“工具”到“伙伴”:产品正从执行单一任务(如代码生成)向自主协同(如多智能体协作处理复杂项目)演进,追求更高程度的自主性。
  2. 垂直化与场景深耕:通用平台(如LangChain)提供基础能力,但解决具体业务痛点(如零售库存优化、财务对账)的垂直产品更易显现价值。
  3. 数据安全与可控性:企业级产品普遍强调私有化部署信创兼容,这是规模化落地的重要前提。

3 Agent应用的核心技术栈与学习路径

3.1 核心技术栈

一个成熟的Agent系统是多项技术协同的结果,其核心可归纳为以下五大模块:

技术模块 核心功能 关键技术点/工具
大脑 (LLM) 意图理解、任务规划、内容生成 DeepSeek、GPT、Claude、通义千问;API调用、Prompt工程
记忆 (Memory) 状态跟踪、上下文管理、经验存储 短期记忆(会话缓存)、长期记忆(向量数据库Chroma, Weaviate)
规划 (Planning) 任务分解、路径编排、决策制定 ReAct框架、CoT思维链、LangGraph流程编排、State Machine
工具使用 (Tool Use) 扩展能力边界,与环境交互 Function Calling、API调用、RPA(如金智维K-RPA)、Code Interpreter
反思与调整 (Reflection) 自我评估、优化策略、错误处理 Reflexion、Tree-of-Thought (ToT)、Critic-Actor架构

此外,架构模式决定了技术的组织方式:

  • ReAct (Reason+Act):轻量级原型首选,交替进行“思考-行动”循环。
  • MCP (Memory-Controller-Planner):适合复杂工程化系统,模块职责清晰,便于维护。
  • A2A (Agent-to-Agent):多智能体协作,模拟组织分工,适合超复杂任务。

3.2 学习路径建议

掌握Agent开发需循序渐进,结合理论与实践:

graph LR
A[基础入门] --> B[进阶深化]
B --> C[高级实践]
C --> D[专家领域]

subgraph A[阶段一:基础入门]
    A1[无代码平台体验<br>Dify/Coze]
    A2[理解RAG原理与实践]
end

subgraph B[阶段二:进阶深化]
    B1[掌握核心API<br>OpenAI Function Calling]
    B2[学习框架LangChain/LlamaIndex]
end

subgraph C[阶段三:高级实践]
    C1[构建自主智能体<br>ReAct/规划/记忆]
    C2[探索多智能体协作]
end

subgraph D[阶段四:专家领域]
    D1[私有化部署与安全]
    D2[深耕垂直行业应用]
end
  1. 阶段一:基础入门

    • 目标:建立直观认知,了解Agent能做什么。
    • 行动
      • 体验无代码平台(如Dify、Coze),快速搭建一个客服机器人或数据库查询Agent,理解工作流概念。
      • 学习RAG基础知识,解决“模型知识过时和幻觉”问题。
    • 资源:Udemy《n8n Crash Course》、Coze官方文档。
  2. 阶段二:进阶深化

    • 目标:掌握核心模块的开发能力。
    • 行动
      • 深入LLM API:必学Function Calling,这是工具调用的基石。
      • 学习开发框架:从LangChainLangGraph入手,学习其Tools、Chains、Agents等核心概念,实现复杂工作流。
      • 集成记忆系统:尝试用Chroma等向量数据库为Agent添加长期记忆。
    • 资源:OpenAI Function Calling文档、LangChain官方教程、《基于DeepSeek大模型的Agent技术应用开发实践》课程。
  3. 阶段三:高级实践

    • 目标:设计并实现可落地的复杂Agent系统。
    • 行动
      • 构建自主智能体:尝试实现ReAct循环,集成规划与反思能力。
      • 探索多智能体协作:使用CrewAI等框架,模拟多角色协作(如PM、Dev、QA)完成项目。
      • 参与真实项目:参考GitHub开源项目(如Agentic RAG、多智能体航班查询),克隆代码并学习。
    • 资源:Avi Chawla《2025年AI Agent全景报告》、GitHub热门Agent项目。
  4. 阶段四:专家与领域深耕

    • 目标:解决企业级落地挑战,成为领域专家。
    • 行动
      • 关注安全与部署:学习私有化部署、数据安全、信创环境适配。
      • 深耕垂直行业:选择1-2个感兴趣的方向(如金融、制造、营销),深入研究行业知识和痛点,打造专家级解决方案。

总结与行动建议

Agent领域的发展日新月异,但万变不离其宗以扎实的核心技术栈为基石,以解决真实业务问题为导向

  • 如果你刚开始接触:别被纷繁的概念迷惑,从“用”开始,亲手搭一个最简单的Agent,感受其价值。
  • 如果你志在开发深度掌握Function Calling和至少一个主流框架(如LangChain),这是你构建一切复杂应用的基础。
  • 如果你关注企业落地:在技术之外,务必深刻理解业务场景,并始终将可靠性、安全性和成本效益放在重要位置。

下一步行动:立即选择一项技术或一个产品,深入体验或构建一个迷你项目吧!

推荐学习资源(鲁力老师亲荐,含金量高)

  1. 官方文档:OpenAI函数调用指南(https://platform.openai.com/docs/guides/function-calling)——搞懂工具调用的基础;
  2. 经典论文:Lilian Weng《LLM Powered Autonomous Agents》(https://lilianweng.github.io/posts/2023-06-23-agent/)——自主Agent的技术框架奠基文;
  3. 框架文档:LangChain《What is an AI agent?》(https://blog.langchain.dev/what-is-an-agent/)、毕昇官网(https://bisheng.ai.com/)——实战必备;
  4. 实践项目:用Dify搭一个“个人助手”(查天气+搜新闻),用LangChain做一个“多文档总结Agent”——动手比看文档快10倍。

Agent开发现在还是“快速迭代期”,没有“标准答案”,但鲁力老师的分享给了我们一个“落地框架”——从定义到工具,从架构到实践,每一步都有明确的指引。后续我会基于这些知识点,以赛促学,动手做一个“Agent”,守护银发:老年生活有点AI创新挑战赛
跳出传统“养老"思维,设计辅助型AI解决方案或通
过轻量AI工具,帮助老年人保持独立、融入社会。
到时再跟大家分享实战细节~也期待与大家交流学习

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐