文章目录

基础

概述

  • 定义
    AI Agent(智能体)是一个能够自主感知环境、做出决策、采取行动的程序或系统。

  • 执行过程
    通过传感器、摄像头等信息采集设备,完成信息获取;利用大语言模型处理采集到信息,做出分析,并给出执行指令;再通过操作设备完成对应指令。

  • 功能
    创建项目、修复BUG、代码CR、发布上线;
    写文档、自动化控制app;

  • 特点
    自主性(Autonomy):智能体能够在没有人类或其他实体的直接干预下运行,并对其行动和内部状态具有某种程度的控制。
    反应性(Reactivity):智能体能够感知其环境,并对环境变化做出实时响应。
    交互性/社交性(Socialability):智能体能够与其他智能体或人类进行交互和协作。
    适应性/主动性(Proactivity):智能体能够根据环境变化主动调整其行为策略,适应新的情况。
    学习能力:许多智能体具有通过经验或数据学习和改进的能力。

  • 案例
    利用智能体,自动创建Vue3项目

  • 智能体技术架构
    在这里插入图片描述

  • 现阶段存在的产品
    openai:https://openai.com/index/introducing-deep-research/
    智普清言的沉思:https://chatglm.cn/main/alltoolsdetail?lang=zh
    manus:https://manus.im/
    manus核心是脚本的执行,

  • AI、智能体、模型、大模型之间的区别
    在这里插入图片描述
    最大的模型网站:hugging face
    AI是一个学科;模型是一个工具;大模型是一个参数量极大的工具;智能体是AI技术落地的系统级应用,形成感知-决策-执行的闭环;大模型是智能体的大脑中枢。

  • 智能体分类
    自主智能体(Autonomous Agents)
    自主智能体是一种能够在没有人类干预的情况下,自主执行任务、做出决策和与环境互动的智能系统。它们具有高度的自主性,能够独立地感知环境、做出决策并执行行动,而不需要外部的控制和干预。
    反应智能体(Reactive Agents)
    反应智能体主要关注对环境变化的实时响应。使用简单反射模型,根据当前感知做出决策,而不需要复杂的内部状态或长期规划。

  • 智能体发展阶段
    第1级:聊天机器人-具有对话语言技能 当前AI类似ChatGPT、豆包
    第2级:实用工具-能够执行具体任务 像博士一样解决问题
    第3级:专家助手-具有特定领域的专业知识 代替用户采取行动
    第4级:团队合作者-能够与人类团队协作
    第5级:通用人工智能(AGI)-具有与人类相当或超越人类的通用智能

  • 技术架构
    单个智能体:大模型+Tools工具
    多个智能体的串联:LangGraph,Dify,Coze等平台
    智能体的调用:phthon/Node

  • 智能体设备架构图
    在这里插入图片描述
    核心:通过大模型LLM调用工具,进而调用Function(函数)、MCP(模型上下文协议)、RAG(检索增强生成)解决问题;

  • 智能体开发流程
    大模型创建、智能体工具开发、智能体开发、智能体串联、智能体运行
    在这里插入图片描述

  • 思考
    案例是vue3项目自动构建,是不是可以整一个创建springboot的基础后端服务?
    是不是可以整一个数据库迁移的智能体的脚本呢?

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐