什么是智能体 (AI Agent)?

“智能体”是英文“Agent”的翻译,在人工智能领域,它指的是一种能够感知环境、进行决策并执行动作,以达成特定目标或完成一系列任务的软件实体

您可以把它想象成一个智能的、自动化的“虚拟助手”或“数字员工”

智能体的核心组成部分(它是如何工作的)

一个真正的智能体通常具备以下四个关键能力,形成了一个持续运行的智能循环:

  1. 感知 (Perception)

    • 作用:从所处的环境或用户那里获取信息。

    • 举例:我“感知”到您提出的“什么是智能体”这个问题;一个电商智能体“感知”到用户下单了一件商品。

  2. 决策 (Decision & Reasoning)

    • 作用:基于感知到的信息,利用自身的知识、规则或模型进行思考、分析和规划,决定下一步该做什么。

    • 举例:我接收到您的问题后,调动我的知识库和理解能力,决定如何组织语言来解释这个概念。

  3. 执行 (Action)

    • 作用:将决策转化为实际的行动,作用于环境或反馈给用户。

    • 举例:我将组织好的语言回复给您;一个智能体控制机器人手臂完成抓取动作;一个智能体自动执行“查询天气-订机票-订酒店”等一系列任务。

  4. 学习与适应 (Learning & Adaptation) - 高级能力

    • 作用:根据行动的结果(反馈)来调整和优化自己的行为模式,在未来做出更有效的决策。这使得智能体能够不断进步。

    • 举例:根据您对我的回答是否满意(比如点击“有帮助”或“无帮助”),我会逐渐学习如何更好地解答类似问题。

      智能体 vs. 传统聊天机器人

      为了更好地理解,您可以看一下它们之间的区别:

      特性 传统聊天机器人 (Chatbot) 智能体 (AI Agent)
      核心能力 基于关键词或模式匹配进行对话响应 感知-决策-行动的完整循环,主动完成任务
      任务范围 通常处理单一的、预设的问答或任务 可以处理复杂的、多步骤的任务(如规划旅行、撰写报告并分析)
      主动性 被动响应,用户问什么才答什么 具备一定主动性,可以自主规划步骤甚至给出建议
      工具使用 通常不能 核心能力,可以调用API、使用计算器、搜索网络、运行代码等
      交互方式 主要是文本对话 多模态交互(文本、语音、图像)并可操作软件系统

      智能体的例子

    • 您正在对话的我:我是一个对话型智能体。我的目标是解答您的问题。我感知您的问题,决策如何回答,并执行回复动作。

    • 自动驾驶汽车:它感知路况(摄像头、雷达),决策是加速、刹车还是转向,并执行相应的驾驶动作。

    • Siri / Alexa / 小爱同学:当您说“定一个明早8点的闹钟”,它们理解您的指令(感知),确认任务(决策),并执行设置闹钟的动作。

    • 游戏中的NPC:游戏中的非玩家角色能够感知玩家的位置和行动,并决策是攻击、躲避还是对话,让游戏世界更加生动。

    • 自动化交易程序:它监控股市数据(感知),根据设定策略决定买入或卖出(决策),并自动执行交易(执行)。

      现在来开始正式操作

      首先打开扣子官网,进入扣子空间,点击红色框内的加号,开始创建智能体

      下面选择创建智能体

      这里给智能体起一个名字

      进入这个页面,最左边人设与回复逻辑,用于设定你的智能体类型

      (可自行去大模型上面生成一个)

      其次是中间部分,先选择你想用的模型 ,下拉菜单有很多可选的大模型

      然后就是插件选择,这一步很关键,你可以点击插件那一行最右边加号左边的A符号,这个按钮的功能是根据你左边人设与回复逻辑,来分析你所需要的插件并自动帮你添加,也可以自行点击添加按钮搜索想添加的插件(这里以我创建的金融智能体为例)

      随后设置一下变量,名称可自己填写(我这里是name),然后下面的用户唯一ID开启,点击保存

      到这里智能体已完成基本需求,可正常使用,跟你的只能力进行对话,至于技能,知识,记忆,对话体验里面的其他功能,可在用户熟练掌握智能体之后,进一步学习并操作(本章主要面向于零基础和第一次接触智能体的用户熟悉掌握基本操作)

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐