简介

文章介绍了大模型与智能体的概念、特点及关系。大模型是参数规模巨大的AI系统,具有理解和生成人类语言的能力;智能体则是能感知环境、决策并执行动作的自治系统。大模型相当于智能体的"大脑"和"核心引擎",而智能体是大模型能力的"延伸"和"具身化"应用。两者相辅相成,未来大多数AI应用将以智能体形式出现。


暑假快结束了,这两天抓紧在网上参加了2025“人工智能赋能高等教育人才培养”系列师资培训,8个老师主讲的16个学时的课,整整花了两天时间学完了。

(图片来源:张闯,北京物资学院)

毫无疑问,还是有很大收获的,至少能看到别的大学的老师是如何将人工智能用于高等教育课程的,同时思考是否也该跟上时代步伐,改革自己的课程呢?

学习时课程展示居多,对于如何做出来的智能教育系统讲得并不多。而且对于这些系统有些专家称为大模型,有些称为智能体,到底是大模型还是智能体呢?

一、什么是大模型?

大模型(Large Language Model, LLM)是一种基于海量数据训练的、参数规模极其巨大(通常达到数十亿甚至万亿级别)的人工智能模型。它的核心能力是理解和生成人类语言(以及代码)。可以把它想象成一个:**“博览群书的超级大脑”****。**它读完了互联网上几乎所有的书籍、文章、代码、网页,从而学会了语言的模式、语法、事实知识以及逻辑推理能力。

大模型的关键特点:

**1.**规模巨大:参数越多,模型能学习和存储的知识与模式就越复杂,能力通常也越强。

2.**生成能力:它不是简单的搜索和匹配,而是能够创造性地生成**全新的、连贯的文本内容,比如写故事、作诗、写邮件。

**3.**通用性强:同一个模型可以不经过大的改动,就能完成翻译、问答、摘要、编程等各式各样的任务(这被称为“涌现能力”)。

**4.**以对话为核心:我们通常通过 prompt(提示词)与它进行多轮对话来使用它。

常见的例子:OpenAI的ChatGPT、Google的Gemini、Anthropic 的Claude、Meta 的 Llama系列、中国的文心一言通义千问等。

目前,已有一些行业大模型出现,如:2023年11月,中国建设科技集团股份有限公司(中国建科)和中国电信集团有限公司(中国电信)联合推出了住房和城乡建设领域首个行业大模型“星辰-住建行业大模型”。该模型基于中国电信的“星辰”语义大模型体系,可为行业提供一站式大模型服务,是首批试商用的12个行业大模型之一,专注于建筑设计、城市管理、智慧住建等领域的智能化应用。

2025年8月10日,由中国中铁隧道局隧道掘进机及智能运维全国重点实验室研发(参与单位:华为技术有限公司、中铁第六勘察设计院集团有限公司、中铁科学研究院集团有限公司、中铁高新工业股份有限公司)的国内首个隧道与地下空间领域垂直大模型——“先锋·隧道大模型”在郑州发布。该模型研发了人机交互深度求索的隧道侠AI助手,具备行业科普、专业问答、行业标准、文本翻译等功能,可辅助编制专项方案和施组。同时,形成了隧道设计BIM可视化、隧道施工评估、隧道装备选型、隧道运维感知与解译等多个应用数智决策新范式。

大模型的局限:

**1.**知识可能过时:它的知识来源于训练数据,无法实时更新(除非额外设计)。

2.胡说八道:可能会自信地生成错误信息,这被称为“幻觉”。

**3.**无法直接行动:它只能进行“思考”和“回答”,但无法自己去操作软件、点击按钮或控制物理世界。

**二、**什么是智能体?

智能体(AI Agent是一个能够感知环境进行决策执行动作以达成特定目标的自治系统。可以把它想象成一个:**“配备了大脑、目标和工具的机器人”****。**它不仅会思考,还会为了完成一个目标而主动采取一系列行动。

智能体的关键组成部分:

1.****规划(Planning大脑。负责思考、拆解目标、制定计划。这通常由一个大模型来担任。

2.****工具使用(Tool Use双手。智能体可以调用外部工具来扩展自己的能力,比如:搜索互联网获取实时信息。运行代码进行精确计算。调用****API来操作软件(如发送邮件、查询数据库、控制智能家居)。

3.****记忆(Memory笔记本。存储短期的工作记忆(当前任务上下文)和长期的历史记忆(过去的学习经验)。

4.****行动(Action执行。最终通过工具去执行具体的操作,并观察结果,形成一个“感知**->思考->**行动”的循环,直到目标达成。

常见的例子AutoGPTBabyAGI,以及未来所有能帮你自动完成复杂任务的AI应用(如自动订票、自动分析报表并生成PPT的AI)。

三、大模型与智能体的关系

总体来说,大模型和智能体的关系可以概括为:大模型是智能体的“大脑”和“核心引擎”,而智能体是大模型能力的“延伸”和“具身化”应用。

用一个比喻来理解就是:大模型就像是一个博学多才、经验丰富的“专家”。他读过世界上所有的书,知识渊博,文采斐然,能和你流畅对话,也能给出各种建议。智能体就像是一个配备了这位专家的“特种部队”。这支部队不仅有专家的大脑,还有明确的任务(比如“攻下这个山头”)、一套工具(比如地图、望远镜、通讯设备),并且能够自主规划步骤(侦察、部署、攻击),最终完成任务。

他们的关系具体如下:

(一)大模型:智能体的基石与核心

大模型的核心能力是:

**1.**强大的理解和生成能力:能处理和理解自然语言、代码等多种信息,并生成高质量的文本、代码等内容。

**2.**丰富的世界知识:在训练过程中学习了海量知识,形成了一个压缩的“知识库”。

**3.**一定的推理能力:能够进行常识推理、逻辑链条推导和简单的规划。

大模型可以根据不同的维度进行分类,例如训练目标、处理模态、模型架构、参数量级和开放程度等。下表是目前主流的大模型类型划分:

(二)智能体:大模型的赋能与拓展

一个完整的智能体通常包含几个关键组件,而大模型完美地充当了其中最核心的部分:

**1.**大脑/规划器由大模型担任。负责理解任务、拆解子目标、制定计划步骤、进行逻辑推理。这是智能体的“思考”中心。

**2.**工具使用:智能体可以调用外部工具来弥补大模型的不足。例如:

①搜索引擎:用于获取实时信息。

②计算器/代码解释器:用于精确计算。

③API/软件接口:用于执行具体操作,如发送邮件、查询数据库、控制机器人。

④专属知识库:用于获取企业内部的私有知识。

**3.**记忆:智能体拥有短期记忆(记住当前对话和任务上下文)和长期记忆(存储过去的历史和经验,以便在未来任务中做得更好)。

4.**行动与感知:根据规划,通过工具执行动作,并观察动作产生的结果,将其作为新的感知信息输入给“大脑”,形成感知-思考-行动**的循环。

(三)两者核心关系:相辅相成,共生共荣

两者的关系主要有如下三种:

**1.**赋能关系:大模型为智能体提供了前所未有的认知和规划能力,使得构建能处理开放任务的通用智能体成为可能。没有大模型,智能体大多只能是规则简单、功能单一的自动化脚本。

**2.**扩展关系:智能体通过工具使用和外部交互,极大地扩展了大模型的能力边界,使其从“万事通”变成了“万事能做”,解决了其静态性和无法行动的短板。

**3.**进化关系:智能体在实际环境中行动产生的结果(成功或失败),可以作为新的训练数据反馈给大模型,从而帮助大模型迭代进化,变得更“聪明”、更“实用”。这就是所谓的“通过实践学习”。

两者关系可用下表来总结:

四、一个简单的例子:

任务:“帮我查一下今天北京的天气,然后用中文写个摘要发到我的邮箱。”

大模型:它可能知道步骤,但无法真正执行。它可能会告诉你:“首先,你需要访问天气网站…然后,你可以写摘要…最后,登录邮箱发邮件…”。

智能体的工作流程(以大模型为大脑)

**1.**规划:大脑(大模型)拆解任务:①获取天气②写摘要③发邮件。

**2.**工具使用:调用 search_weather(Beijing) 工具。

**3.**生成:根据天气信息,用中文写摘要。

**4.**行动:调用 send_email(summary, my_email) 工具完成任务。

整个过程完全自主,无需人工干预。

_weather(Beijing) 工具。

**3.**生成:根据天气信息,用中文写摘要。

**4.**行动:调用 send_email(summary, my_email) 工具完成任务。

整个过程完全自主,无需人工干预。

可见,大模型和智能体是紧密结合、相互成就的一对概念。大模型是智能体实现“智能化”的关键突破,而智能体则是大模型发挥其巨大潜力的最重要和应用最广泛的形式之一。我们现在看到的大部分还都只是大模型,未来看到的绝大多数AI应用,将以“智能体”的形式出现,而它们的心脏,就是一个或多个强大的人工智能大模型。

五、AI大模型学习和面试资源

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习和面试资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

在这里插入图片描述

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

在这里插入图片描述

👉学会后的收获:👈

• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

在这里插入图片描述

1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集

👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

在这里插入图片描述

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐