AI学习笔记整理(一)—— 基本概念理解
初次接触AI(人工智能(Artificial Intelligence),英文缩写为AI),碰到很多陌生名词,例如:大模型,生成式AI, Agent AI, 物理AI,具身智能机器人等等,不清楚它们是什么意思,有什么区别,所以从网上查找搜索他们的介绍,整理如下:
大模型:
LLM(大语言模型)是一种通过海量文本数据训练、具备理解和生成人类语言能力的人工智能模型,其参数规模达数十亿甚至万亿级,能够执行文本生成、翻译、问答等语言处理任务。
核心能力
-
文本生成与补全:可创作小说、文案,还能根据前文逻辑补全未完成的内容。
-
翻译:支持多语言互译,兼顾专业术语准确性与日常表达自然度。
-
问答交互:针对用户问题提供条理清晰的解答。
-
代码生成:根据自然语言描述产出对应代码(如Python、Java等)。
典型应用场景
-
内容创作:生成文章、邮件等内容。
-
技术辅助:优化编程代码、提升开发效率。
-
跨语言服务:支持多语言互译及国际化场景。
-
决策支持:通过情感分析辅助舆情监测。
关键技术特点
-
Tokenization:将文本拆解为模型可识别的最小单元(如词或词的一部分)。
-
Embeddings:将文本转化为高维数值向量,实现语义区分。
-
Attention机制:通过聚焦相关内容提升语境理解能力。
主流的LLM包括OpenAI的GPT系列、Meta的LLaMA系列,以及国内百度文心一言、阿里通义千问等。
生成式AI
生成式AI(Generative AI)是一种通过算法模型生成文本、图像、声音、视频等内容的技术,能够模仿数据分布规律并生成具有逻辑的新内容。
核心概念
生成式AI基于深度学习模型(如GPT、GAN、VAE),通过分析大量数据学习内在规律,并生成与原始数据特征相似但内容不同的新内容。其核心能力在于多模态内容生成,可实现文本、图像、音频等异构数据的创造性输出。
典型应用场景
-
艺术创作:生成小说、诗歌、音乐等文学作品,或设计图像、3D模型等视觉作品。
-
科研与教育:辅助科研人员生成实验方案、学术论文框架,或为学生提供个性化教学方案。
-
医疗健康:辅助生成药物分子结构、疾病诊断报告等复杂内容。
-
商业应用:在零售、消费品行业中优化产品设计、广告文案,提升创意效率并降低成本。
截至2025年,全球已开发超过1000种生成式AI服务,覆盖多个行业。
Agent AI
AI Agent(Agnet AI),俗称智能体,是一种能够自主完成任务规划、执行和决策的智能系统,其核心是通过机器学习和大语言模型技术实现自主决策与多任务处理。
核心概念
AI Agent由四个关键部分组成:
-
规划:将复杂任务拆解为子任务并制定执行流程;
-
记忆:通过机器学习积累知识和优化决策;
-
工具:调用外部工具或资源完成任务;
-
行动:自主执行任务并调整策略。
应用场景
-
企业服务:自动整理会议资料、确认参会人员、生成PPT初稿等;
-
智能家居:根据用户指令自动安排家电运行或提醒事项;
-
自动驾驶:结合环境感知和路径规划实现自主导航;
-
医疗诊断:辅助医生制定治疗方案或分析病例数据。
2025年,AI Agent技术通过大语言模型的优化,已具备百万级上下文处理能力和多模态融合能力,进一步拓展了应用范围。
参考链接:https://blog.csdn.net/ytt0523_com/article/details/149716727

物理AI
物理AI是能够理解物理定律并与现实世界交互的智能实体系统,通常封装于机器人、自动驾驶汽车等自主机器中。
物理AI的核心特征
物理AI通过赋予人工智能“身体”,使其能在真实环境中感知、决策并执行任务,实现数字世界与物理世界的深度交互。其关键技术包括:
-
多模态感知与三维建模:通过激光雷达、深度相机等传感器融合,构建物理世界的三维动态模型(如自动驾驶汽车的点云数据处理)。
-
物理规律嵌入:将质量守恒、能量转换等方程融入神经网络,提升模型对现实世界的预测能力(如气象预测)。
-
仿真训练与迁移学习:通过数字孪生环境(如NVIDIA Omniverse)减少对真实场景的依赖(如工业机器人的虚拟装配训练)。
参考链接:
https://www.nvidia.cn/glossary/generative-physical-ai/
https://www.bilibili.com/video/BV1tAMvz2EwX/?t=20.0&share_source=weixin
社会评价
,人工智能发展的下一阶段将是物理AI(Physic AI)。他指出,AI本质上是软件开发的新范式——它不再依赖人工编写算法,而是通过基本原理从数据中自主学习预测模型。这种基于机器学习的方法展现出极强的扩展性。
当前,生成式AI作为AI的第二波浪潮,已实现跨模态内容转换,如文字与图像、视频间的相互生成。更令人惊叹的是,现代AI系统不仅能理解信息,还能像人类一样推理解决全新问题,通过分步拆解来处理从未见过的挑战。
在具备这些能力的基础上,下一阶段的物理AI将使人工智能融入实体机器系统,如机器人等领域。
具身智能机器人
具身智能机器人中的“具身”指智能系统必须拥有物理实体(如机器人身体),并通过该实体与环境实时交互、感知和学习,从而完成复杂任务,这一概念源于人工智能与机器人学的交叉领域,强调身体是智能不可或缺的一部分。
物理AI与具身智能机器人是相互促进的技术组合,前者为后者提供核心算法支持,后者是物理AI的重要应用领域。
核心算法支持
物理AI通过多模态模型、仿真训练等技术提升机器人感知、决策和执行能力,例如英伟达开发的Cosmos Reason模型可实现动态环境实时更新和任务泛化。
具身智能机器人应用
具身智能机器人通过物理载体(如人形、工业机械臂等)执行任务,例如扫地机器人通过视觉和运动控制完成清扫,智能网联汽车通过自动驾驶系统实现自主导航。
技术发展路径
两者采取“大脑”与“身体”双轨并进策略:
-
具身模型研发:提升硬件设计与运动控制能力
-
物理AI研发:强化智能体与环境的交互学习机制
更多推荐



所有评论(0)