啥是“AIGC“?带你分清一堆AI技术词
AIGC相关的一系列AI术语之间的关系。
·
🤖 啥是"AIGC"?带你分清一堆AI技术词

🏷️ AIGC与生成式AI
- AIGC 是 AI Generated Content(AI生成内容)的简写。当AI可以帮忙生成文字、图片、音频视频等内容,且让人难以分清背后创作者是人类还是AI时,这些内容就叫做AIGC。
- ChatGPT 生成的文章 → AIGC
- GitHub Copilot 生成的代码 → AIGC
- Midjourney 生成的图片 → AIGC
- 海外更流行的词是 Generative AI(生成式AI)。生成式AI所生成的内容就是AIGC,所以两者是一体两面的关系。在国内,AIGC常被用来指代生成式AI。
💡 一张图理清所有AI术语的关系

- 这些概念是层层嵌套的包含关系,从大到小:
- AI(人工智能) → 最大的圈,1956年确立的学科,旨在让计算机模拟人类智能
- 机器学习 → AI的子集,核心是不需要人类显式编程,让计算机通过算法自行学习和改进
- 深度学习 → 机器学习的一种方法,使用人工神经网络
- 生成式AI / 大语言模型 → 深度学习的应用
🧠 机器学习 vs 传统编程
- 传统编程:通过代码直接告诉电脑"图片里有红色说明是玫瑰,有橙色说明是向日葵"——人类直接编写判断逻辑,不属于机器学习。
- 机器学习:给电脑大量玫瑰和向日葵的图片,让电脑自行识别模式、总结规律,从而能对没见过的图片进行预测和判断。
🍎 监督学习
- 算法接受有标签的训练数据,每个数据点既包括输入特征,也包括期望的输出值。目标是学习输入和输出之间的映射关系。
- 经典任务:
- 分类:拿猫狗照片 + 对应标签训练,让模型预测新照片是猫还是狗
- 回归:拿房子特征(面积、卧室数、是否带阳台)+ 房价标签训练,让模型预测新房子的价格
🔑 无监督学习
- 学习的数据没有标签,算法自主发现数据里的模式和规律。
- 经典任务:
- 聚类:拿一堆新闻文章,让模型根据主题或内容特征自动把相似文章分组
🐕 强化学习
- 让模型在环境里采取行动、获得反馈,从反馈中学习,从而在给定情况下采取最佳行动来最大化奖励或最小化损失。
- 就跟训小狗一样:刚开始小狗随心所欲做动作,但随着互动,小狗发现某些动作能获得零食、某些没奖励、某些遭受惩罚,行为就逐渐接近训练师的期望。
- 应用举例:让模型下围棋,通过一局局游戏里的奖惩反馈优化策略
🧱 深度学习
- 深度学习不属于监督/无监督/强化学习的任何一类,而是机器学习的一种方法,可以用于这三种学习方式。
- 核心是使用人工神经网络,模仿人脑处理信息的方式,通过层次化方法提取和表示数据特征。
- 以识别小猫照片为例:
- 数据传入输入层(像人眼看到图片)
- 通过多个隐藏层(每层做复杂数学运算,识别耳朵、眼睛等特征)
- 输出层给出答案(是否是小猫)
- 模型通常有很多层,因此称为"深度"。
🎯 生成式AI与大语言模型
- 生成式AI:深度学习的一种应用,利用神经网络识别现有内容的模式和结构,学习生成新内容(文本、图片、音频等)。
- 大语言模型(LLM):也是深度学习的应用,专门用于自然语言处理任务。"大"说明参数量非常大(数十亿甚至万亿个),训练需要海量文本数据集。
- 国外例子:GPT、LLaMA
- 国内例子:通义千问、ChatGLM
- 以GPT-3为例:根据输入提示和前面生成过的词,通过概率计算逐步生成下一个词/token来输出文本序列
🔢 并非所有生成式AI都是大语言模型
- 不是所有生成式AI都是LLM:生成图像的扩散模型就不是大语言模型,它不输出文本。
- 不是所有LLM都是生成式AI(有争议):谷歌的BERT模型参数量和训练数据很大,属于LLM,擅长理解上下文(用于搜索排名、情感分析、文本分类),但不擅长连贯的长文本生成,有些人认为不属于生成式AI。
#AIGC #机器学习 #深度学习 #人工智能
更多推荐


所有评论(0)