🤖 啥是"AIGC"?带你分清一堆AI技术词

在这里插入图片描述

🏷️ AIGC与生成式AI

  • AIGC 是 AI Generated Content(AI生成内容)的简写。当AI可以帮忙生成文字、图片、音频视频等内容,且让人难以分清背后创作者是人类还是AI时,这些内容就叫做AIGC。
  • ChatGPT 生成的文章 → AIGC
  • GitHub Copilot 生成的代码 → AIGC
  • Midjourney 生成的图片 → AIGC
  • 海外更流行的词是 Generative AI(生成式AI)。生成式AI所生成的内容就是AIGC,所以两者是一体两面的关系。在国内,AIGC常被用来指代生成式AI。

💡 一张图理清所有AI术语的关系

在这里插入图片描述

  • 这些概念是层层嵌套的包含关系,从大到小:
  • AI(人工智能) → 最大的圈,1956年确立的学科,旨在让计算机模拟人类智能
  • 机器学习 → AI的子集,核心是不需要人类显式编程,让计算机通过算法自行学习和改进
  • 深度学习 → 机器学习的一种方法,使用人工神经网络
  • 生成式AI / 大语言模型 → 深度学习的应用

🧠 机器学习 vs 传统编程

  • 传统编程:通过代码直接告诉电脑"图片里有红色说明是玫瑰,有橙色说明是向日葵"——人类直接编写判断逻辑,不属于机器学习。
  • 机器学习:给电脑大量玫瑰和向日葵的图片,让电脑自行识别模式、总结规律,从而能对没见过的图片进行预测和判断。

🍎 监督学习

  • 算法接受有标签的训练数据,每个数据点既包括输入特征,也包括期望的输出值。目标是学习输入和输出之间的映射关系。
  • 经典任务:
  • 分类:拿猫狗照片 + 对应标签训练,让模型预测新照片是猫还是狗
  • 回归:拿房子特征(面积、卧室数、是否带阳台)+ 房价标签训练,让模型预测新房子的价格

🔑 无监督学习

  • 学习的数据没有标签,算法自主发现数据里的模式和规律。
  • 经典任务:
  • 聚类:拿一堆新闻文章,让模型根据主题或内容特征自动把相似文章分组

🐕 强化学习

  • 让模型在环境里采取行动、获得反馈,从反馈中学习,从而在给定情况下采取最佳行动来最大化奖励或最小化损失。
  • 就跟训小狗一样:刚开始小狗随心所欲做动作,但随着互动,小狗发现某些动作能获得零食、某些没奖励、某些遭受惩罚,行为就逐渐接近训练师的期望。
  • 应用举例:让模型下围棋,通过一局局游戏里的奖惩反馈优化策略

🧱 深度学习

  • 深度学习不属于监督/无监督/强化学习的任何一类,而是机器学习的一种方法,可以用于这三种学习方式。
  • 核心是使用人工神经网络,模仿人脑处理信息的方式,通过层次化方法提取和表示数据特征。
  • 以识别小猫照片为例:
  • 数据传入输入层(像人眼看到图片)
  • 通过多个隐藏层(每层做复杂数学运算,识别耳朵、眼睛等特征)
  • 输出层给出答案(是否是小猫)
  • 模型通常有很多层,因此称为"深度"。

🎯 生成式AI与大语言模型

  • 生成式AI:深度学习的一种应用,利用神经网络识别现有内容的模式和结构,学习生成新内容(文本、图片、音频等)。
  • 大语言模型(LLM):也是深度学习的应用,专门用于自然语言处理任务。"大"说明参数量非常大(数十亿甚至万亿个),训练需要海量文本数据集。
  • 国外例子:GPT、LLaMA
  • 国内例子:通义千问、ChatGLM
  • 以GPT-3为例:根据输入提示和前面生成过的词,通过概率计算逐步生成下一个词/token来输出文本序列

🔢 并非所有生成式AI都是大语言模型

  • 不是所有生成式AI都是LLM:生成图像的扩散模型就不是大语言模型,它不输出文本。
  • 不是所有LLM都是生成式AI(有争议):谷歌的BERT模型参数量和训练数据很大,属于LLM,擅长理解上下文(用于搜索排名、情感分析、文本分类),但不擅长连贯的长文本生成,有些人认为不属于生成式AI。

#AIGC #机器学习 #深度学习 #人工智能

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐