1. CNN - 卷积神经网络

核心思想: 模仿人类视觉处理系统。它特别擅长处理具有网格状拓扑结构的数据,比如图像(2D像素网格)、语音(1D波形网格)。

比喻: CNN就像一个拥有“火眼金睛”的侦探。

  • 局部感知: 侦探不会一眼就看整张复杂的画面,而是先拿着“放大镜”(卷积核)一小块一小块地查看图像的局部特征(如边缘、角落、颜色块)。

  • 参数共享: 他用同一个“放大镜”去检查画面的不同区域,这大大提高了效率。

  • 层级抽象: 底层侦探汇报发现了“边缘”和“角落”;中层侦探将这些组合成“眼睛”、“鼻子”;高层侦探最终判断出这是一个“人脸”。

主要应用领域:

应用领域 具体例子 说明
图像识别与分类 手机相册自动按“人物”、“风景”、“食物”分类;谷歌搜索图片。 核心应用,判断一张图片是什么。
目标检测 自动驾驶识别行人、车辆、交通标志;视频监控中圈出特定目标。 不仅要识别出是什么,还要定位出它在图片的哪个位置。
图像分割 医疗影像中分割出肿瘤区域;照片处理软件“抠图”。 像素级的分类,给图片中的每个像素点都打上标签。
人脸识别 手机人脸解锁、支付宝刷脸支付、社交媒体自动标记好友。 特殊的目标检测与识别。
风格迁移 Prisma App,将普通照片变成梵高、毕加索的画风。 将一幅图片的艺术风格应用到另一幅图片上。

一句话总结CNN:一切与“视觉”相关的任务,基本都是CNN的天下。

2. RNN - 循环神经网络

核心思想: 具有“记忆”功能,能够处理序列数据。序列数据的特点是前后的数据点之间存在依赖关系。

比喻: RNN就像一个在阅读句子的读者。

  • 当他读到一个词时,他不仅会处理这个词本身,还会记住前面读到的词的上下文。这样他才能理解“苹果”指的是水果还是公司。

主要应用领域:

应用领域 具体例子 说明
自然语言处理 机器翻译(如谷歌翻译,整句输入整句输出);文本生成(如AI写诗、写小说);情感分析(判断一条评论是正面还是负面)。 处理单词序列,理解或生成人类语言。
语音识别 手机语音助手(Siri、小爱同学)、微信语音转文字。 将声音信号(时间序列)转换成文字。
时间序列预测 股票价格预测、天气预测、能源负荷预测。 根据历史数据预测未来的趋势。

注意: 标准的RNN有“长期依赖”问题(记不住太早的信息)。现在更常用的是它的变体,如 LSTM 和 GRU,它们有更复杂的“记忆单元”,能更好地记住长期信息。

此外,在自然语言处理领域,现在更主流的模型是Transformer(如GPT、BERT),它通过“自注意力机制”能更好地捕捉序列中的长程依赖关系,效率也比RNN更高。但理解RNN是理解Transformer的重要基础。

一句话总结RNN:一切与“时间序列”和“顺序”相关的任务,曾是RNN的领地,现在正逐渐被Transformer取代和增强。


3. GAN - 生成对抗网络

核心思想: 非常巧妙的一种“左右互搏”或“伪造 vs 鉴宝”的训练方式。它由两个神经网络组成:

  • 生成器: 好比“伪造者”,目标是生成尽可能逼真的假数据(如假画、假照片)。

  • 判别器: 好比“鉴宝专家”,目标是尽可能准确地判断输入的数据是真实的还是生成器伪造的。

训练过程: 两者不断对抗、共同进化。生成器的造假技术越来越高,判别器的鉴伪能力也越来越强。最终,生成器能创造出以假乱真的内容。

主要应用领域:

应用领域 具体例子 说明
图像生成 AI绘画(Midjourney, Stable Diffusion)、人脸生成ThisPersonDoesNotExist.com)。 从文字描述或随机噪声生成全新的、逼真的图像。
图像超分辨率 老照片/低清视频修复、放大后变得更清晰。 将小图、模糊图转换成高清大图。
风格迁移 将你的照片变成动漫风格、油画风格。 与CNN的风格迁移类似,但GAN效果往往更生动。
数据增强 在医疗领域,当真实病例数据不足时,用GAN生成逼真的医疗影像供模型训练。 生成合成数据来扩充训练集。
换脸与编辑 图片中换脸(Deepfake)、给人物换发型、加笑容。 对图像内容进行逼真的修改。

一句话总结GAN:一切与“无中生有”和“以假乱真”的生成任务,都是GAN的舞台。它是当前AIGC(人工智能生成内容)爆发的核心技术之一。

对比总结

模型 核心能力 数据处理 比喻 典型应用
CNN 特征提取、识别 空间数据(如图像) 火眼金睛的侦探 图像分类、目标检测、人脸识别
RNN/Transformer 序列建模、理解 时间序列数据(如文本、语音) 有记忆的读者 机器翻译、语音识别、文本生成
GAN 生成、创造 生成新数据 伪造与鉴宝的博弈 AI绘画、图像修复、风格迁移


Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐