表示崩塌（representation collapse）

表示崩塌（representation collapse）是自监督学习，特别是对比学习中的一个关键问题。

大多_C

1240人浏览 · 2024-08-12 14:31:38

大多_C · 2024-08-12 14:31:38 发布

表示崩塌（representation collapse）是自监督学习，特别是对比学习中的一个关键问题。让我们深入探讨：

表示崩塌的概念：
- 表示崩塌指的是模型学习到的特征表示变得过于简单或退化，失去了对输入数据的有效区分能力。
- 最极端的情况是所有输入都被映射到同一个点或非常相似的几个点上。
为什么会发生：
- 在对比学习中，如果正样本对之间的相似度被过度优化，而忽视了整体分布，就可能导致崩塌。
- 如果查询编码器和键编码器完全相同，模型可能会找到一种"捷径"：将所有输入映射到一个固定的表示，这样就能轻易地区分正负样本对，但失去了对输入的有效编码。
动量更新如何防止崩塌：
- 创造"移动目标"：键编码器的参数总是稍微落后于查询编码器，这创造了一个动态的学习目标。
- 非对称更新：查询编码器通过梯度下降快速更新，而键编码器缓慢更新，这种不对称性防止了两个编码器简单地"合谋"找到trivial solution。
- 历史信息的整合：键编码器包含了过去多个批次的累积信息，这增加了表示的多样性和稳定性。
具体机制：
- 假设在某一时刻，查询编码器开始将所有输入映射到相似的点。
- 由于键编码器更新较慢，它仍然保持较好的区分能力。
- 这种不一致性会在对比学习中产生较大的损失，促使查询编码器改进其表示。
- 随着训练继续，这种动态平衡持续存在，防止表示退化。
类比理解：
- 可以将其类比为"追逐游戏"：查询编码器（追逐者）试图追上键编码器（被追逐者）。
- 但键编码器总是稍微领先，这种持续的"追逐"确保了学习过程的持续性和有效性。

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

AI Coding 全栈实战

它的目标不是展示"我有多厉害"，而是告诉你：在 2026 年的今天，任何一个有想法、会打字的人，都可以借助 AI 编程工具，从零做出一个完整的全栈网站。当然，在此过程中，你仍然可能遇到不懂的名字或概念，此时AI不仅可以是你的工具，还可以是你的老师，保持求知欲，可以学会任何事情，并且比以往任何一个时候都要更快、更全。如果你只想快速上线一个东西，用 Vercel + Supabase 可能十分钟就搞定

2048 AI社区

【低空经济】低空AI无人机设计方案

2048 AI社区

AI广告投放Agent：从Demo到实战的半年进化

腾讯广告团队开发广告投放Agent的经验教训：从Demo到生产环境的半年进化之路摘要：腾讯广告团队在开发广告投放Agent过程中发现，Demo与生产环境存在巨大差距。初期Demo虽能快速响应指令，但实际应用中暴露出三大问题：频繁确认导致效率低下（20分钟完成3分钟工作）、响应速度慢（26分钟vs人工3分钟）、关键错误（如单位混淆导致20元变2000元）。团队通过三个阶段实现进化：1）建立Ski