从经典到前沿:多媒体压缩技术的演进与展望
本文系统梳理了多媒体压缩标准的演进历程。从JPEG、MPEG、H.261三大经典标准出发,详细介绍了新一代多媒体压缩技术的发展:JPEG家族已扩展出JPEG 2000、JPEG XS等专业化分支;视频编码形成H.26x、开放免版权费和中国AVS三足鼎立格局;沉浸式媒体与绿色编码成为新方向。文章指出,未来多媒体技术将深度融合AI,在压缩效率、实时交互、内容可信与能效约束之间寻求最优解,迎接沉浸式与智
一、多媒体技术基础
多媒体技术是数字时代的核心支撑之一。所谓“媒体”,是指承载信息的载体;而“多媒体”则是指数字、文字、声音、图形、图像和动画等各种媒体的有机组合,并与先进的计算机、通信和广播电视技术相结合,形成一个可组织、存储、操纵和控制多媒体信息的集成环境与交互系统。
多媒体技术以数字化为基础,能够对多种媒体信息进行采集、编码、存储、传输、处理和表现,并使之建立起有机的逻辑联系,最终集成为一个具有良好交互性的系统。其主要特征包括多样性、集成性、交互性和实时性。经典的多媒体计算机(MPC)定义为:PC + CD-ROM + 声卡 + 显卡 + 多媒体操作系统——这一表述虽源于上世纪90年代,但清晰地揭示了硬件与多媒体功能的结合逻辑。
二、经典压缩标准:奠定数字媒体基石
在多媒体数据压缩领域,早期形成了三大核心标准:
-
JPEG(静止图像压缩标准)
Internet上最广泛使用的图像格式,是一种支持多种压缩程度的有损压缩方法,文件后缀多为.jpg或.jpeg。 -
MPEG(运动图像压缩标准)
视频压缩的重要标准,兼顾了JPEG与H.261的特点。其中:- MPEG-1:面向1~1.5 Mbit/s的传输速率,用于普通电视质量的视频(典型应用:VCD)。
- MPEG-2:目标为720×572分辨率、每秒30帧的视频压缩,扩展模式下可支持1440×1152分辨率的高清晰度电视(HDTV)。
-
H.261(视频通信编码标准)
1990年由ITU-T制定,旨在带宽为64 kbit/s倍数的ISDN网络上传输质量可接受的视频信号,为后续视频会议与视频电话奠定了基础。
上述标准共同开启了数字媒体应用的大门,但技术并未停步。近年来,各大标准组织纷纷推出了更高性能、更适应新场景的压缩技术。
三、更高标准:多元化与智能化演进
1. JPEG系列:从通用压缩走向专业细分
经典的JPEG标准已发展出一个庞大的家族,以适应不同专业需求:
- JPEG 2000:支持有损与无损压缩,具备感兴趣区域(ROI)编码特性,主要用于医学影像、数字电影等领域。
- JPEG XS:亚毫秒级超低延迟轻量级编码,适用于VR/AR、专业视频制作、车载摄像头等实时场景。
- JPEG XL:被设计为JPEG的未来替代者,提供更优的压缩率,同时支持有损/无损压缩及大幅面图像。
- JPEG AI:利用深度学习技术优化压缩效率,实现更低的比特率与更好的视觉效果,并支持机器视觉分析。
- JPEG XE:首个针对视觉事件的事件编码系统,服务于机器视觉等新兴应用。
- JPEG Trust:在图像中嵌入可验证的加密元数据,以打击深度伪造和虚假信息,增强内容信任。
2. 泛MPEG标准:沉浸式与自适应传输
- MPEG-I(沉浸式媒体):为6G时代准备,制定沉浸式视频标准(如MIV),提升交互真实感。
- MPEG光场视频(LVC):由中国团队主导,预计2027年底完成标准制定。
- MPEG DASH:自适应流媒体传输的基石,新引入的REaP弹性架构增强了大规模直播流的鲁棒性。
- Green MPEG:为视频系统制定能效衡量与报告标准,推动绿色视频技术。
3. 视频编码标准:三足鼎立的新格局
传统H.26x系列、开放免版权费系列、中国AVS系列并行发展,竞争激烈。
-
H.266 / VVC(通用视频编码)
最新一代通用标准,相比H.265/HEVC提升约50%压缩效率,支持8K、HDR、屏幕内容等,已正式发布。 -
H.267(下一代)
项目已启动,目标在VVC基础上再降低30%~40%比特率,计划于2028年下半年定稿。 -
AV1 与 AV2
AV1已被Netflix、YouTube、Meta Reels等大规模部署。AV2预计2025年底完成标准计划。 -
AVS3(中国标准)
全球首个面向8K超高清与5G的标准,编码性能较H.265提升近30%。2025年被欧洲电信标准化协会(ETSI)纳入下一代视频标准体系,并与国际数字视频广播组织(DVB)标准融合,安防领域也推出了AVS3-S标准。
4. 未来趋势:AI赋能与混合编码
- 神经网络视频编码(NNVC):国际标准组织正探索将AI工具引入编码框架,与面向机器视觉的视频编码(VCM)共同构成未来方向。
- 传统路线的极限探索:诺基亚、爱立信、Fraunhofer HHI等机构也在研究在压缩效率与复杂度之间取得更好平衡的新型编解码器,为H.267等标准提供技术基础。
四、总结与展望
从JPEG、MPEG、H.261等经典标准,到JPEG XL、H.266/VVC、AV1、AVS3等新一代技术,多媒体压缩标准正经历从“单一通用”到“多元定制”的深刻转变。图像压缩走向功能专业化(低延迟、无损、AI增强),视频压缩则呈现三股力量并行的格局:传统H.26x追求极致压缩率,开放联盟推动免版权费生态,中国AVS实现国际突破。与此同时,AI技术正从外围辅助走向编码核心,沉浸式媒体与绿色编码也已成为重要的演进方向。
多媒体技术的未来,不仅关乎更小的文件、更高的画质,更关乎如何在海量设备、实时交互、内容可信与能效约束之间找到最优解。理解这一演进历程,有助于我们把握数字媒体技术的发展脉搏,迎接即将到来的沉浸式与智能媒体时代。

从 MPEG 到 AVS3:一文读懂多媒体压缩标准的前世今生
作为一名多媒体开发者或技术爱好者,你一定对 JPEG、MPEG、H.261 这些名字不陌生。但你知道吗?技术在飞速迭代——JPEG 已经繁衍出一个庞大家族,H.266/VVC 早已落地,甚至中国自己的 AVS3 标准已经进入欧洲电信标准化协会(ETSI)。今天,我们就来系统梳理多媒体技术与数据压缩标准的演进之路。
一、多媒体技术基础回顾
1.1 什么是多媒体?
- 媒体:承载信息的载体。
- 多媒体:数字、文字、声音、图形、图像、动画等各种媒体的有机组合,与先进的计算、通信、广播电视技术结合,形成可组织、存储、操纵、控制多媒体信息的集成环境与交互系统。
- 多媒体技术:以数字化为基础,对多种媒体信息进行采集、编码、存储、传输、处理和表现,并建立逻辑联系,具备良好交互性的技术。其四大特征:多样性、集成性、交互性、实时性。
1.2 经典的多媒体计算机(MPC)
MPC = PC + CD‑ROM + 声卡 + 显卡 + 多媒体操作系统
虽然这个公式源自上世纪 90 年代(CD‑ROM 早已退出历史舞台),但它很直观地说明了硬件与多媒体能力的绑定关系。
二、三大经典压缩标准(奠基石)
2.1 JPEG —— 静止图像标准
- 全称:Joint Photographic Experts Group
- 特点:有损压缩,压缩程度可选,文件后缀
.jpg/.jpeg - 地位:互联网上最广泛使用的图像格式
2.2 MPEG —— 运动图像标准
- MPEG‑1:传输速率 1~1.5 Mbit/s,典型应用 VCD,分辨率约 352×288
- MPEG‑2:目标为 720×572 @30fps(PAL),扩展模式支持 1440×1152 的 HDTV,典型应用 DVD、数字电视
2.3 H.261 —— 视频通信标准
- 1990 年由 ITU‑T 制定
- 目标:在 64 kbit/s 倍数的 ISDN 网络上传输质量可接受的视频
- 意义:为后续 H.263、H.264/AVC 乃至 H.265/HEVC 奠定了基础
📌 小贴士:H.261 设计之初就瞄准了低带宽实时通信,对今天的视频会议仍有深远影响。
三、更高标准:群雄逐鹿的新时代
你以为标准就停在 MPEG‑2 了?不,这十多年来,编解码战场早已风起云涌。
3.1 JPEG 家族大扩充(不止是有损压缩)
| 标准 | 核心特点 | 应用场景 |
|---|---|---|
| JPEG 2000 | 有损/无损、ROI 编码 | 医学影像、数字电影 |
| JPEG XS | 亚毫秒级延迟 | VR/AR、车载摄像头、专业视频制作 |
| JPEG XL | 更高的压缩率,有损/无损 | 下一代静态图像格式,替代传统 JPEG |
| JPEG AI | 深度学习编码 | 机器视觉、低比特率图像 |
| JPEG XE | 事件编码 | 机器视觉事件流 |
| JPEG Trust | 加密元数据,防深度伪造 | 内容真实性验证 |
📈 趋势:JPEG 不再只盯着“压缩比”,而是走向专业化 + 智能化。
3.2 视频编码标准“三驾马车”
🚗 第一驾:H.26x 系列(ITU‑T / MPEG)
- H.264/AVC:目前应用最广(直播、蓝光、WebRTC)
- H.265/HEVC:压缩率比 H.264 提升约 50%,支持 4K
- H.266/VVC:比 H.265 再提升约 50% 压缩效率,支持 8K、HDR、屏幕内容编码,已正式发布。
- H.267(下一代):已启动,目标在 VVC 基础上再降 30%~40% 比特率,计划 2028 年下半年 定稿。
🚗 第二驾:开放免版权费系列(AOMedia)
- AV1:已被 Netflix(95% 目录)、YouTube( >50% 观看量)、Meta Reels( >70%)大规模采用。
- AV2:预计 2025 年底 完成标准计划,将是下一代免版税编解码器。
🚗 第三驾:中国标准 AVS 系列
- AVS3:全球首个面向 8K + 5G 的标准,编码性能比 H.265 提升近 30%。
- 2025 年重大突破:被 欧洲电信标准化协会(ETSI) 纳入下一代视频标准体系,并与 DVB(国际数字视频广播组织) 标准融合。
- 安防专用版 AVS3‑S 也正式发布,服务于公共安全领域。
3.3 沉浸式与具体应用标准
- MPEG‑I (Immersive):为 6G 时代制定的沉浸式视频标准,例如 ISO/IEC 23090‑12 MIV。
- MPEG 光场视频 (LVC):中国团队主导,预计 2027 年底 正式发布。
- MPEG DASH 新特性:引入 REaP 弹性架构,提升大规模直播流的鲁棒性。
- Green MPEG:为视频系统制定能效报告标准,推动绿色视频技术。
四、未来趋势:AI 与传统编码融合
4.1 神经网络视频编码(NNVC)
国际标准组织(如 MPEG、JVET)已正式启动 AI 进入编码框架的探索,两个主要方向:
- NNVC:神经网络编码
- VCM:面向机器视觉的视频编码
这不再是“用 AI 做后处理”,而是让 AI 成为编解码工具链的一等公民。
4.2 传统路线的极限挑战
诺基亚、爱立信、Fraunhofer HHI 等机构也在研究新型编解码器,试图在压缩效率与计算复杂度之间取得更优平衡,为 H.267 等未来标准铺路。
五、总结对比表(建议收藏)
| 领域 | 经典标准 | 更高 / 最新标准 | 关键提升 / 特点 |
|---|---|---|---|
| 静止图像 | JPEG | JPEG XL / JPEG AI | 压缩率 + 智能编码 |
| 低延迟图像 | — | JPEG XS | 亚毫秒延迟 |
| 通用视频 | MPEG‑2, H.264 | H.266/VVC | 比 H.265 再省 50% 码率 |
| 免版税视频 | VP9 | AV1 / AV2 | 大规模部署,下一代 AV2 |
| 国产视频 | AVS1, AVS2 | AVS3 | 8K+5G,进入 ETSI & DVB |
| 沉浸式媒体 | — | MPEG‑I / 光场视频 | 6G 时代交互体验 |
| 可信图像 | — | JPEG Trust | 防深度伪造 |
六、写在最后
从 CD‑ROM 时代的 MPC,到 JPEG、MPEG‑1/2、H.261,再到 H.266、AV1、AVS3、JPEG XL,多媒体压缩技术已经完成了从“单一通用”到“多元专业 + 智能 + 国际化”的跨越。
对于开发者而言,这既是机遇也是挑战:新的标准带来更高效的存储与传输,但也要花时间适配不同的编码器和专利授权模式。
最后送大家一句话:标准会变,压缩的本质没变——用更少的比特,讲更好的故事。
如果觉得这篇文章对你有帮助,欢迎 点赞 👍、收藏 ⭐、评论 💬,你的支持是我持续输出硬核干货的动力!
更多推荐


所有评论(0)