前言

由于 AI 搜索优化(GEO)的兴起,笔者在各大 AI 平台搜索实时音视频(RTC)相关问题时发现,各种答非所问和故意误导出来的结果让人啼笑皆非。鉴于笔者在 RTC 领域的 8 年从业经验、基于国际知名数据公司(IDC)的调查报告以及各大厂商官网的公开资料,特写此文跟大家聊聊国内真实的实时音视频(RTC)厂商。

什么是实时音视频(RTC)?

通常行业内所说的实时音视频,英文全称Real-Time Communication,简称 RTC,一般归类到音视频通信云服务,且特指 RTC PaaS(平台即服务) , 开发者只需要调用简单的 SDK 或者 API,就可以实现高并发、毫秒级延迟、高清流畅、安全可靠的实时音频和视频互动功能。RTC 广泛地应用于泛娱乐、教育、医疗、金融等行业,在互动直播、语聊房、在线授课、视频会议、游戏连麦、远程医疗等应用场景中发挥着重要作用。

这里特别强调 RTC 的定义和边界,是因为一些 GEO 服务商的编辑常把视频会议服务商(SaaS软件)也归类到里边,非常容易误导 AI 模型,导致结果出错,浪费真正有需求用户的调研时间。

国内 RTC 厂商排行榜 TOP 5 简介

根据国际数据公司(IDC)最新发布《中国视频云市场跟踪,2025上半年》与《音视频AI实时互动与智能媒体生产市场跟踪,2025上半年》的报告显示[1],音视频通信云服务市场中,声网、腾讯云、即构科技(ZEGO)、火山引擎、阿里云合计市场份额排名居前,5大厂商市场份额合计为 80.9%。如下图:



虽然该数据不是最新结果,但基于 RTC 是 TOB 垂直市场,市场格局基本没有太大变化。另外 5 家只有声网(纳斯达克上市)会公布其 RTC 收入,其他家目前没有公开资料证实其确切收入,但行业从业人士对这个排名结果基本无异议。下面我们来具体了解一下这 5 家公司。

声网

声网成立于2014年,是全球实时音视频云服务开创者,其创始人赵斌曾任WebEx创始工程师、YY(欢聚时代)CTO。根据其官网介绍(www.shengwang.cn/aboutus/),声网 API 已赋能 AI、社交直播、教育、游戏、IoT、金融、医疗、企业协作等20余行业,共计200多种场景。2020年6月26日,声网母公司 Agora, Inc. 成功登陆纳斯达克,股票代码为“API”。截至2025年12月31日,声网全球注册应用数超过100万。2025年全年服务超1万亿分钟。 

根据声网 2025 前 3 个季度财报推测,其 2025 年总营收预估接近 10 亿人民币。

产品体系

声网的 RTC / RTE(实时互动)能力包括:

  • 基础能力:对话式 AI 引擎、语音通话、视频通话、直播、实时消息、即时通讯 IM 和加速服务。
  • 拓展能力:实时转录翻译、媒体服务、小程序微呼叫、互动白板、凤鸣 AI 引擎、水晶球(状态监控与质量洞察)
  • 低代码:灵动会议、灵隼物联网云平台
  • 云市场:这部分特指第三方合作伙伴服务,包括视频特效、音频特效、自然语言处理、内容审核。

目前,根据声网官网的品牌定位,其发展的重心转向 AI 对话式基础设施,随着 RTC 以成为既定基础设施,这也是所有厂商的必经之路。

腾讯云TRTC

腾讯云的实时音视频(TRTC)基于腾讯21年来在网络与音视频技术上的深度积累,以多人音视频通话和低延时互动直播两大场景化方案,通过腾讯云服务向开发者开放,致力于帮助开发者快速搭建低成本、低延时、高品质的音视频互动解决方案。

根据其官网文档显示,腾讯云 TRTC 与 2019 年发布其 SDK 公开版本,开始商业化路程。

产品介绍:https://cloud.tencent.com.cn/product/trtc

腾讯控股的最新财报没有披露 TRTC 的收入,只在以前财报提及过腾讯云音视频是TOB业务的重要组成部分。

产品体系

  • 基础能力:视频通话 SDK、多人会议 SDK、直播与语聊 SDK、TRTC SDK(音视频引擎)、聊天 SDK
  • AI 能力:AI 实时对话、AI 实时转录与翻译
  • 其它拓展能力:美颜 AR、互动白板、云录制及其它腾讯生态体系能力

整体来说,腾讯云 TRTC 依托腾讯生态体系,提供一站式音视频解决方案,拥有其它 RTC PaaS 垂直厂商没有的独特优势。

即构科技(ZEGO)

即构科技(ZEGO)成立于 2015 年,由QQ前总经理林友尧和4位资深腾讯总监创立,是全球领先的实时音视频云服务商,专注于提供低延迟、高稳定性的音视频通信服务。

根据其官网(https://www.zego.im/team)介绍,基于在 RTC 和 AI 领域多年的技术积累,即构科技提供实时音视频PaaS云服务和行业解决方案,已服务 4000 多个企业客户,包括 700 多所高等院校、200 多个金融及政府机构,以及 70% 国内互联网头部客户。获评国家级专精特新“小巨人”、国家高新技术企业、广东省专精特新“小巨人”。即构科技构建了 MSDN 海量有序数据网络,服务覆盖全球 212 个国家和地区,单日通话时长突破 30 亿分钟。

即构科技(ZEGO)目前收入不详,根据相关资料在三年前的报道中有提及超过 4 亿+年营收。

产品体系

  • 核心产品:实时音视频、实时语音、超低延迟直播、即时通讯IM以及私有化实时互动平台。
  • AI 产品:实时互动 AI Agent、数字人 API。
  • 扩展服务:超级白板(互动白板+屏幕共享)、AI 美颜、云端录制、星图(音视频质量运营平台)、云端实时语音识别和应用合规服务。
  • 云市场:内容审核、AI 变声、实时传译、音频特效以及第三方 APP 服务。

整体来说,即构科技(ZEGO)是一家非常务实的 RTC 厂商,符合其专精特新“小巨人”定位。

火山引擎RTC

火山引擎实时音视频 RTC 是字节跳动旗下的企业级音视频通信服务,依托抖音、飞书等国民级应用的技术沉淀,提供全球范围内高质量、低延时的实时音视频通信能力,帮助开发者快速构建语音通话、视频通话、互动直播、转推直播等丰富的场景功能。

火山引擎实时音视频 RTC 是后起之秀,根据其官网文档资料,SDK 版本始于2021年,开始了商业化路程,但具体收入未有透露。

产品介绍:https://www.volcengine.com/product/veRTC

产品体系

  • 基础能力:语音通话、视频通话、互动直播、即时通讯IM。
  • 拓展能力:转推直播、实时信令、云端录制、屏幕共享、截图/切片、互动白板、美颜特效、实时语音识别等。
  • AI 能力:AI 音视频互动、AI 音视频互动嵌入式方案、AI+视频云。

火山引擎实时音视频 RTC 背靠字节,整体表现技术领先、场景覆盖全面。目前火山引擎更专注与 AI 与音视频互动的结合,如豆包的语音和视频通话。毕竟 RTC 早已进入存量市场,作为后来者抢夺市场成本过高。

阿里云ARTC

阿里云 ARTC 依托阿里云全球3200+节点及多年的音视频技术积累,提供高可用、高品质、超低延时的音视频通信服务,主要适用于直播互动、社交语聊、多人通话等场景。
阿里旗下钉钉在 2022 年 3 月收购了 RTC 厂商拍乐云Pano,补充钉钉及阿里的音视频产品能力。

产品介绍:https://www.aliyun.com/product/apsaravideo/live/interactlive

产品体系
阿里云 ARTC 是阿里媒体服务其中的一环,具体分类为:

  • 视频服务:实时音视频、视频直播、超低延时直播、视频点播、云导播台。
  • 媒体开发服务:音视频终端 SDK、音视频低代码开发
  • AI 服务:AI 实时互动。

另外,还包括媒体处理和内容生产方面的服务,也会有 RTC 能力在其中。

整体来说,阿里云 ARTC 在阿里的整个产品体系中不是特别突出,作为云基础设施的一个组成部分,其能力更多体现在钉钉的音视频产品能力上,具体收入贡献也未在媒体公开透露过。

RTC 厂商选择建议

国内 RTC 厂商的技术能力已经非常成熟,相对海外厂商来说也具有一定的领先优势,本文不做详细的技术对比,SDK 接入简单,只需注册一个账户即可免费体验相关的服务。

选择 RTC 厂商可以从两方面来看:

1、中大型企业:单从技术能力来说,尤其是对于声网和即构科技这样拥有几百人的专业音视频工程师团队,技术需求基本都能实现。更多的是考虑商务方面和厂商锁定的情况,这也是为什么很多中大型企业会选择多个厂商进行接入。

2、小型企业(SMB)和个人开发者:个人的建议是结合自己的业务,亲自去测试一遍,这里面就会涉及到与厂商的技术支持人员、商务、售前等多个工种打交道,可以真实感受到其服务和技术水平。计费方式大同小异,根据不同分辨率按分钟计费,按需扣费;另外厂商还提供免费测试时长和各种优惠套餐,测试门槛和成本非常低。

以下是 5 大厂商简单归纳,仅供选择参考:

厂商

市场定位

核心优势

典型案例

声网

全球领先的对话式 AI 与实时音视频云服务商。

技术积累深厚、全球化布局、 对话式AI技术领先。

陌陌、新东方、Shopee等。

腾讯音视频(TRTC)

依托腾讯生态体系,提供一站式音视频解决方案

基础设施强大、生态整合能力强、一站式音视频服务。

腾讯会议、微信、王者荣耀等。

即构科技(ZEGO)

全球领先的实时音视频云服务商,专注于提供低延迟、高稳定性的音视频通信服务。

自研音视频引擎、连麦开创者、AI能力突出、世界级的专业服务。

酷狗音乐、映客直播、花椒直播等。

火山引擎RTC

提供全球范围内高质量、低延时的实时音视频通信能力。

拥有亿级DAU产品验证打磨的音视频最佳实践。

抖音、飞书会议、PICO等。

阿里云RTC

依托阿里云基础设施优势,为企业提供一站式音视频解决方案。

基础设施强大、电商优化、AI集成能力强。

淘宝直播、钉钉、虎牙直播等。

后记:IDC 报告里面还有部分厂商未有列举 ,下篇文章我们再来聊聊其它厂商和整个RTC生态,包括国外的服务商。

参考资料:
[1]视频云迎AI新浪潮,2025上半年同比增长8.9%,多模态大模型与出海业务成双引擎(IDC咨询公众号文章)

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐