【愚公系列】《人工智能70年》024-语音合成创造奇迹(科大讯飞,一名在校生书写的传奇)
《科大讯飞:从语音合成到全球AI领军者的成长之路》 本文聚焦中国语音技术领军企业科大讯飞的发展历程。作为首家由在校大学生创立并上市的中国AI企业,科大讯飞在创始人刘庆峰的带领下,从1999年起步于中文语音合成技术,逐步发展为涵盖语音识别、多语种处理等全产业链的AI巨头。文章详细介绍了科大讯飞的技术突破,包括连续14年蝉联国际语音合成大赛冠军,以及在多个国际语音技术赛事中取得的突破性成就。特别展现了
💎【行业认证·权威头衔】
✔ 华为云天团核心成员:特约编辑/云享专家/开发者专家/产品云测专家
✔ 开发者社区全满贯:CSDN博客&商业化双料专家/阿里云签约作者/腾讯云内容共创官/掘金&亚马逊&51CTO顶级博主
✔ 技术生态共建先锋:横跨鸿蒙、云计算、AI等前沿领域的技术布道者
🏆【荣誉殿堂】
🎖 连续三年蝉联"华为云十佳博主"(2022-2024)
🎖 双冠加冕CSDN"年度博客之星TOP2"(2022&2023)
🎖 十余个技术社区年度杰出贡献奖得主
📚【知识宝库】
覆盖全栈技术矩阵:
◾ 编程语言:.NET/Java/Python/Go/Node…
◾ 移动生态:HarmonyOS/iOS/Android/小程序
◾ 前沿领域:物联网/网络安全/大数据/AI/元宇宙
◾ 游戏开发:Unity3D引擎深度解析
文章目录
🚀前言
一系列 AI技术,让霍金创造了不开口也能说话的奇迹。
🚀一、科大讯飞,一名在校生书写的传奇
自20世纪90年代起,语音合成技术开始走向商业化应用。这一时期,全球两家重要的语音技术公司先后成立——1992年诞生于斯坦福大学的Nuance,以及1999年由中国科技大学走出的科大讯飞。两家企业均起步于语音合成技术,并逐渐发展成为全球语音产业的重要参与者。
一个值得思考的问题是,为何当时资源雄厚的大型IT企业未能迅速进入语音合成市场?一种可能的解释是,语音识别因其更高的技术挑战和战略价值,被视为必争之地,吸引了多数企业的研发重心。然而,语音识别并未很快实现商业化突破,反倒是从语音合成切入的创业公司,率先打开了市场局面。
从技术本质而言,并没有所谓的“简单技术”。任何技术深入挖掘都蕴藏着无限可能,各类技术之间也常存在密切联系,可在研究与商业层面相互转化和融合。语音合成与语音识别在技术与市场上本就紧密关联。Nuance与科大讯飞均以语音合成起步,逐步扩展至全产业链的语音处理服务。
关于Nuance,前文已简要提及。随着技术壁垒逐渐消失,依靠技术垄断确立市场地位的Nuance面临严峻挑战,业绩持续下滑,最终于2019年被微软收购。相比之下,科大讯飞作为后起之秀,发展势头强劲,更值得关注。
科大讯飞是中国最大的语音技术公司,也是国内第一家由在校大学生创办并成功上市的人工智能企业。创造这一传奇的关键人物是刘庆峰。
刘庆峰1973年出生于安徽泾县,17岁考入中国科技大学。19岁时因学业优异,破格进入校与国家智能计算机研究中心共建的“人机语音通信实验室”。22岁即担任国家863项目“KD系列汉语文语转换系统”的负责人。在学生阶段,他就提出了“基于LMA模型的语音合成器”“基于数字串外推的韵律构建模型”及“听感量化”等创新方法,其研发的中文语音合成系统在国内外权威评测中多项指标位居第一。他也因此被誉为“在中文语音合成技术研究中做出国际领先成果”的年轻学者。
原本他有望成为一名顶尖科学家,但在博士二年级,他选择了创业。1999年12月,他带领十余名同学共同创立科大讯飞。
公司最初的使命是“让计算机像人一样开口说话”。科大讯飞迅速将实验室成果转化为产品,语音合成模块陆续应用于MP3、电子书、导航设备、智能玩具等消费电子产品,华为、神州数码等企业也成为其语音组件客户。在各类语音应答场景中,合成语音愈发自然、逼真,甚至可模仿特定名人的音色,背后均有科大讯飞的技术支撑。
科大讯飞不仅在中文语音合成方面达到全球顶尖水平,还在多语种合成方面取得领先。自2006年至2019年,科大讯飞连续14年在国际权威语音合成大赛“暴风雪挑战赛”(Blizzard Challenge)中夺冠,参赛者包括卡耐基梅隆大学、爱丁堡大学、IBM研究院、微软亚洲研究院等全球顶尖机构。2016年赛事聚焦英语故事级语音合成,强调情感表现,难度极高,科大讯飞成为全球唯一使合成英语语音自然度超过普通人说话水平的机构。
在语音识别领域,科大讯飞同样表现出色。2021年11月,在国际低资源多语种语音识别竞赛OpenASR中,科大讯飞与中国科学技术大学联合团队在全部15个语种受限赛道和7个非受限赛道均获第一。同一年,科大讯飞在国际说话人角色分离挑战赛DIHARD-3中夺冠,是中国团队首次在该赛事折桂。2023年,科大讯飞与中科大团队在国际多通道语音分离与识别大赛CHiME上实现四连冠。
科大讯飞在中文语音识别持续领先的同时,也在英语识别领域积极挑战国际竞争对手,展现出令世界瞩目的全面语音技术能力。
更多推荐
所有评论(0)