猜一猜,刚刚过去的双十一,哪一家国产手机销量势头最猛?

图片

根据 Counterpoint 最新发布的数据,在华为、小米、荣耀销量纷纷下跌的同时,OPPO 销量同比增长了 12% 。

不知道你有没有这样的感受,过去一年手机行业硬件越来越卷不动了,真正把用户体验拉开差距的更多是系统、服务、生态。

在越来越个性化的系统推荐中我们也能看到一个趋势:下一代手机比拼的是理解能力

要让手机更聪明、让推荐更懂人,不只是大模型的事,更取决于底层的生态系统理解能力够不够强。

这也是在消费降级的时代 OPPO 销量持续火爆的背后逻辑之一。

比如最近他们就做了一件看似“很后台”的事:多模态特征生成平台

图片

这是一个让系统真正去“看懂图片、听懂音频、理解视频”的底层能力平台。

它并不是某一个具体的产品或者功能,但其实和我们每天在 OPPO 生态里刷到的内容、收到的推荐、看到的主题与广告体验,都有关系,间接影响着 OPPO 体验的天花板。

简单来说,这个平台让 OPPO 的推荐、搜索、广告等系统,第一次具备了真正意义上的多模态理解能力

OPPO 为什么要花大力气做这个平台?怎么做的?实际效果又如何?我们一起慢慢往下看。

一、为什么要做?

过去的推荐系统底层依赖的是标签和 ID 信息。

比如一张风景照,被压缩成“旅游-风景”的标签;一段搞笑的短视频,会被归类为“搞笑-宠物”。

图片

系统看不到颜色、情绪、风格,也理解不了语义细节。

给它一个简单的问题,比如用户因为一张夕阳图片的色调而保存壁纸时,它的兴趣标签应该是“摄影”还是“黄昏”?

系统根本分不清。

与此同时,图文、短视频、直播等等各种形态的内容正在爆炸式增长。

稀疏的 ID 信息不足以用来捕获这些内容中连续且丰富的语义。

为了突破这些瓶颈,业内共识的思路是用大模型做多模态理解,让系统真正看懂内容。

而 OPPO 更进一步。它不是让每条业务线各自搞一个模型,而是搭建了一个统一的多模态特征平台,能一次性服务应用商店、主题、广告、信息流、负一屏等多个场景。

真正“下沉”到业务和用户场景中,找到那些被 ID 标签所遮蔽的、真实的用户意图和丰富的内容价值。

这些内容的形态在 OPPO 内部大概是这样:

图片

二、怎么做?

跨业务的“特征仓库”

由于 OPPO 业务场景的广泛性,从应用商店、主题美化到信息流广告,每天有数以千万计的图文音视频内容生成。

团队构建了百万级广告标签、千万级信息流图文及亿级用户行为的多元化、大规模语料库。

图片

图片

并且打破了各业务线“烟囱式”的独立建设模式,建立了共享的“特征仓库”和“物料缓存”

也就是说,一条业务线加工好的优质特征,可以被其他业务线直接复用,极大地提升了资源利用效率和迭代速度。

基于平台能力构建的多模态特征湖:

图片

强大的模型工具库

团队直接在搜广推一站式算法平台 StarRec 基础上扩展多模态特征能力技术栈。

团队通过使用统一的数据 Scheme 与模型推理接口构建的标准化的“数据管道”,将各异构的多模态模型封装成统一的“预制件”,方便直接调用。

图片

包括 OEmbedding 、FusionAE 、CLIP_Adapter 等针对不同场景需求的工具。

其中不得不提的是 OPPO 自研的 OEmbedding 多模态表征模型

图片

OEmbedding 基于视觉语言模型( Qwen2-VL ),通过提示增强、分辨率优化、对比学习、模型融合优化,构建更本质、更通用、更强大的原生视觉语言表征能力。

图片

该模型目前在极具挑战性的图文表征国际权威评测 MMEB-v1 中,取得图像领域全球第五的成绩(截至 2025 年 11 月 20 日,前十名包括Meta、字节、阿里、腾讯等国内外顶尖团队模型)。

图片

多模态特征评估基准

多模态表征的难点一直是难评估。团队还观察到单点业务实验反馈慢,并且方案普适性难以衡量。

由此出发,团队构建了一个涵盖多场景、仅用多模态特征进行评估的基准集。这也为打造业务全域通用的多模态表征模型打下基础。

三、实际效果怎么样?

多模态特征生成平台累计已经服务了 5 个业务部门的共 13 个业务场景。成为OPPO技术基础设施中活跃的动脉,给一线业务用户体验提供了新的增长引擎。

实际效果如何?来看具体的数据。

竞价 PUSH 广告

在竞价 PUSH 广告场景,广告文本分词质量差和新广告冷启动难是常见的痛点。

团队实现了多种多模态特征与 ID 类特征的信息融合对齐方案,使用 CLIP 等模型生成图文增强表征,并通过两阶段方式嵌入 CTR 模型,成功将图片的“质感”和文案的“情绪”转化为排序模型能有效利用的信号。

上线后带来了非常可观的收益,广告主价值 ARPU ( Average Revenue Per User )累计提升 5.46% 。

主题商店搜索

你有没有在搜索主题的时候不知道怎么准确描述想要的风格?

在 OPPO 的生态系统下,用户不再需要输入精确的关键词,系统能根据浏览过的壁纸风格,理解用户的审美偏好,从而实现更精准的搜索结果。

这样“心有灵犀”的体验也让搜索应用率最终提升了 8.8% 。

广告召回

多模态特征还能让系统捞出更多被遗漏的优质广告,广告召回 badcase 率大幅下降 87.58% 。

四、关于未来:从“理解”到“生成”

“光荣在于平淡,艰巨在于漫长。”

OPPO 想做的并不是和谁比跑得快,而是致力于沉淀所有技术能力——从细微的模态感知,到复杂的特征融合,再到精准的表征对齐,系统化的封装为一个系统的算法工具库。

目的很简单,让产品更加理解用户。

对于下一步,他们正在积极探索生成式推荐

图片

意味着未来系统不仅可以根据用户偏好推荐已有的内容,还能为他即时生成全新的个性化内容。

我还挺同意 OPPO 坚守的主旨:“ Fast is slow, slow is fast ”。

没有一夜颠覆的传奇,有的只是对技术本质的深刻洞察,以及对“做正确之事”的长期坚持。

我们期待,当机器真正学会理解人类的丰富与复杂时,每一次推荐都将不再是流量的分配,而是一场真诚对话的开始。

同大家共勉。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐