AI手机的下一步,安卓阵营都在卷的新技能...
猜一猜,刚刚过去的双十一,哪一家国产手机销量势头最猛?根据 Counterpoint 最新发布的数据,在华为、小米、荣耀销量纷纷下跌的同时,OPPO 销量同比增长了。不知道你有没有这样的感受,过去一年手机行业硬件越来越卷不动了,真正把用户体验拉开差距的更多是系统、服务、生态。。要让手机更聪明、让推荐更懂人,不只是大模型的事,更取决于底层的生态系统理解能力够不够强。这也是在消费降级的时代 OPPO
猜一猜,刚刚过去的双十一,哪一家国产手机销量势头最猛?

根据 Counterpoint 最新发布的数据,在华为、小米、荣耀销量纷纷下跌的同时,OPPO 销量同比增长了 12% 。
不知道你有没有这样的感受,过去一年手机行业硬件越来越卷不动了,真正把用户体验拉开差距的更多是系统、服务、生态。
在越来越个性化的系统推荐中我们也能看到一个趋势:下一代手机比拼的是理解能力。
要让手机更聪明、让推荐更懂人,不只是大模型的事,更取决于底层的生态系统理解能力够不够强。
这也是在消费降级的时代 OPPO 销量持续火爆的背后逻辑之一。
比如最近他们就做了一件看似“很后台”的事:多模态特征生成平台。

这是一个让系统真正去“看懂图片、听懂音频、理解视频”的底层能力平台。
它并不是某一个具体的产品或者功能,但其实和我们每天在 OPPO 生态里刷到的内容、收到的推荐、看到的主题与广告体验,都有关系,间接影响着 OPPO 体验的天花板。
简单来说,这个平台让 OPPO 的推荐、搜索、广告等系统,第一次具备了真正意义上的多模态理解能力。
OPPO 为什么要花大力气做这个平台?怎么做的?实际效果又如何?我们一起慢慢往下看。
一、为什么要做?
过去的推荐系统底层依赖的是标签和 ID 信息。
比如一张风景照,被压缩成“旅游-风景”的标签;一段搞笑的短视频,会被归类为“搞笑-宠物”。

系统看不到颜色、情绪、风格,也理解不了语义细节。
给它一个简单的问题,比如用户因为一张夕阳图片的色调而保存壁纸时,它的兴趣标签应该是“摄影”还是“黄昏”?
系统根本分不清。
与此同时,图文、短视频、直播等等各种形态的内容正在爆炸式增长。
稀疏的 ID 信息不足以用来捕获这些内容中连续且丰富的语义。
为了突破这些瓶颈,业内共识的思路是用大模型做多模态理解,让系统真正看懂内容。
而 OPPO 更进一步。它不是让每条业务线各自搞一个模型,而是搭建了一个统一的多模态特征平台,能一次性服务应用商店、主题、广告、信息流、负一屏等多个场景。
真正“下沉”到业务和用户场景中,找到那些被 ID 标签所遮蔽的、真实的用户意图和丰富的内容价值。
这些内容的形态在 OPPO 内部大概是这样:

二、怎么做?
跨业务的“特征仓库”
由于 OPPO 业务场景的广泛性,从应用商店、主题美化到信息流广告,每天有数以千万计的图文音视频内容生成。
团队构建了百万级广告标签、千万级信息流图文及亿级用户行为的多元化、大规模语料库。


并且打破了各业务线“烟囱式”的独立建设模式,建立了共享的“特征仓库”和“物料缓存”。
也就是说,一条业务线加工好的优质特征,可以被其他业务线直接复用,极大地提升了资源利用效率和迭代速度。
基于平台能力构建的多模态特征湖:

强大的模型工具库
团队直接在搜广推一站式算法平台 StarRec 基础上扩展多模态特征能力技术栈。
团队通过使用统一的数据 Scheme 与模型推理接口构建的标准化的“数据管道”,将各异构的多模态模型封装成统一的“预制件”,方便直接调用。

包括 OEmbedding 、FusionAE 、CLIP_Adapter 等针对不同场景需求的工具。
其中不得不提的是 OPPO 自研的 OEmbedding 多模态表征模型。

OEmbedding 基于视觉语言模型( Qwen2-VL ),通过提示增强、分辨率优化、对比学习、模型融合优化,构建更本质、更通用、更强大的原生视觉语言表征能力。

该模型目前在极具挑战性的图文表征国际权威评测 MMEB-v1 中,取得图像领域全球第五的成绩(截至 2025 年 11 月 20 日,前十名包括Meta、字节、阿里、腾讯等国内外顶尖团队模型)。

多模态特征评估基准
多模态表征的难点一直是难评估。团队还观察到单点业务实验反馈慢,并且方案普适性难以衡量。
由此出发,团队构建了一个涵盖多场景、仅用多模态特征进行评估的基准集。这也为打造业务全域通用的多模态表征模型打下基础。
三、实际效果怎么样?
多模态特征生成平台累计已经服务了 5 个业务部门的共 13 个业务场景。成为OPPO技术基础设施中活跃的动脉,给一线业务用户体验提供了新的增长引擎。
实际效果如何?来看具体的数据。
竞价 PUSH 广告
在竞价 PUSH 广告场景,广告文本分词质量差和新广告冷启动难是常见的痛点。
团队实现了多种多模态特征与 ID 类特征的信息融合对齐方案,使用 CLIP 等模型生成图文增强表征,并通过两阶段方式嵌入 CTR 模型,成功将图片的“质感”和文案的“情绪”转化为排序模型能有效利用的信号。
上线后带来了非常可观的收益,广告主价值 ARPU ( Average Revenue Per User )累计提升 5.46% 。
主题商店搜索
你有没有在搜索主题的时候不知道怎么准确描述想要的风格?
在 OPPO 的生态系统下,用户不再需要输入精确的关键词,系统能根据浏览过的壁纸风格,理解用户的审美偏好,从而实现更精准的搜索结果。
这样“心有灵犀”的体验也让搜索应用率最终提升了 8.8% 。
广告召回
多模态特征还能让系统捞出更多被遗漏的优质广告,广告召回 badcase 率大幅下降 87.58% 。
四、关于未来:从“理解”到“生成”
“光荣在于平淡,艰巨在于漫长。”
OPPO 想做的并不是和谁比跑得快,而是致力于沉淀所有技术能力——从细微的模态感知,到复杂的特征融合,再到精准的表征对齐,系统化的封装为一个系统的算法工具库。
目的很简单,让产品更加理解用户。
对于下一步,他们正在积极探索生成式推荐。

意味着未来系统不仅可以根据用户偏好推荐已有的内容,还能为他即时生成全新的个性化内容。
我还挺同意 OPPO 坚守的主旨:“ Fast is slow, slow is fast ”。
没有一夜颠覆的传奇,有的只是对技术本质的深刻洞察,以及对“做正确之事”的长期坚持。
我们期待,当机器真正学会理解人类的丰富与复杂时,每一次推荐都将不再是流量的分配,而是一场真诚对话的开始。
同大家共勉。
更多推荐



所有评论(0)