AI手机的下一步，安卓阵营都在卷的新技能...

猜一猜，刚刚过去的双十一，哪一家国产手机销量势头最猛？根据 Counterpoint 最新发布的数据，在华为、小米、荣耀销量纷纷下跌的同时，OPPO 销量同比增长了。不知道你有没有这样的感受，过去一年手机行业硬件越来越卷不动了，真正把用户体验拉开差距的更多是系统、服务、生态。。要让手机更聪明、让推荐更懂人，不只是大模型的事，更取决于底层的生态系统理解能力够不够强。这也是在消费降级的时代 OPPO

Jack-Cui

992人浏览 · 2025-12-03 09:44:13

Jack-Cui · 2025-12-03 09:44:13 发布

猜一猜，刚刚过去的双十一，哪一家国产手机销量势头最猛？

根据 Counterpoint 最新发布的数据，在华为、小米、荣耀销量纷纷下跌的同时，OPPO 销量同比增长了 12% 。

不知道你有没有这样的感受，过去一年手机行业硬件越来越卷不动了，真正把用户体验拉开差距的更多是系统、服务、生态。

在越来越个性化的系统推荐中我们也能看到一个趋势：下一代手机比拼的是理解能力。

要让手机更聪明、让推荐更懂人，不只是大模型的事，更取决于底层的生态系统理解能力够不够强。

这也是在消费降级的时代 OPPO 销量持续火爆的背后逻辑之一。

比如最近他们就做了一件看似“很后台”的事：多模态特征生成平台。

这是一个让系统真正去“看懂图片、听懂音频、理解视频”的底层能力平台。

它并不是某一个具体的产品或者功能，但其实和我们每天在 OPPO 生态里刷到的内容、收到的推荐、看到的主题与广告体验，都有关系，间接影响着 OPPO 体验的天花板。

简单来说，这个平台让 OPPO 的推荐、搜索、广告等系统，第一次具备了真正意义上的多模态理解能力。

OPPO 为什么要花大力气做这个平台？怎么做的？实际效果又如何？我们一起慢慢往下看。

一、为什么要做？

过去的推荐系统底层依赖的是标签和 ID 信息。

比如一张风景照，被压缩成“旅游-风景”的标签；一段搞笑的短视频，会被归类为“搞笑-宠物”。

系统看不到颜色、情绪、风格，也理解不了语义细节。

给它一个简单的问题，比如用户因为一张夕阳图片的色调而保存壁纸时，它的兴趣标签应该是“摄影”还是“黄昏”？

系统根本分不清。

与此同时，图文、短视频、直播等等各种形态的内容正在爆炸式增长。

稀疏的 ID 信息不足以用来捕获这些内容中连续且丰富的语义。

为了突破这些瓶颈，业内共识的思路是用大模型做多模态理解，让系统真正看懂内容。

而 OPPO 更进一步。它不是让每条业务线各自搞一个模型，而是搭建了一个统一的多模态特征平台，能一次性服务应用商店、主题、广告、信息流、负一屏等多个场景。

真正“下沉”到业务和用户场景中，找到那些被 ID 标签所遮蔽的、真实的用户意图和丰富的内容价值。

这些内容的形态在 OPPO 内部大概是这样：

二、怎么做？

跨业务的“特征仓库”

由于 OPPO 业务场景的广泛性，从应用商店、主题美化到信息流广告，每天有数以千万计的图文音视频内容生成。

团队构建了百万级广告标签、千万级信息流图文及亿级用户行为的多元化、大规模语料库。

并且打破了各业务线“烟囱式”的独立建设模式，建立了共享的“特征仓库”和“物料缓存”。

也就是说，一条业务线加工好的优质特征，可以被其他业务线直接复用，极大地提升了资源利用效率和迭代速度。

基于平台能力构建的多模态特征湖：

强大的模型工具库

团队直接在搜广推一站式算法平台 StarRec 基础上扩展多模态特征能力技术栈。

团队通过使用统一的数据 Scheme 与模型推理接口构建的标准化的“数据管道”，将各异构的多模态模型封装成统一的“预制件”，方便直接调用。

包括 OEmbedding 、FusionAE 、CLIP_Adapter 等针对不同场景需求的工具。

其中不得不提的是 OPPO 自研的 OEmbedding 多模态表征模型。

OEmbedding 基于视觉语言模型( Qwen2-VL )，通过提示增强、分辨率优化、对比学习、模型融合优化，构建更本质、更通用、更强大的原生视觉语言表征能力。

该模型目前在极具挑战性的图文表征国际权威评测 MMEB-v1 中，取得图像领域全球第五的成绩（截至 2025 年 11 月 20 日，前十名包括Meta、字节、阿里、腾讯等国内外顶尖团队模型）。

多模态特征评估基准

多模态表征的难点一直是难评估。团队还观察到单点业务实验反馈慢，并且方案普适性难以衡量。

由此出发，团队构建了一个涵盖多场景、仅用多模态特征进行评估的基准集。这也为打造业务全域通用的多模态表征模型打下基础。

三、实际效果怎么样？

多模态特征生成平台累计已经服务了 5 个业务部门的共 13 个业务场景。成为OPPO技术基础设施中活跃的动脉，给一线业务用户体验提供了新的增长引擎。

实际效果如何？来看具体的数据。

竞价 PUSH 广告

在竞价 PUSH 广告场景，广告文本分词质量差和新广告冷启动难是常见的痛点。

团队实现了多种多模态特征与 ID 类特征的信息融合对齐方案，使用 CLIP 等模型生成图文增强表征，并通过两阶段方式嵌入 CTR 模型，成功将图片的“质感”和文案的“情绪”转化为排序模型能有效利用的信号。

上线后带来了非常可观的收益，广告主价值 ARPU （ Average Revenue Per User ）累计提升 5.46% 。

主题商店搜索

你有没有在搜索主题的时候不知道怎么准确描述想要的风格？

在 OPPO 的生态系统下，用户不再需要输入精确的关键词，系统能根据浏览过的壁纸风格，理解用户的审美偏好，从而实现更精准的搜索结果。

这样“心有灵犀”的体验也让搜索应用率最终提升了 8.8% 。

广告召回

多模态特征还能让系统捞出更多被遗漏的优质广告，广告召回 badcase 率大幅下降 87.58% 。

四、关于未来：从“理解”到“生成”

“光荣在于平淡，艰巨在于漫长。”

OPPO 想做的并不是和谁比跑得快，而是致力于沉淀所有技术能力——从细微的模态感知，到复杂的特征融合，再到精准的表征对齐，系统化的封装为一个系统的算法工具库。

目的很简单，让产品更加理解用户。

对于下一步，他们正在积极探索生成式推荐。

意味着未来系统不仅可以根据用户偏好推荐已有的内容，还能为他即时生成全新的个性化内容。

我还挺同意 OPPO 坚守的主旨：“ Fast is slow, slow is fast ”。

没有一夜颠覆的传奇，有的只是对技术本质的深刻洞察，以及对“做正确之事”的长期坚持。

我们期待，当机器真正学会理解人类的丰富与复杂时，每一次推荐都将不再是流量的分配，而是一场真诚对话的开始。

同大家共勉。

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

iwr -useb https://openclaw.ai/install.ps1 | iex 这里的iwr怎么安装？

摘要：iwr是PowerShell中Invoke-WebRequest的别名，用于发起HTTP/HTTPS请求。命令iwr -useb https://openclaw.ai/install.ps1|iex表示下载并执行远程脚本。在Windows系统中，iwr是PowerShell 3.0+的内置命令；Linux/macOS需安装PowerShell Core才能使用。执行前需验证来源可信性，并注