第五章:计算机视觉-项目实战之推荐/广告系统

第三部分:精排算法

第一节:精排用来干什么? "我要细细的筛"、


一、精排在推荐系统中的定位:它解决的不是“找内容”,而是“做最优决策”

如果说:

  • 召回解决的是:在信息海洋里“先把可能感兴趣的都捞上来”

  • 粗排解决的是:在大桶候选里“先粗筛掉明显不重要的内容”

  • 精排(Ranking)要解决的就是:

在有限曝光位中,做「收益最大化」的最优排序决策

它是真正影响推荐质量、商业收益、用户体验的核心决策环节,位置如下:

海量候选(10^6+)
   ↓  召回(u2i/i2i/Graph/FM/双塔)
百级候选(10^2~10^3)
   ↓  粗排(轻量多任务)
几十候选(10~100)
   ↓  精排(核心排序决策)
最终Top K曝光(5~10)

一句话总结:

精排是“大脑级模型”,它不再过滤低质量内容,而是给剩下的优质候选“排座次”。它的目标不是“不错”,而是“最优”。


二、精排的核心目标:统一多个目标,输出一个最优曝光结果

精排需要在一个模型/一套分数体系内同时兼顾:

目标类别 典型指标 精排中承担的任务
短期目标 CTR / CVR / GMV 保证即时效果:点得多、买得多
长期目标 留存、复访率、用户活跃度 确保生态健康:不是靠骗点击续命
内容生态目标 多样性、新内容曝光率 避免系统陷入“信息黑洞”
约束目标 业务规则、曝光策略 广告比例、强运营内容等

因此精排模型的本质使命不是预测,而是:

在复杂目标之间做价值平衡,并最终最大化长期收益

而非像粗排一样:

“只要快速过滤并不犯大错”


三、为什么精排必须更复杂?——业务和数据都决定了它“不能简单”

精排面对的是更少的数据量但更高的数据价值

维度 粗排 精排
输入样本 100~1000 10~100
模型复杂度
时延要求 中(但仍需 ms 级)
目标 不犯错 做最优
关注问题 “相关性” “排序正确性 + 收益博弈 + 长短期平衡”

因此精排通常具有以下技术特征:

多任务模型(MTL)
多目标优化(Multi-Objective)
Pairwise / Listwise 排序学习
特征极其丰富(用户物品环境*场景)
使用更先进结构(DIN / DIEN / DeepFM / ESMM / DCN / Transformer / 强化学习 / 序列模型)

一句话:

粗排像“大筛子”,精排像“外科手术刀”。


四、精排模型和粗排最大的区别

项目 粗排模型 精排模型
核心方式 Pointwise + Multi-Task Pairwise / Listwise + 强 MTL
权衡目标 CTR&CVR(轻权衡) 收益 + 体验 + 长期目标(重权衡)
特征依赖 轻特征为主 行为序列、跨域特征、注意力特征大量引入
模型结构 多专家 / 双塔轻结构 DIN / DIEN / Transformer / RL / 序列模型为主
数据关注点 相关性 排序性(Rank)

通俗总结一句:

粗排判断“喜不喜欢”,精排判断“到底有多喜欢并第几名”。


五、这一节的重点记住 1 句话

精排是推荐系统的核心决策大脑——它通过复杂特征、更强模型和多目标平衡策略,给候选内容做“最优曝光排序”,本质是收益最大化问题,而不是简单预测问题。

到这一节为止,你应该明白:

精排负责什么
精排为什么至关重要
精排为什么必须比粗排更复杂
精排的本质是多目标决策,而不是单一预测

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐