【第五章:计算机视觉-项目实战之推荐/广告系统】3.精排算法-(1)精排用来干什么? “我要细细的筛“
精排是推荐系统的核心决策环节,负责对粗筛后的优质内容进行最优排序。其核心目标是在CTR、CVR等短期指标和留存率、多样性等长期目标之间取得平衡,实现收益最大化。与粗排不同,精排采用更复杂的模型(如Transformer、强化学习等),处理更丰富的行为序列特征,通过Pairwise/Listwise排序学习进行精细决策。精排的本质是价值平衡而非简单预测,直接决定推荐质量和商业收益,是推荐系统的大脑级
第五章:计算机视觉-项目实战之推荐/广告系统
第三部分:精排算法
第一节:精排用来干什么? "我要细细的筛"、
一、精排在推荐系统中的定位:它解决的不是“找内容”,而是“做最优决策”
如果说:
-
召回解决的是:在信息海洋里“先把可能感兴趣的都捞上来”
-
粗排解决的是:在大桶候选里“先粗筛掉明显不重要的内容”
-
精排(Ranking)要解决的就是:
在有限曝光位中,做「收益最大化」的最优排序决策
它是真正影响推荐质量、商业收益、用户体验的核心决策环节,位置如下:
海量候选(10^6+)
↓ 召回(u2i/i2i/Graph/FM/双塔)
百级候选(10^2~10^3)
↓ 粗排(轻量多任务)
几十候选(10~100)
↓ 精排(核心排序决策)
最终Top K曝光(5~10)
一句话总结:
精排是“大脑级模型”,它不再过滤低质量内容,而是给剩下的优质候选“排座次”。它的目标不是“不错”,而是“最优”。
二、精排的核心目标:统一多个目标,输出一个最优曝光结果
精排需要在一个模型/一套分数体系内同时兼顾:
| 目标类别 | 典型指标 | 精排中承担的任务 |
|---|---|---|
| 短期目标 | CTR / CVR / GMV | 保证即时效果:点得多、买得多 |
| 长期目标 | 留存、复访率、用户活跃度 | 确保生态健康:不是靠骗点击续命 |
| 内容生态目标 | 多样性、新内容曝光率 | 避免系统陷入“信息黑洞” |
| 约束目标 | 业务规则、曝光策略 | 广告比例、强运营内容等 |
因此精排模型的本质使命不是预测,而是:
在复杂目标之间做价值平衡,并最终最大化长期收益
而非像粗排一样:
“只要快速过滤并不犯大错”
三、为什么精排必须更复杂?——业务和数据都决定了它“不能简单”
精排面对的是更少的数据量但更高的数据价值:
| 维度 | 粗排 | 精排 |
|---|---|---|
| 输入样本 | 100~1000 | 10~100 |
| 模型复杂度 | 中 | 高 |
| 时延要求 | 低 | 中(但仍需 ms 级) |
| 目标 | 不犯错 | 做最优 |
| 关注问题 | “相关性” | “排序正确性 + 收益博弈 + 长短期平衡” |
因此精排通常具有以下技术特征:
多任务模型(MTL)
多目标优化(Multi-Objective)
Pairwise / Listwise 排序学习
特征极其丰富(用户物品环境*场景)
使用更先进结构(DIN / DIEN / DeepFM / ESMM / DCN / Transformer / 强化学习 / 序列模型)
一句话:
粗排像“大筛子”,精排像“外科手术刀”。
四、精排模型和粗排最大的区别
| 项目 | 粗排模型 | 精排模型 |
|---|---|---|
| 核心方式 | Pointwise + Multi-Task | Pairwise / Listwise + 强 MTL |
| 权衡目标 | CTR&CVR(轻权衡) | 收益 + 体验 + 长期目标(重权衡) |
| 特征依赖 | 轻特征为主 | 行为序列、跨域特征、注意力特征大量引入 |
| 模型结构 | 多专家 / 双塔轻结构 | DIN / DIEN / Transformer / RL / 序列模型为主 |
| 数据关注点 | 相关性 | 排序性(Rank) |
通俗总结一句:
粗排判断“喜不喜欢”,精排判断“到底有多喜欢并第几名”。
五、这一节的重点记住 1 句话
精排是推荐系统的核心决策大脑——它通过复杂特征、更强模型和多目标平衡策略,给候选内容做“最优曝光排序”,本质是收益最大化问题,而不是简单预测问题。
到这一节为止,你应该明白:
精排负责什么
精排为什么至关重要
精排为什么必须比粗排更复杂
精排的本质是多目标决策,而不是单一预测
更多推荐



所有评论(0)