人工智能AI算法推荐之番茄算法推荐证实其算法推荐规则技术解析·卓伊凡
人工智能AI算法推荐之番茄算法推荐证实其算法推荐规则技术解析·卓伊凡
人工智能AI算法推荐之番茄算法推荐证实其算法推荐规则技术解析·卓伊凡
说明:我讲的是“正式推荐期的技术推荐规则”(系统层如何做决策),不冒充番茄内部阈值。你可以用它来解释:为什么同题材有人爆量、有人断粮;为什么一段时间猛推后又冷;为什么“明明数据不差”却推不开。
1)正式推荐期的“总规则”:按**单位曝光收益(ROI)**分配流量
在正式推荐期,平台的本质决策是:
把有限曝光分给“单位曝光带来更高综合收益”的书
收益不是单一点击,而是多目标加权(读得久、读得深、会追更、会回访…)
所以“正式推荐规则”可以概括为三句话:
- 先捞出来(召回命中)
- 再比收益(排序打分)
- 最后控节奏(扩圈/降温/再评估)
2)硬规则 ①:先过“可推荐资格”闸门(Eligibility / Supply Governance)
正式推荐前,系统会先判断作品是否进入“可被推荐的供给池”:
- 合规/风控:疑似搬运、AI批量、异常行为、敏感风险 → 可能不下架但降权/隔离数据(你体感就是“不给量”)。
- 供给侧治理:新书池、连载池、完结池、活动池、扶持池分开管理,每个池有自己的预算与上限(不是所有书在同一个赛道抢曝光)。
这一步的技术含义:
很多“正式推荐期没量”,不是排序输,而是压根没进主分发池(或进了但被限额)。
3)硬规则 ②:多路召回决定“你有没有资格进入候选集”(Recall Rules)
正式推荐的第一道天花板是:召回层能不能捞到你。
召回做的事是从海量书里快速捞出几百/几千本候选,典型会多路并行:协同过滤、向量召回、标签倒排等
召回层的技术规则(你能感知的)
- 题材/标签一致性越高 → 倒排召回越稳
- 早期读者越“纯”(同一类人爱看)→ 协同过滤/图召回越容易把你推给同类
- 文本与行为表征越清晰 → 向量召回(ANN)越容易命中相似人群
如果你正式期“偶尔有量、但不稳定”,常见就是:
召回命中不稳(今天进候选、明天进不去),所以曝光忽上忽下。
4)硬规则 ③:排序不是看“好不好”,而是看“多目标综合分”(Ranking Rules)
字节系公开谈过:推荐模型会拟合用户满意度函数,点击率、阅读时间、互动等都可量化进入目标。
正式推荐期基本一定是多目标排序(Multi-objective Ranking):
常见目标(对小说最关键的几个):
- 开读概率(点进/开始读)
- 有效阅读时长(扣除后台、挂机)
- 续读/下一章点击(读深)
- 追更/书架(长期)
- 回访/次日留存贡献(更长期)
系统会用多任务学习或多模型融合,最后形成一个综合打分(概念式):

正式推荐期最关键的技术规则之一:
只会“标题党点开”但读不下去,在精排里会输;
能让人连续读、追更、回访的书,才有持续扩量的基础。
5)硬规则 ④:重排要满足“列表级体验约束”(Re-ranking Rules)
即使你单本得分高,也可能在最终列表里被“打散”。
因为推荐系统最后一层通常是重排,它要处理列表级目标:多样性、去重、探索插入、治理约束等。重排在多阶段推荐系统里被认为对体验非常关键。
你会体感到:
- 同题材不会给你无限堆屏
- 同作者/同风格会被打散
- 系统会插入探索项(你被顶下去并不一定是你差,而是“列表要多样”)
6)硬规则 ⑤:流量是“分层试投 + 扩圈 + 降温”的节奏控制(Traffic Pacing Rules)
正式推荐期不是匀速给量,而是在线学习式调度:
- 先在最匹配人群里加量(收益最高处先吃满)
- 再向相邻人群扩圈(检验泛化)
- 边际收益下降就降温(把预算给别的书)
- 后续章节强,再触发二次扩量
这也解释了知乎作者常说的“正式期有不同区间:首秀—冷却—再推”这种体感分段。
7)硬规则 ⑥:数据清洗与反作弊会“决定你数据算不算数”(Data & Anti-fraud Rules)
正式推荐期里,系统对行为数据会做“有效性过滤”:
- 有效时长:去除后台、挂机、异常停留
- 异常序列:过于机械的点击/翻页节律
- 设备/IP 关联:可疑流量可能不入模或触发限额
所以你会看到一种很典型的现象:
“我感觉有人在读,但推荐就是起不来”
可能原因是:系统把那部分行为当噪声,不给你加权。
8)“正式推荐期技术推荐规则”总结成一张“判定链”
把它记成一条链就行:
资格池(能不能推)
→ 召回命中(能不能进候选)
→ 多目标精排(能不能打赢同场)
→ 重排约束(能不能稳定上屏)
→ 调度节奏(给多少、给谁、给多久)
→ 风控清洗(数据算不算)
更多推荐



所有评论(0)