人工智能AI算法推荐之番茄算法推荐证实其算法推荐规则技术解析·卓伊凡

说明:我讲的是“正式推荐期的技术推荐规则”(系统层如何做决策),不冒充番茄内部阈值。你可以用它来解释:为什么同题材有人爆量、有人断粮;为什么一段时间猛推后又冷;为什么“明明数据不差”却推不开。


1)正式推荐期的“总规则”:按**单位曝光收益(ROI)**分配流量

在正式推荐期,平台的本质决策是:

把有限曝光分给“单位曝光带来更高综合收益”的书
收益不是单一点击,而是多目标加权(读得久、读得深、会追更、会回访…)

所以“正式推荐规则”可以概括为三句话:

  1. 先捞出来(召回命中)
  2. 再比收益(排序打分)
  3. 最后控节奏(扩圈/降温/再评估)

2)硬规则 ①:先过“可推荐资格”闸门(Eligibility / Supply Governance)

正式推荐前,系统会先判断作品是否进入“可被推荐的供给池”:

  • 合规/风控:疑似搬运、AI批量、异常行为、敏感风险 → 可能不下架但降权/隔离数据(你体感就是“不给量”)。
  • 供给侧治理:新书池、连载池、完结池、活动池、扶持池分开管理,每个池有自己的预算与上限(不是所有书在同一个赛道抢曝光)。

这一步的技术含义:

很多“正式推荐期没量”,不是排序输,而是压根没进主分发池(或进了但被限额)。


3)硬规则 ②:多路召回决定“你有没有资格进入候选集”(Recall Rules)

正式推荐的第一道天花板是:召回层能不能捞到你
召回做的事是从海量书里快速捞出几百/几千本候选,典型会多路并行:协同过滤、向量召回、标签倒排等

召回层的技术规则(你能感知的)

  • 题材/标签一致性越高 → 倒排召回越稳
  • 早期读者越“纯”(同一类人爱看)→ 协同过滤/图召回越容易把你推给同类
  • 文本与行为表征越清晰 → 向量召回(ANN)越容易命中相似人群

如果你正式期“偶尔有量、但不稳定”,常见就是:

召回命中不稳(今天进候选、明天进不去),所以曝光忽上忽下。


4)硬规则 ③:排序不是看“好不好”,而是看“多目标综合分”(Ranking Rules)

字节系公开谈过:推荐模型会拟合用户满意度函数,点击率、阅读时间、互动等都可量化进入目标。
正式推荐期基本一定是多目标排序(Multi-objective Ranking):

常见目标(对小说最关键的几个):

  • 开读概率(点进/开始读)
  • 有效阅读时长(扣除后台、挂机)
  • 续读/下一章点击(读深)
  • 追更/书架(长期)
  • 回访/次日留存贡献(更长期)

系统会用多任务学习或多模型融合,最后形成一个综合打分(概念式):

正式推荐期最关键的技术规则之一:

只会“标题党点开”但读不下去,在精排里会输;
能让人连续读、追更、回访的书,才有持续扩量的基础。


5)硬规则 ④:重排要满足“列表级体验约束”(Re-ranking Rules)

即使你单本得分高,也可能在最终列表里被“打散”。
因为推荐系统最后一层通常是重排,它要处理列表级目标:多样性、去重、探索插入、治理约束等。重排在多阶段推荐系统里被认为对体验非常关键。

你会体感到:

  • 同题材不会给你无限堆屏
  • 同作者/同风格会被打散
  • 系统会插入探索项(你被顶下去并不一定是你差,而是“列表要多样”)

6)硬规则 ⑤:流量是“分层试投 + 扩圈 + 降温”的节奏控制(Traffic Pacing Rules)

正式推荐期不是匀速给量,而是在线学习式调度

  1. 先在最匹配人群里加量(收益最高处先吃满)
  2. 再向相邻人群扩圈(检验泛化)
  3. 边际收益下降就降温(把预算给别的书)
  4. 后续章节强,再触发二次扩量

这也解释了知乎作者常说的“正式期有不同区间:首秀—冷却—再推”这种体感分段。


7)硬规则 ⑥:数据清洗与反作弊会“决定你数据算不算数”(Data & Anti-fraud Rules)

正式推荐期里,系统对行为数据会做“有效性过滤”:

  • 有效时长:去除后台、挂机、异常停留
  • 异常序列:过于机械的点击/翻页节律
  • 设备/IP 关联:可疑流量可能不入模或触发限额

所以你会看到一种很典型的现象:

“我感觉有人在读,但推荐就是起不来”
可能原因是:系统把那部分行为当噪声,不给你加权。


8)“正式推荐期技术推荐规则”总结成一张“判定链”

把它记成一条链就行:

资格池(能不能推)
召回命中(能不能进候选)
多目标精排(能不能打赢同场)
重排约束(能不能稳定上屏)
调度节奏(给多少、给谁、给多久)
风控清洗(数据算不算)


Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐