人工智能AI算法推荐之番茄算法推荐证实其算法推荐规则技术解析·卓伊凡

卓伊凡

329人浏览 · 2025-12-27 11:20:33

卓伊凡 · 2025-12-27 11:20:33 发布

说明：我讲的是“正式推荐期的技术推荐规则”（系统层如何做决策），不冒充番茄内部阈值。你可以用它来解释：为什么同题材有人爆量、有人断粮；为什么一段时间猛推后又冷；为什么“明明数据不差”却推不开。

1）正式推荐期的“总规则”：按单位曝光收益（ROI）分配流量

在正式推荐期，平台的本质决策是：

把有限曝光分给“单位曝光带来更高综合收益”的书
收益不是单一点击，而是多目标加权（读得久、读得深、会追更、会回访…）

所以“正式推荐规则”可以概括为三句话：

先捞出来（召回命中）
再比收益（排序打分）
最后控节奏（扩圈/降温/再评估）

2）硬规则 ①：先过“可推荐资格”闸门（Eligibility / Supply Governance）

正式推荐前，系统会先判断作品是否进入“可被推荐的供给池”：

合规/风控：疑似搬运、AI批量、异常行为、敏感风险 → 可能不下架但降权/隔离数据（你体感就是“不给量”）。
供给侧治理：新书池、连载池、完结池、活动池、扶持池分开管理，每个池有自己的预算与上限（不是所有书在同一个赛道抢曝光）。

这一步的技术含义：

很多“正式推荐期没量”，不是排序输，而是压根没进主分发池（或进了但被限额）。

3）硬规则 ②：多路召回决定“你有没有资格进入候选集”（Recall Rules）

正式推荐的第一道天花板是：召回层能不能捞到你。
召回做的事是从海量书里快速捞出几百/几千本候选，典型会多路并行：协同过滤、向量召回、标签倒排等

召回层的技术规则（你能感知的）

题材/标签一致性越高 → 倒排召回越稳
早期读者越“纯”（同一类人爱看）→ 协同过滤/图召回越容易把你推给同类
文本与行为表征越清晰 → 向量召回（ANN）越容易命中相似人群

如果你正式期“偶尔有量、但不稳定”，常见就是：

召回命中不稳（今天进候选、明天进不去），所以曝光忽上忽下。

4）硬规则 ③：排序不是看“好不好”，而是看“多目标综合分”（Ranking Rules）

字节系公开谈过：推荐模型会拟合用户满意度函数，点击率、阅读时间、互动等都可量化进入目标。
正式推荐期基本一定是多目标排序（Multi-objective Ranking）：

常见目标（对小说最关键的几个）：

开读概率（点进/开始读）
有效阅读时长（扣除后台、挂机）
续读/下一章点击（读深）
追更/书架（长期）
回访/次日留存贡献（更长期）

系统会用多任务学习或多模型融合，最后形成一个综合打分（概念式）：

正式推荐期最关键的技术规则之一：

只会“标题党点开”但读不下去，在精排里会输；
能让人连续读、追更、回访的书，才有持续扩量的基础。

5）硬规则 ④：重排要满足“列表级体验约束”（Re-ranking Rules）

即使你单本得分高，也可能在最终列表里被“打散”。
因为推荐系统最后一层通常是重排，它要处理列表级目标：多样性、去重、探索插入、治理约束等。重排在多阶段推荐系统里被认为对体验非常关键。

你会体感到：

同题材不会给你无限堆屏
同作者/同风格会被打散
系统会插入探索项（你被顶下去并不一定是你差，而是“列表要多样”）

6）硬规则 ⑤：流量是“分层试投 + 扩圈 + 降温”的节奏控制（Traffic Pacing Rules）

正式推荐期不是匀速给量，而是在线学习式调度：

先在最匹配人群里加量（收益最高处先吃满）
再向相邻人群扩圈（检验泛化）
边际收益下降就降温（把预算给别的书）
后续章节强，再触发二次扩量

这也解释了知乎作者常说的“正式期有不同区间：首秀—冷却—再推”这种体感分段。

7）硬规则 ⑥：数据清洗与反作弊会“决定你数据算不算数”（Data & Anti-fraud Rules）

正式推荐期里，系统对行为数据会做“有效性过滤”：

有效时长：去除后台、挂机、异常停留
异常序列：过于机械的点击/翻页节律
设备/IP 关联：可疑流量可能不入模或触发限额

所以你会看到一种很典型的现象：

“我感觉有人在读，但推荐就是起不来”
可能原因是：系统把那部分行为当噪声，不给你加权。

8）“正式推荐期技术推荐规则”总结成一张“判定链”

把它记成一条链就行：

资格池（能不能推）
→ 召回命中（能不能进候选）
→ 多目标精排（能不能打赢同场）
→ 重排约束（能不能稳定上屏）
→ 调度节奏（给多少、给谁、给多久）
→ 风控清洗（数据算不算）

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

2025最新！专科生必看8个AI论文平台测评，毕业论文这样写轻松过关

2048 AI社区

根据大模型结构参数计算大模型总参数量

本文详细拆解了Transformer模型的参数量计算。以一个标准配置（d_model=512, 8头注意力,d_ff=2048）为例，单层Transformer包含：自注意力部分（Q/K/V和输出投影）共1,048,576参数，FFN部分（两个全连接层）共2,097,152参数，LayerNorm仅2,048参数。结果表明FFN占比约67%，是参数主要来源。扩展到BERT-base（d_model