我把91在线的推荐逻辑拆给你看:其实一点都不玄学(不服你来试)
2026-02-26 18:57:48141
我把91在线的推荐逻辑拆给你看:其实一点都不玄学(不服你来试)

打开任何一款内容平台,看到的推荐结果看起来像魔法,但背后并不神秘。下面把“候选 — 计算 — 排序 — 结果”的链路拆开,照着做几次实验,你就能验证大部分结论。绝不高冷,只讲可观测、可复现的规律。
一、从大局看:推荐系统的三层关系
- 候选召回(Recall):把海量内容缩到几百、几千个备选项。常用方法有基于内容相似度的召回、基于用户历史行为的召回、基于协同过滤的召回、基于标签/话题的召回、以及热门/新鲜池。
- 初步打分(Scoring):给每个候选打一个初步分数,通常是CTR或观看时长预估模型输出的概率/值。
- 精排与再排序(Ranking / Re-ranking):把候选按预估值排序,并做多目标权衡(CTR、留存、活跃度、广告收益、内容多样性等),同时应用业务规则(屏蔽、地域限制、付费优先等)。
二、常见信号(谁影响推荐)
- 用户侧:历史点击、观看时长、收藏/点赞/评论、搜索词、设备/时段、停留/跳出率、社交关系(关注、私信互动)。
- 内容侧:标签/话题、时长、发布者权重、发布时序、标题与封面质量、已有人群的行为分布(比如该内容的完成率高)。
- 会话与上下文:当前会话内的连续行为(连续点播放、切换习惯)、入口场景(首页/搜索/频道)、运营活动(专题/榜单)。
- 平台指标:商业优先级(广告/付费)、内容安全策略、地域/法规限制。
三、模型与策略细节(让你看得懂模型为什么这么拍)
- 协同过滤 vs 内容相似:协同过滤擅长“口味相近的人也喜欢”,对长尾冷启动弱;内容相似擅长新内容冷启动,但容易陷入同质化。
- CTR与WatchTime的冲突:短视频平台常用多任务学习同时预测点击率和观看时长,排名时用线性或非线性加权合成目标。不同权重会直接改变推荐偏好(偏短偏长、偏激进偏保守)。
- 探索-利用平衡:为避免陷入回路,平台会注入“探索”机制(随机扰动、置信上界、上下文bandit等),短期牺牲CTR换长期多样性。
- 反馈回路与放大效应:被推荐越多,曝光就越大,行为信号越强,算法倾向重复推,这就是热门内容越热的机制。要打破需要人为插入多样性或新内容冷启动策略。
- 业务过滤层:有时并不是模型输出排第一就显示,运营、版权、敏感词等规则会覆盖模型结果。
四、你能做的实战检验(不服就试) 建议基于自己的账号和内容做以下对照实验(不要做破坏平台规则的操作):
- 实验一:操作冷启动
- 做法:新建几个账号,分别在不同时间段关注不同话题、持续观看某类内容或刻意跳开。记录各账号首页/推荐的差异。
- 期望:专注某类内容的账号首页相关内容占比明显上升;新账号初期更多展示热门与推荐位内容。
- 实验二:标题/封面调整
- 做法:对同一内容变更标题/封面(A/B),观察点击率与留存变化。
- 期望:标题吸引带来高点击,但如果完成率低,会快速被降权;高完成率的中等点击标题往往长期效果更好。
- 实验三:互动信号影响
- 做法:在自有内容上鼓励点赞/评论(合法引导),比较被推荐频次变化。
- 期望:点赞/评论对推荐有放大效果,尤其是早期暴露期内的互动密度更关键。
- 实验四:时间与频次敏感性
- 做法:在不同时间段(早/中/晚)发布内容或做行为,观察推荐差异。
- 期望:平台会根据活跃时段调整推荐策略,流量高峰期发内容更容易走量,但竞争也更激烈。
五、设计可量化的判定标准(怎么知道“对了”)
- 核心指标:曝光量、CTR(点击率)、完成率/平均观看时长、次日留存、转化率(如关注/付费)。
- 比较方法:用短期AB对照,持续7–14天,关注累计增量而非单日波动。对内容测试,至少保证每组有数百次曝光以降低噪声。
- 统计显著性:用基本的t检验或贝叶斯估计来判断差异,不要凭少量样本下定论。
六、常见误区与底层真相
- “热门就好”是表面真相:热门带来流量,但长期看平台更青睐能提高留存和商业价值的内容。
- “刷几次就一定上热”不是长久策略:短期异常行为能暂时触发流量,但一旦数据不真实,平台会快速惩罚。
- “单点优化胜过系统优化”通常不成立:标题、封面、首帧、互动策略、发布时间这些组合起来效果最好。
七、给内容创作者的实操建议(可直接照做)
- 把握前10秒:不论短视频还是长内容,首段决定点击后的完成率,进而影响系统给你更多推荐。
- 标签与描述要精确:方便召回模型把内容放进正确的备选池。
- 快速循环小实验:每周做一项小改进(封面/开头/互动CTA),并用数据判断是否保留。
- 建立长周期策略:短期流量和长期用户价值并重,持续产出、保持稳定互动比一次爆款更稳。

