Instagram算法的推荐池是如何构建和更新的

Instagram推荐池到底是怎么运作的?

说实话,我第一次认真研究Instagram推荐算法的时候,整个人都是懵的。官方说法永远那么玄乎,什么”相关性排序”、”个性化推荐”,听上去很高大上,但具体怎么操作的从来不说。后来看得多了、拆解得多了,才慢慢摸清了一点门道。今天想用最朴素的方式,把推荐池这个核心概念给大家讲清楚。

什么是推荐池?说人话就是

你可以把推荐池想象成一个超大的仓库。Instagram上每天有几亿人在发照片、发视频,这些内容不可能直接展示给你看——那就太乱了。算法干的第一件事,就是把所有内容先扔进这个”候选池”里。

这个池子不是简单地把所有内容混在一起。它其实是分层的,我后面会细说。重要的是,你看到的所有推荐内容,都是从这个池子里捞出来的。池子质量直接决定了你能看到什么,这就是为什么理解它很重要。

内容是怎么进池子的?

这个问题看似简单,其实门道很深。并不是你发了一条动态,就自动进入推荐池了。Instagram官方曾经透露过,他们有一道”预筛选”机制。

首先,你的账号得是个正常账号。如果你是新注册的,或者以前有过违规记录,系统对你的信任度自然就低。新账号的内容通常会进入一个”观察池”,只有表现好了,才会进入更大的推荐池。

然后是内容本身的审核。机器会自动检测你的内容有没有违规——暴力、色情、版权问题这些高压线就不用说了,还有一些比较模糊的,比如过度P图、虚假信息之类的,也会影响推荐资格。这一步是系统自动做的,速度很快,通常你发完没几分钟,系统就给你打好标签了。

对了,还有一个点很多人不知道。Instagram其实会对内容进行”质量评分”,这个评分是动态的。哪怕你以前发的内容质量很高,有一条突然违规了,你的整体账号权重也会受影响。这就好比银行给你的信用评分,突然逾期一次,信用就降了。

推荐池的分层结构

这部分是重点,也是最容易被忽略的。推荐池不是一个大池子,它其实是很多小池子组成的。

层级 名称 特点
第一层 亲密关系池 你互动最多的好友内容,优先展示
第二层 关注池 你关注的账号发布的内容
第三层 兴趣池 基于你历史行为推断你可能感兴趣的内容
第四层 探索池 跨领域、新账号、测试你兴趣边界的内容

这四个池子是并存的,但权重不同。Instagram的逻辑是,你最可能感兴趣的内容,应该来自你真正关心的人。所以亲密关系池的内容,在排序时会获得更高的基础分。

但问题是,随着你使用时间变长,”关注池”和”兴趣池”的占比会越来越大。因为你不可能每天都有新朋友发东西,但算法得保证你有内容可刷。这时候,你的历史行为数据就开始发挥关键作用了。

算法是怎么给内容打分的?

终于说到最核心的部分了。内容进了池子之后,得有个排序规则吧?不然几亿条内容,怎么决定哪条给你看?

Instagram用的是多因素加权模型。官方曾经公布过几个关键因素,我结合自己观察到的,说说我的理解。

互动信号是最直接的。点赞、评论、保存、分享,这些行为在算法眼里就是”我喜欢这条内容”的直接证据。保存和分享的权重比点赞高很多,因为保存说明内容有长期价值,分享说明你愿意把它推荐给朋友。

观看时长这个很有意思。如果你刷到一条视频,看了一半就划走了,说明内容没吸引你。如果看完了还重看几遍,那权重就高了。Instagram stories的完播率也是一个道理。

搜索和关注行为也很重要。比如你最近搜了很多”健身”相关的内容,系统就会默认你对健身有兴趣,开始往你的推荐池里加健身类内容。这个关联不是即时的,通常会有几天的延迟。

还有一个隐藏因素是内容新鲜度。同样的内容,早发和晚发待遇可能完全不同。系统倾向于推荐新发布的内容,但这不是说老内容没机会了——如果一条老内容突然获得大量互动,它是有可能”翻红”重新进入推荐池的。

推荐池是怎么实时更新的?

这个问题很多人好奇。推荐池是固定不变的吗?当然不是,它每时每刻都在变。

首先是新内容的涌入。每秒都有无数新内容被发布,这些内容通过审核后,会根据创作者的权重被分配到不同层级的池子里。新账号的内容初始权重低,但如果短时间内获得正向反馈,权重会快速上升。

然后是用户行为的实时反馈。你每一次点赞、每一次划走,都在改变你的用户画像。系统会根据这些即时反馈,动态调整从各个池子里捞内容的比例。比如你今天连续点赞了十条猫的视频,明天你的推荐池里猫的内容就会变多。

还有一个机制是“探索边缘”。系统会故意推荐一些你可能没接触过领域的内容,用来测试你的兴趣边界。这是为了防止推荐池变得过于单一,让你困在”信息茧房”里。

我们能做什么?

了解这些规则之后,对我们普通用户有什么用呢?其实还挺多的。

  • 如果你觉得推荐内容不理想,可以主动调整自己的行为。多点几次”不感兴趣”,系统会学得很快。
  • 关注一些新账号,给他们点赞,对他们的帮助很大。新账号最缺的就是初始互动。
  • 保存和分享比点赞更有价值,如果你真的觉得某条内容好,可以考虑保存下来。
  • 定期搜索一些你感兴趣的话题,相当于主动告诉系统你的偏好。

说白了,推荐池就是一个双向学习的过程。系统在学习你,你也可以通过行为引导系统。与其被动接受算法推送,不如主动一点,把它变成一个更趁手的工具。

这篇文章写得比较粗,很多细节其实还可以继续深挖。不过我觉得对于理解推荐池的整体逻辑,应该够用了。算法这东西,官方永远不会把所有细节公开,我们也只能通过观察和测试慢慢逼近真相。如果你有什么新的发现,欢迎交流。