乐于分享
好东西不私藏

我读完X算法源码,发现点赞根本不重要

我读完X算法源码,发现点赞根本不重要

1月11日,马斯克在X平台上发了一条帖子,宣布将在7天内开源X平台全新的推荐算法。他还承诺,此后每4周重复一次开源更新,并附上全面的开发者说明。

今天,马斯克兑现了这个承诺。

X平台工程团队今天正式宣布,全新的X算法已经开源。这套算法采用了与xAI旗下Grok模型相同的Transformer架构,代码已发布在GitHub上。

我用工具把这份代码仔细分析了一遍。看完之后,我发现了一个核心结论。

X的推荐系统,本质上是一场概率游戏。

系统并不直接判断你的内容好不好。它做的事情,是预测用户看到你这条内容之后,会不会执行某个动作。比如点赞,比如转发,比如回复。

每一个动作,系统都会给它分配一个权重。然后把所有动作的概率乘以权重,加起来,得到一个总分。这个总分,决定了你的内容能不能被推荐。

理解了这个底层逻辑,我们就可以来拆解整个推荐流程了。

三道生死关卡

你的每一条内容,都要经过三道关卡。只有全部通过,才能出现在用户的信息流里。

第一关,叫检索。

这一关决定的是,你的内容能不能被看见。

系统用的是一个双塔模型。想象两座塔,左边那座塔代表用户,装着用户的兴趣和历史行为。右边那座塔代表你的内容。

系统会把你的内容转化成一个向量,然后计算这个向量和用户兴趣向量之间的距离。距离越近,匹配度越高,你就越有可能被选中。

这个过程,和热度没有关系。一条只有10个赞的内容,如果和某个用户的兴趣高度匹配,完全可能被优先推荐给他。

第二关,叫过滤。

这一关决定的是,你的内容会不会被删掉。

代码里有几个关键的过滤器。

第一个叫作者多样性过滤。如果用户的信息流里已经有了你的一条内容,你的第二条内容会被严重降权。这意味着,短时间内刷屏发帖是没有意义的,系统会强制去重。

第二个叫时间过滤。内容太旧,直接丢弃。

第三个叫社交图谱过滤。如果用户屏蔽了你,或者你们在社交关系上距离太远,也会被过滤掉。

第四个叫可见性过滤。包含暴力、仇恨言论的内容,会在最后一步被剔除。

第三关,叫排名。

这一关决定的是,你的内容能排到第几位。

系统会用一个基于Transformer架构的模型,独立计算每条内容的得分。这个模型会预测19种具体行为的概率。

在这些行为里,回复和转发的权重最高。这两个动作代表深度互动和传播意愿,系统会给它们分配很高的分数。

引用的权重次之。

点赞、视频播放、停留时间、点击主页、私信分享,这些行为的权重居中。

但有三个行为,权重是负的。拉黑、屏蔽、点击不感兴趣。一旦你的内容引发了这些行为,分数会被大幅扣减。

六条实战策略

理解了算法的运作方式,我们就可以制定针对性的策略了。

第一条策略,增加用户的停留时间和回复意愿。

代码里明确包含停留时间和回复得分这两个指标。

这意味着,你要避免发那种看完就结束的内容。用户扫一眼就划走,停留时间为零,回复概率为零,你的得分就会很低。

更好的做法是,发长内容或者连续的帖子串。用户读的时间越长,停留时间得分越高。

或者在内容里提出一个问题,抛出一个有争议的观点。用户一旦回复,你就获得了一个高权重的加分项。

第二条策略,用视觉元素诱导点击。

模型会预测图片展开得分和视频播放得分。

纯文字的内容,在这两个指标上天然是零分。所以,尽可能带上图片或视频。

而且,图片最好做成那种不点开就看不清细节的样式。长图、信息密集的图表、需要放大才能看清的内容,都能诱导用户执行点击动作。

第三条策略,避开负权重陷阱。

算法里,拉黑、屏蔽、举报、不感兴趣,这些行为都带有负权重。

这意味着,如果你的内容能获得100个赞,但同时导致1个人拉黑你,最终的加权得分很可能是负数。你会直接从推荐池里消失。

极端的争议性话题确实能带来大量回复,但也很容易带来拉黑。对算法来说,这是一场高风险的赌博。

第四条策略,用质量突破多样性惩罚。

作者多样性过滤器会限制同一个作者在一次推荐流中出现的次数。

这意味着,如果你在一小时内发了10条内容,系统可能只会取其中得分最高的那一条推荐给用户,其他的都被压制了。

与其分散火力发10条普通内容,不如集中精力发1条高质量内容。

第五条策略,保持内容的垂直一致性。

检索阶段用的是向量相似度匹配。

如果你的内容今天聊美食,明天聊时政,后天聊科技,你的账号向量就会变得模糊。系统在检索阶段很难把你精准匹配到任何一个用户群体,你可能在第一关就被淘汰。

更好的做法是,持续输出同一个垂直领域的内容。让你的账号向量变得纯粹,系统就能精准地把你匹配给对这个领域感兴趣的用户。

第六条策略,创造适合私信分享的内容。

私信分享得分是一个独立的预测指标。

什么样的内容会被私信分享?那些用户想给朋友看,但又不想公开转发的内容。

只有特定圈子才懂的梗,极其硬核的专业干货,带有某种私密性质的情感共鸣。这类内容很容易触发私信分享行为,而私信分享在算法里被视为一种超级点赞,代表极高的信任和推荐意愿。

算法眼中的完美内容

把上面的分析综合起来,我们就能勾勒出算法眼中的完美内容是什么样子。

在检索阶段,它的主题垂直聚焦,能精准命中目标用户的兴趣向量。

在过滤阶段,它是最近发布的,作者没有被用户屏蔽,内容没有违规。

在排名阶段,它带有一张需要点开才能看清的长图或者一段视频,能增加停留时间和点击概率。它的文案提出了一个好问题,能诱导用户回复。它的观点犀利但不至于让人反感到想拉黑。它的内容质量足够高,让很多人愿意通过私信把它分享给朋友。像针对AI模型写提示词一样写内容。你的输入是诱导互动,算法的输出是高分推荐。


如果觉得不错,随手点个赞、在看、转发三连吧。如果想第一时间收到推送,也可以给我个星标。谢谢你看我的文章,我们下次再见。

本站文章均为手工撰写未经允许谢绝转载:夜雨聆风 » 我读完X算法源码,发现点赞根本不重要

评论 抢沙发

7 + 7 =
  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
×
订阅图标按钮