乐于分享
好东西不私藏

刚刚!X 官方算法源码全公开小白保姆级深度解读:Grok 是怎么决定你看到什么的?

刚刚!X 官方算法源码全公开小白保姆级深度解读:Grok 是怎么决定你看到什么的?

⚠️ 免责声明:本文基于 X 官方开源代码库解读整理,旨在帮助理解算法原理。平台政策持续迭代中,具体运营效果因人而异,仅供参考学习。

🔥 刚刚!X 官方算法源码全公开

小白保姆级深度解读:Grok 是怎么决定你看到什么的?

2026年1月19日 · GitHub: xai-org/x-algorithm · 大白话拆解

🚨 刚刚发生的大事

就在几小时前,X(原 Twitter)正式在 GitHub 开源了他们的最新推荐算法

这不是 2023 年那个旧版本,而是全新的 Grok AI 驱动版本——代码仓库才 3 颗星,你可能是第一批看到这篇解读的人!

📍 github.com/xai-org/x-algorithm

✦ ✦ ✦

 TL;DR 速览:30秒看懂核心变化

📋 Cheatsheet:新算法 vs 旧算法

❌ 旧算法(2023)
手工设计特征 + 规则系统 + 多个独立模型

✅ 新算法(2026)
Grok Transformer 一个模型搞定一切,完全消除手工特征

🎯 一句话总结

Grok 会阅读你的每一次互动历史,然后预测你对每条帖子会做什么(点赞?回复?拉黑?),按预测分数排序推给你。

🧩 四大核心组件(记住这四个名字):

🏠 Home Mixer · 总指挥 · 协调所有流程

⚡ Thunder · 关注流 · 你关注的人发的帖子

🔥 Phoenix · AI大脑 · Grok模型做检索+排序

🔧 Candidate Pipeline · 流水线框架 · 可复用的推荐管道

✦ ✦ ✦

 大白话:X 算法到底在干啥?

先别慌,咱们用点外卖来打个比方 👇

🍜 想象你打开美团点外卖…

美团怎么知道该给你推什么?

✦ 你之前点过什么(互动历史

✦ 你收藏了哪些店(关注列表

✦ 你给差评的店(屏蔽/拉黑

✦ 附近还有什么新店(全网发现

X 的 For You 信息流,原理一模一样!只不过”外卖”变成了”帖子”。

📐 核心公式(人话版)

你看到的帖子 = 关注的人发的 + AI 帮你发现的

(Thunder 提供) + (Phoenix 提供)

🔄 一条帖子是怎么出现在你首页的?

1你打开 X
系统开始给你”备菜”

2Thunder 去冰箱拿食材
把你关注的人最近发的帖子全拿出来

3Phoenix 去外面采购
用 AI 从全网找你可能喜欢的帖子

4过滤掉坏食材
删重复的、太老的、你拉黑的人发的…

5Grok 大厨来打分
预测你会对每道菜做什么(吃?扔?投诉?)

6按分数排序上菜
分高的帖子先让你看到

✦ ✦ ✦

 Phoenix:算法的”AI 大脑”深度解析

Phoenix 是整个系统的灵魂,它干两件事:

🔍 功能1:检索(Two-Tower Model)

作用:从全网几十亿条帖子里,找出你可能感兴趣的那几千条

🏗️ 怎么实现的?双塔模型!

User Tower(用户塔):把你的特征(关注谁、最近点赞啥)变成一串数字

Candidate Tower(候选塔):把每条帖子也变成一串数字

匹配:用向量点积找最像的帖子(就像找”味道最像”的菜)

💡 打个比方:这就像相亲软件

把你变成一个”画像”(喜欢什么、讨厌什么),把帖子也变成”画像”,然后找最匹配的介绍给你。

📊 功能2:排序(Grok Transformer)

作用:对检索出来的帖子精排,决定谁排第一、谁排最后

🎯 Grok 会预测你对每条帖子的 15 种行为概率:

✅ 正向行为(分数加分):

P(favorite) 点赞概率

P(reply) 回复概率

P(repost) 转发概率

P(quote) 引用转发概率

P(click) 点击详情概率

P(profile_click) 点击作者主页概率

P(video_view) 看视频概率

P(photo_expand) 展开图片概率

P(share) 分享概率

P(dwell) 停留阅读概率 ⭐

P(follow_author) 关注作者概率 ⭐

❌ 负向行为(分数减分):

P(not_interested) 点”不感兴趣”概率

P(block_author) 拉黑作者概率 💀

P(mute_author) 静音作者概率

P(report) 举报概率 ☠️

📐 最终分数计算公式:

Final Score = Σ (weight × P(action))

正向行为权重为正,负向行为权重为负
如果 Grok 预测你大概率会拉黑这条帖子,它的分数会被压得很低

✦ ✦ ✦

 过滤器:哪些帖子会被”踢出局”?

在打分之前和之后,系统会用一堆过滤器把不该出现的帖子干掉:

🚧 打分前过滤(Pre-Scoring Filters):

DropDuplicatesFilter · 删重复帖子

AgeFilter · 删太老的帖子

SelfpostFilter · 删你自己发的帖子(不会给你推你自己的)

AuthorSocialgraphFilter · 删你拉黑/静音的人的帖子

MutedKeywordFilter · 删包含你屏蔽关键词的帖子

PreviouslySeenPostsFilter · 删你已经看过的帖子

PreviouslyServedPostsFilter · 删这次会话已经推给你的帖子

IneligibleSubscriptionFilter · 删你没订阅看不了的付费内容

🛡️ 打分后过滤(Post-Selection Filters):

VFFilter · 删已删除/垃圾/暴力/血腥等违规内容

DedupConversationFilter · 删同一个对话线程的重复分支

💡 运营启示:

如果你的帖子从来没被推荐过,先检查:

✦ 是不是被当成”太老”的帖子过滤了?

✦ 是不是触发了某些安全审核?

✦ 是不是被目标用户设置了关键词屏蔽?

✦ ✦ ✦

 官方透露的 5 个关键设计决策

这部分是 X 官方在 README 里直接写的,非常有价值:

🎯 决策1:完全消除手工特征

官方原话:“We have eliminated every single hand-engineered feature.”

人话翻译:以前算法是”工程师觉得什么重要就加什么特征”,现在全交给 Grok 自己学。

运营启示:没有”绝对的规则”了,Grok 会根据用户反馈动态调整什么重要。

🔒 决策2:候选隔离(Candidate Isolation)

官方原话:“Candidates cannot attend to each other—only to the user context.”

人话翻译:一条帖子的分数,不会因为”同一批里有哪些其他帖子”而变化。

运营启示:你的帖子是”独立打分”的,不用担心被同时期的爆款”压下去”。

🎲 决策3:基于哈希的嵌入

官方原话:“Both retrieval and ranking use multiple hash functions for embedding lookup.”

人话翻译:用哈希技术来快速查找相似内容,效率极高。

📊 决策4:多行为预测

官方原话:“Rather than predicting a single ‘relevance’ score, the model predicts probabilities for many actions.”

人话翻译:不是简单的”相关/不相关”,而是预测 15 种具体行为的概率。

运营启示:想被推荐,就要让 Grok 预测用户会对你做出正向行为(点赞、回复、转发…)

🧩 决策5:可组合的管道架构

官方原话:“Easy addition of new sources, hydrations, filters, and scorers.”

人话翻译:整个系统是模块化的,可以随时加新功能。

运营启示:算法会持续迭代,保持学习和观察。

✦ ✦ ✦

 给普通人的运营启示

基于这份源码,我们可以得出一些可执行的策略

🎯 新算法下的核心原则

让 Grok 预测用户会对你的帖子做正向行为,而不是做负向行为

✅ 策略1:最大化「正向行为概率」

✦ 写能引发回复的内容(提问、观点争议、征求意见)

✦ 写能引发转发的内容(实用干货、独家爆料、情绪共鸣)

✦ 写能让人停留阅读的内容(P(dwell) 是关键指标!)

✦ 写能让人想关注你的内容(展示专业性、独特价值)

❌ 策略2:最小化「负向行为概率」

✦ 避免发让人想拉黑的内容(人身攻击、极端言论)

✦ 避免发让人想静音的内容(刷屏、重复内容)

✦ 避免发让人想举报的内容(违规、低质、垃圾)

✦ 避免发让人点不感兴趣的内容(与你账号定位不符的内容)

💡 策略3:理解「互动历史」的重要性

Grok 是根据用户的历史互动来预测的,这意味着:

✦ 和你互动过的用户,更容易再看到你的内容

✦ 回复别人的评论很重要——这会增加”双向互动记录”

✦ 持续发布内容,建立稳定的”互动用户群”

📌 策略4:关于「网外流量」的机会

Phoenix Retrieval 会从全网帮用户发现内容,这对小号是好消息

✦ 即使没人关注你,只要内容好,也可能被 AI 推给潜在用户

✦ 关键是让你的内容”匹配”上某类用户的兴趣画像

✦ 专注垂直领域,让 AI 更容易把你归入某个”兴趣社区”

✦ ✦ ✦

 SOP Checklist:发帖前检查清单

每次发帖前,用这个清单过一遍:

✅ 发帖前检查(提升正向行为概率)

☐ 这条帖子有没有引发回复的点?(问题、观点、征求意见)

☐ 这条帖子有没有转发价值?(对别人有用、能帮他表达观点)

☐ 这条帖子能不能让人停下来看完?(信息密度、故事性、悬念)

☐ 这条帖子符合我的账号定位吗?(避免让关注者”不感兴趣”)

☐ 如果是视频,前3秒吸引人吗?(P(video_view) 很重要)

☐ 如果有图片,会让人想点开看大图吗?(P(photo_expand))

❌ 避免事项(降低负向行为概率)

☐ 避免人身攻击、极端言论(P(block) 飙升)

☐ 避免短时间内刷屏发相似内容(P(mute) 飙升)

☐ 避免发违规/低质/垃圾内容(P(report) 飙升 + VFFilter 过滤)

☐ 避免发与账号定位完全无关的内容(P(not_interested) 飙升)

☐ 避免使用被大量用户屏蔽的关键词(被 MutedKeywordFilter 过滤)

📊 发帖后检查

☐ 前30分钟是否在线回复评论?(增加互动历史权重)

☐ 有没有引导用户做正向行为?(点赞、转发、回复)

☐ 有没有关注数据表现,记录什么类型内容效果好?

🛡️ 长期账号维护

☐ 保持稳定的发帖频率(建立用户互动习惯)

☐ 保持垂直领域聚焦(让 AI 更容易给你打标签)

☐ 主动与粉丝互动(增加双向互动记录)

☐ 避免被大量用户拉黑/静音/举报(负向信号会累积

✦ ✦ ✦

 一句话总结

新算法的本质:

Grok 在预测「用户会对你做什么」

让它预测到正向行为,你就赢了

“The Grok-based transformer does all the heavy lifting by understanding your engagement history.”

「Grok Transformer 通过理解你的互动历史来完成所有重活。」—— X 官方 README

💬 互动话题

你觉得这个新算法对小创作者是好事还是坏事?

欢迎在评论区分享你的看法!

📚 参考来源:

1. X 官方开源算法仓库 (2026年1月19日公开)

2. xAI Grok-1 开源模型

3. 仓库 README.md 文档

参考原文信息列表:

1. https://github.com/xai-org/x-algorithm

2. https://github.com/xai-org/grok-1

3. https://github.com/xai-org/x-algorithm/blob/main/phoenix/README.md

— END —

本站文章均为手工撰写未经允许谢绝转载:夜雨聆风 » 刚刚!X 官方算法源码全公开小白保姆级深度解读:Grok 是怎么决定你看到什么的?

评论 抢沙发

3 + 8 =
  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
×
订阅图标按钮