刚刚!X 官方算法源码全公开小白保姆级深度解读:Grok 是怎么决定你看到什么的?-夜雨聆风

刚刚!X 官方算法源码全公开小白保姆级深度解读:Grok 是怎么决定你看到什么的?

⚠️ 免责声明：本文基于 X 官方开源代码库解读整理，旨在帮助理解算法原理。平台政策持续迭代中，具体运营效果因人而异，仅供参考学习。

🔥 刚刚！X 官方算法源码全公开

小白保姆级深度解读：Grok 是怎么决定你看到什么的？

2026年1月19日 · GitHub: xai-org/x-algorithm · 大白话拆解

🚨 刚刚发生的大事

就在几小时前，X（原 Twitter）正式在 GitHub 开源了他们的最新推荐算法！

这不是 2023 年那个旧版本，而是全新的 Grok AI 驱动版本——代码仓库才 3 颗星，你可能是第一批看到这篇解读的人！

📍 github.com/xai-org/x-algorithm

✦ ✦ ✦

⚡ TL;DR 速览：30秒看懂核心变化

📋 Cheatsheet：新算法 vs 旧算法

❌ 旧算法（2023）
手工设计特征 + 规则系统 + 多个独立模型

✅ 新算法（2026）
Grok Transformer 一个模型搞定一切，完全消除手工特征

🎯 一句话总结

Grok 会阅读你的每一次互动历史，然后预测你对每条帖子会做什么（点赞？回复？拉黑？），按预测分数排序推给你。

🧩 四大核心组件（记住这四个名字）：

🏠 Home Mixer · 总指挥 · 协调所有流程

⚡ Thunder · 关注流 · 你关注的人发的帖子

🔥 Phoenix · AI大脑 · Grok模型做检索+排序

🔧 Candidate Pipeline · 流水线框架 · 可复用的推荐管道

✦ ✦ ✦

一大白话：X 算法到底在干啥？

先别慌，咱们用点外卖来打个比方 👇

🍜 想象你打开美团点外卖…

美团怎么知道该给你推什么？

✦ 你之前点过什么（互动历史）

✦ 你收藏了哪些店（关注列表）

✦ 你给差评的店（屏蔽/拉黑）

✦ 附近还有什么新店（全网发现）

X 的 For You 信息流，原理一模一样！只不过”外卖”变成了”帖子”。

📐 核心公式（人话版）

你看到的帖子 = 关注的人发的 + AI 帮你发现的

（Thunder 提供） + （Phoenix 提供）

🔄 一条帖子是怎么出现在你首页的？

1你打开 X
系统开始给你”备菜”

2Thunder 去冰箱拿食材
把你关注的人最近发的帖子全拿出来

3Phoenix 去外面采购
用 AI 从全网找你可能喜欢的帖子

4过滤掉坏食材
删重复的、太老的、你拉黑的人发的…

5Grok 大厨来打分
预测你会对每道菜做什么（吃？扔？投诉？）

6按分数排序上菜
分高的帖子先让你看到

✦ ✦ ✦

二 Phoenix：算法的”AI 大脑”深度解析

Phoenix 是整个系统的灵魂，它干两件事：

🔍 功能1：检索（Two-Tower Model）

作用：从全网几十亿条帖子里，找出你可能感兴趣的那几千条

🏗️ 怎么实现的？双塔模型！

User Tower（用户塔）：把你的特征（关注谁、最近点赞啥）变成一串数字

Candidate Tower（候选塔）：把每条帖子也变成一串数字

匹配：用向量点积找最像的帖子（就像找”味道最像”的菜）

💡 打个比方：这就像相亲软件

把你变成一个”画像”（喜欢什么、讨厌什么），把帖子也变成”画像”，然后找最匹配的介绍给你。

📊 功能2：排序（Grok Transformer）

作用：对检索出来的帖子精排，决定谁排第一、谁排最后

🎯 Grok 会预测你对每条帖子的 15 种行为概率：

✅ 正向行为（分数加分）：

P(favorite) 点赞概率

P(reply) 回复概率

P(repost) 转发概率

P(quote) 引用转发概率

P(click) 点击详情概率

P(profile_click) 点击作者主页概率

P(video_view) 看视频概率

P(photo_expand) 展开图片概率

P(share) 分享概率

P(dwell) 停留阅读概率 ⭐

P(follow_author) 关注作者概率 ⭐

❌ 负向行为（分数减分）：

P(not_interested) 点”不感兴趣”概率

P(block_author) 拉黑作者概率 💀

P(mute_author) 静音作者概率

P(report) 举报概率 ☠️

📐 最终分数计算公式：

Final Score = Σ (weight × P(action))

正向行为权重为正，负向行为权重为负
如果 Grok 预测你大概率会拉黑这条帖子，它的分数会被压得很低

✦ ✦ ✦

三过滤器：哪些帖子会被”踢出局”？

在打分之前和之后，系统会用一堆过滤器把不该出现的帖子干掉：

🚧 打分前过滤（Pre-Scoring Filters）：

DropDuplicatesFilter · 删重复帖子

AgeFilter · 删太老的帖子

SelfpostFilter · 删你自己发的帖子（不会给你推你自己的）

AuthorSocialgraphFilter · 删你拉黑/静音的人的帖子

MutedKeywordFilter · 删包含你屏蔽关键词的帖子

PreviouslySeenPostsFilter · 删你已经看过的帖子

PreviouslyServedPostsFilter · 删这次会话已经推给你的帖子

IneligibleSubscriptionFilter · 删你没订阅看不了的付费内容

🛡️ 打分后过滤（Post-Selection Filters）：

VFFilter · 删已删除/垃圾/暴力/血腥等违规内容

DedupConversationFilter · 删同一个对话线程的重复分支

💡 运营启示：

如果你的帖子从来没被推荐过，先检查：

✦ 是不是被当成”太老”的帖子过滤了？

✦ 是不是触发了某些安全审核？

✦ 是不是被目标用户设置了关键词屏蔽？

✦ ✦ ✦

四官方透露的 5 个关键设计决策

这部分是 X 官方在 README 里直接写的，非常有价值：

🎯 决策1：完全消除手工特征

官方原话：“We have eliminated every single hand-engineered feature.”

人话翻译：以前算法是”工程师觉得什么重要就加什么特征”，现在全交给 Grok 自己学。

运营启示：没有”绝对的规则”了，Grok 会根据用户反馈动态调整什么重要。

🔒 决策2：候选隔离（Candidate Isolation）

官方原话：“Candidates cannot attend to each other—only to the user context.”

人话翻译：一条帖子的分数，不会因为”同一批里有哪些其他帖子”而变化。

运营启示：你的帖子是”独立打分”的，不用担心被同时期的爆款”压下去”。

🎲 决策3：基于哈希的嵌入

官方原话：“Both retrieval and ranking use multiple hash functions for embedding lookup.”

人话翻译：用哈希技术来快速查找相似内容，效率极高。

📊 决策4：多行为预测

官方原话：“Rather than predicting a single ‘relevance’ score, the model predicts probabilities for many actions.”

人话翻译：不是简单的”相关/不相关”，而是预测 15 种具体行为的概率。

运营启示：想被推荐，就要让 Grok 预测用户会对你做出正向行为（点赞、回复、转发…）

🧩 决策5：可组合的管道架构

官方原话：“Easy addition of new sources, hydrations, filters, and scorers.”

人话翻译：整个系统是模块化的，可以随时加新功能。

运营启示：算法会持续迭代，保持学习和观察。

✦ ✦ ✦

五给普通人的运营启示

基于这份源码，我们可以得出一些可执行的策略：

🎯 新算法下的核心原则

让 Grok 预测用户会对你的帖子做正向行为，而不是做负向行为

✅ 策略1：最大化「正向行为概率」

✦ 写能引发回复的内容（提问、观点争议、征求意见）

✦ 写能引发转发的内容（实用干货、独家爆料、情绪共鸣）

✦ 写能让人停留阅读的内容（P(dwell) 是关键指标！）

✦ 写能让人想关注你的内容（展示专业性、独特价值）

❌ 策略2：最小化「负向行为概率」

✦ 避免发让人想拉黑的内容（人身攻击、极端言论）

✦ 避免发让人想静音的内容（刷屏、重复内容）

✦ 避免发让人想举报的内容（违规、低质、垃圾）

✦ 避免发让人点不感兴趣的内容（与你账号定位不符的内容）

💡 策略3：理解「互动历史」的重要性

Grok 是根据用户的历史互动来预测的，这意味着：

✦ 和你互动过的用户，更容易再看到你的内容

✦ 回复别人的评论很重要——这会增加”双向互动记录”

✦ 持续发布内容，建立稳定的”互动用户群”

📌 策略4：关于「网外流量」的机会

Phoenix Retrieval 会从全网帮用户发现内容，这对小号是好消息：

✦ 即使没人关注你，只要内容好，也可能被 AI 推给潜在用户

✦ 关键是让你的内容”匹配”上某类用户的兴趣画像

✦ 专注垂直领域，让 AI 更容易把你归入某个”兴趣社区”

✦ ✦ ✦

六 SOP Checklist：发帖前检查清单

每次发帖前，用这个清单过一遍：

✅ 发帖前检查（提升正向行为概率）

☐ 这条帖子有没有引发回复的点？（问题、观点、征求意见）

☐ 这条帖子有没有转发价值？（对别人有用、能帮他表达观点）

☐ 这条帖子能不能让人停下来看完？（信息密度、故事性、悬念）

☐ 这条帖子符合我的账号定位吗？（避免让关注者”不感兴趣”）

☐ 如果是视频，前3秒吸引人吗？（P(video_view) 很重要）

☐ 如果有图片，会让人想点开看大图吗？（P(photo_expand)）

❌ 避免事项（降低负向行为概率）

☐ 避免人身攻击、极端言论（P(block) 飙升）

☐ 避免短时间内刷屏发相似内容（P(mute) 飙升）

☐ 避免发违规/低质/垃圾内容（P(report) 飙升 + VFFilter 过滤）

☐ 避免发与账号定位完全无关的内容（P(not_interested) 飙升）

☐ 避免使用被大量用户屏蔽的关键词（被 MutedKeywordFilter 过滤）

📊 发帖后检查

☐ 前30分钟是否在线回复评论？（增加互动历史权重）

☐ 有没有引导用户做正向行为？（点赞、转发、回复）

☐ 有没有关注数据表现，记录什么类型内容效果好？

🛡️ 长期账号维护

☐ 保持稳定的发帖频率（建立用户互动习惯）

☐ 保持垂直领域聚焦（让 AI 更容易给你打标签）

☐ 主动与粉丝互动（增加双向互动记录）

☐ 避免被大量用户拉黑/静音/举报（负向信号会累积）

✦ ✦ ✦

七一句话总结

新算法的本质：

Grok 在预测「用户会对你做什么」

让它预测到正向行为，你就赢了

“The Grok-based transformer does all the heavy lifting by understanding your engagement history.”

「Grok Transformer 通过理解你的互动历史来完成所有重活。」—— X 官方 README

💬 互动话题

你觉得这个新算法对小创作者是好事还是坏事？

欢迎在评论区分享你的看法！

📚 参考来源：

1. X 官方开源算法仓库 (2026年1月19日公开)

2. xAI Grok-1 开源模型

3. 仓库 README.md 文档

参考原文信息列表：

1. https://github.com/xai-org/x-algorithm

2. https://github.com/xai-org/grok-1

3. https://github.com/xai-org/x-algorithm/blob/main/phoenix/README.md

✨

— END —

刚刚!X 官方算法源码全公开小白保姆级深度解读:Grok 是怎么决定你看到什么的?

wang

猜你喜欢

评论抢沙发

wang

猜你喜欢

评论 抢沙发

评论抢沙发