X's New Algorithm Revealed: Likes Are Almost Worthless, This Action's Value Skyrockets 150 Times

深潮TechFlow

特邀专栏作者

2026-01-20 09:14

This article is about 3533 words, reading the full article takes about 6 minutes

The algorithm doesn't care about the content itself, only about what the content can make you do.

AI Summary

Expand

Core Viewpoint: X (formerly Twitter) has open-sourced its new recommendation algorithm, Phoenix. The core change is a shift from the old algorithm reliant on manually defined features to a model entirely driven by a large AI model (Grok transformer). It ranks content by predicting 15 types of user interaction behaviors, significantly altering the underlying logic of content distribution.
Key Elements:
1. Algorithm Architecture Innovation: The new Phoenix completely abandons manual feature engineering, instead using the Grok transformer model to predict and recommend content based on sequences of user historical behaviors (such as liking, replying, blocking).
2. Content Ranking Mechanism: The algorithm predicts the probability of 15 potential positive (e.g., reply, retweet) and negative (e.g., report, block) user behaviors towards content, then calculates a weighted sum to determine the final ranking score.
3. Creator Strategy Shift: Old tricks like "best time to post" become ineffective. Creators are encouraged to actively reply to comments (which carries extremely high weight), avoid triggering negative user behaviors like blocking, and are advised to place external links in comments rather than the main post body.
4. Transparency and Limitations: While the open-source release provides the complete system architecture and logic, it does not disclose specific weight parameters, the model's internal parameters, or training data, leaving a gap from "full transparency."

原文作者：David，深潮 TechFlow

1 月 20 日下午，X 开源了新版推荐算法。

Musk 配的回复挺有意思：「我们知道这算法很蠢，还需要大改，但至少你能看到我们在实时挣扎着改进。别的社交平台不敢这么干。」

这话有两层意思。一是承认算法有问题，二是拿「透明」当卖点。

这是 X 第二次开源算法。2023 年那版代码三年没更新，早就和实际系统脱节了。这次完全重写，核心模型从传统机器学习换成了 Grok transformer，官方说法是「彻底消除了手工特征工程」。

翻译成人话：以前的算法靠工程师手动调参数，现在让 AI 直接看你的互动历史来决定推不推你的内容。

对内容创作者来说，这意味着以前那套「几点发帖最好」「带什么 tag 涨粉」的玄学可能不灵了。

我们也翻了翻开源的 Github 仓库，在 AI 的辅助下，发现代码里确实藏着一些硬逻辑，值得扒一扒。

算法逻辑变化：从手工定义，到 AI 自动判断

先说清楚新旧版本的区别，不然后面的讨论容易混。

2023 年，推特开源的那版叫 Heavy Ranker，本质就是传统机器学习。工程师要手动定义几百个「特征」：这条帖子有没有图、发帖人粉丝多少、发布时间离现在多久、帖子里有没有链接...

然后给每个特征配权重，调来调去，看哪个组合效果好。

这次开源的新版叫 Phoenix，架构完全不同，你可以理解成一个更加依赖 AI 大模型的算法，核心是用 Grok 的 transformer 模型，和 ChatGPT、Claude 用的是同一类技术。

官方 README 文档里写得很直白：「We have eliminated every single hand-engineered feature。」

传统那种靠手工提取内容特征的规则，一个不剩，全砍了。

那现在，这个算法靠什么判断一个内容到底好不好？

答案是靠你的行为序列。你过去点赞过什么、回复过谁、在哪些帖子上停留超过两分钟、屏蔽过过哪类账号。Phoenix 把这些行为喂给 transformer，让模型自己学出规律并进行总结。

打个比方：旧算法像一张人工编写的评分表，每项打勾算分；

新算法像一个看过你所有浏览记录的 AI，直接猜你下一秒想看什么。

对创作者来说，这意味着两件事：

第一，以前那些「最佳发帖时间」「黄金标签」之类的技巧，参考价值变低了。因为模型不再看这些固定特征，它看的是每个用户的个人偏好。

第二，你的内容能不能被推出去，越来越取决于「看到你内容的人会怎么反应」。这个反应被量化成了 15 种行为预测，我们下一章细说。

算法在预测你的 15 种反应

Phoenix 拿到一条待推荐的帖子后，会预测当前用户看到这条内容可能产生的 15 种行为：

正向行为：如点赞、回复、转发、引用转发、点击帖子、点击作者主页、看完一半以上视频、展开图片、分享、停留超过一定时长、关注作者
负向行为：如点「不感兴趣」、Block 作者、Mute 作者、举报

每种行为对应一个预测概率。比如模型判断你有 60% 概率点赞这条帖子、5% 概率屏蔽这个作者等等。

然后算法做一件简单的事：把这些概率乘以各自的权重，加起来，得到一个总分。

公式长这样：

Final Score = Σ ( weight × P(action) )

正向行为的权重是正数，负向行为的权重是负数。

总分高的帖子排前面，低的沉下去。

跳出公式，其实说白了就是：

现在一个内容好不好，真的不由内容本身写的好不好决定了（当然可读性和利他性是传播的基础）；而是更多的取决于「这条内容会让你做出什么反应」。算法不在乎帖子本身的质量，它只在乎你的行为。

按这个思路想，极端情况下一条低俗但让人忍不住回复吐槽的帖子，得分可能比一条优质但没人互动的帖子更高。这套系统的底层逻辑或许就是如此。

不过，新开源版本的算法没公开具体行为权重的数值，但 2023 年那版公开过。

旧版参考：一次举报 = 738 次点赞

接下来我们可以扒一下 23 年的那组数据，虽然是旧的，但能帮你理解各种行为在算法眼里的「价值」差多少。

2023 年 4 月 5 日，X 确实在 GitHub 上公开过一组权重数据。

直接上数字：

翻译的再直白一些：

数据来源：旧版 GitHub twitter/the-algorithm-ml 仓库，点击可以查看原算法

几个数字值得细看。

第一，点赞几乎不值钱。 权重只有 0.5，是所有正向行为里最低的。算法眼里，一个点赞的价值约等于零。

第二，对话互动才是硬通货。 「你回复，作者又回复你」的权重是 75，是点赞的 150 倍。算法最想看到的不是单向的赞，而是来回的对话。

第三，负向反馈代价极高。 一次 Block 或 Mute（-74）需要 148 次点赞才能抵消。一次举报（-369）需要 738 次点赞。而且这些负分会累积到你的账号信誉分里，影响后续所有帖子的分发。

第四，视频完播率权重低得离谱。 只有 0.005，几乎可以忽略。这和抖音、TikTok 形成鲜明对比，那两个平台把完播率当核心指标。

官方在同一份文件里也写了：「The exact weights in the file can be adjusted at any time... Since then, we have periodically adjusted the weights to optimize for platform metrics.」

权重随时可能调，而且确实调过。

新版本没公开具体数值，但 README 里写的逻辑框架一样：正向加分，负向扣分，加权求和。

具体数字可能变了，但量级关系大概率还在。你回复别人的评论，比收到 100 个赞更有用。让人想 Block 你，比没人互动更糟糕。