X新演算法曝光：按讚幾乎不值錢，這個行為價值翻150倍

深潮TechFlow

特邀专栏作者

2026-01-20 09:14

本文約3533字，閱讀全文需要約6分鐘

演算法不關心內容本身，只關心內容能讓你做什麼。

AI總結

展開

核心觀點：X（原推特）開源新版推薦演算法Phoenix，其核心變化是從依賴人工定義特徵的舊演算法轉向完全由AI大模型（Grok transformer）驅動的模式，透過預測使用者的15種互動行為來排序內容，這顯著改變了內容分發的底層邏輯。
關鍵要素：
1. 演算法架構革新：新版Phoenix徹底摒棄了手工特徵工程，轉而使用Grok transformer模型，依據使用者歷史行為序列（如按讚、回覆、封鎖）來預測和推薦內容。
2. 內容排序機制：演算法透過預測使用者對內容可能產生的15種正向（如回覆、轉發）和負向（如檢舉、封鎖）行為機率，加權求和得出總分以決定內容排序。
3. 創作者策略變化：舊版「最佳發文時間」等技巧失效，鼓勵創作者積極回覆評論（權重極高），避免引發使用者封鎖等負向行為，並建議將外鏈放在評論區而非正文。
4. 透明度與侷限：此次開源提供了完整的系統架構和邏輯，但未公開具體的權重參數、模型內部參數及訓練數據，距離「完全透明」仍有距離。

原文作者：David，深潮 TechFlow

1 月 20 日下午，X 開源了新版推薦演算法。

Musk 配的回覆挺有意思：「我們知道這演算法很蠢，還需要大改，但至少你能看到我們在實時掙扎著改進。別的社交平台不敢這麼幹。」

這話有兩層意思。一是承認演算法有問題，二是拿「透明」當賣點。

這是 X 第二次開源演算法。2023 年那版程式碼三年沒更新，早就和實際系統脫節了。這次完全重寫，核心模型從傳統機器學習換成了 Grok transformer，官方說法是「徹底消除了手工特徵工程」。

翻譯成人話：以前的演算法靠工程師手動調參數，現在讓 AI 直接看你的互動歷史來決定推不推你的內容。

對內容創作者來說，這意味著以前那套「幾點發文最好」「帶什麼 tag 漲粉」的玄學可能不靈了。

我們也翻了翻開源的 Github 倉庫，在 AI 的輔助下，發現程式碼裡確實藏著一些硬邏輯，值得扒一扒。

演算法邏輯變化：從手工定義，到 AI 自動判斷

先說清楚新舊版本的區別，不然後面的討論容易混。

2023 年，推特開源的那版叫 Heavy Ranker，本質就是傳統機器學習。工程師要手動定義幾百個「特徵」：這則貼文有沒有圖、發文人粉絲多少、發佈時間離現在多久、貼文裡有沒有連結...

然後給每個特徵配權重，調來調去，看哪個組合效果好。

這次開源的新版叫 Phoenix，架構完全不同，你可以理解成一個更加依賴 AI 大模型的演算法，核心是用 Grok 的 transformer 模型，和 ChatGPT、Claude 用的是同一類技術。

官方 README 文件裡寫得很直白：「We have eliminated every single hand-engineered feature。」

傳統那種靠手工提取內容特徵的規則，一個不剩，全砍了。

那現在，這個演算法靠什麼判斷一個內容到底好不好？

答案是靠你的行為序列。你過去按讚過什麼、回覆過誰、在哪些貼文上停留超過兩分鐘、封鎖過哪類帳號。Phoenix 把這些行為餵給 transformer，讓模型自己學出規律並進行總結。

打個比方：舊演算法像一張人工編寫的評分表，每項打勾算分；

新演算法像一個看過你所有瀏覽記錄的 AI，直接猜你下一秒想看什麼。

對創作者來說，這意味著兩件事：

第一，以前那些「最佳發文時間」「黃金標籤」之類的技巧，參考價值變低了。因為模型不再看這些固定特徵，它看的是每個用戶的個人偏好。

第二，你的內容能不能被推出去，越來越取決於「看到你內容的人會怎麼反應」。這個反應被量化成了 15 種行為預測，我們下一章細說。

演算法在預測你的 15 種反應

Phoenix 拿到一則待推薦的貼文後，會預測當前用戶看到這則內容可能產生的 15 種行為：

正向行為：如按讚、回覆、轉發、引用轉發、點擊貼文、點擊作者主頁、看完一半以上影片、展開圖片、分享、停留超過一定時長、關注作者
負向行為：如點「不感興趣」、Block 作者、Mute 作者、檢舉

每種行為對應一個預測機率。比如模型判斷你有 60% 機率按讚這則貼文、5% 機率封鎖這個作者等等。

然後演算法做一件簡單的事：把這些機率乘以各自的權重，加起來，得到一個總分。

公式長這樣：

Final Score = Σ ( weight × P(action) )

正向行為的權重是正數，負向行為的權重是負數。

總分高的貼文排前面，低的沉下去。

跳出公式，其實說白了就是：

現在一個內容好不好，真的不由內容本身寫的好不好決定了（當然可讀性和利他性是傳播的基礎）；而是更多的取決於「這則內容會讓你做出什麼反應」。演算法不在乎貼文本身的品質，它只在乎你的行為。

按這個思路想，極端情況下一個低俗但讓人忍不住回覆吐槽的貼文，得分可能比一個優質但沒人互動的貼文更高。這套系統的底層邏輯或許就是如此。

不過，新開源版本的演算法沒公開具體行為權重的數值，但 2023 年那版公開過。

舊版參考：一次檢舉 = 738 次按讚

接下來我們可以扒一下 23 年的那組數據，雖然是舊的，但能幫你理解各種行為在演算法眼裡的「價值」差多少。

2023 年 4 月 5 日，X 確實在 GitHub 上公開過一組權重數據。

直接上數字：

翻譯的再直白一些：

數據來源：舊版 GitHub twitter/the-algorithm-ml 倉庫，點擊可以查看原演算法

幾個數字值得細看。

第一，按讚幾乎不值錢。 權重只有 0.5，是所有正向行為裡最低的。演算法眼裡，一個按讚的價值約等於零。

第二，對話互動才是硬通貨。 「你回覆，作者又回覆你」的權重是 75，是按讚的 150 倍。演算法最想看到的不是單向的讚，而是來回的對話。

第三，負向反饋代價極高。 一次 Block 或 Mute（-74）需要 148 次按讚才能抵消。一次檢舉（-369）需要 738 次按讚。而且這些負分會累積到你的帳號信譽分裡，影響後續所有貼文的分發。

第四，影片完播率權重低得離譜。 只有 0.005，幾乎可以忽略。這和抖音、TikTok 形成鮮明對比，那兩個平台把完播率當核心指標。

官方在同一份文件裡也寫了：「The exact weights in the file can be adjusted at any time... Since then, we have periodically adjusted the weights to optimize for platform metrics.」

權重隨時可能調，而且確實調過。

新版本沒公開具體數值，但 README 裡寫的邏輯框架一樣：正向加分，負向扣分，加權求和。

具體數字可能變了，但量級關係大概率還在。你回覆別人的評論，比收到 100 個讚更有用。讓人想 Block 你，比沒人互動更糟糕。