BTC
ETH
HTX
SOL
BNB
查看行情
简中
繁中
English
日本語
한국어
ภาษาไทย
Tiếng Việt

X新演算法曝光:按讚幾乎不值錢,這個行為價值翻150倍

深潮TechFlow
特邀专栏作者
2026-01-20 09:14
本文約3533字,閱讀全文需要約6分鐘
演算法不關心內容本身,只關心內容能讓你做什麼。
AI總結
展開
  • 核心觀點:X(原推特)開源新版推薦演算法Phoenix,其核心變化是從依賴人工定義特徵的舊演算法轉向完全由AI大模型(Grok transformer)驅動的模式,透過預測使用者的15種互動行為來排序內容,這顯著改變了內容分發的底層邏輯。
  • 關鍵要素:
    1. 演算法架構革新:新版Phoenix徹底摒棄了手工特徵工程,轉而使用Grok transformer模型,依據使用者歷史行為序列(如按讚、回覆、封鎖)來預測和推薦內容。
    2. 內容排序機制:演算法透過預測使用者對內容可能產生的15種正向(如回覆、轉發)和負向(如檢舉、封鎖)行為機率,加權求和得出總分以決定內容排序。
    3. 創作者策略變化:舊版「最佳發文時間」等技巧失效,鼓勵創作者積極回覆評論(權重極高),避免引發使用者封鎖等負向行為,並建議將外鏈放在評論區而非正文。
    4. 透明度與侷限:此次開源提供了完整的系統架構和邏輯,但未公開具體的權重參數、模型內部參數及訓練數據,距離「完全透明」仍有距離。

原文作者:David,深潮 TechFlow

1 月 20 日下午,X 開源了新版推薦演算法。

Musk 配的回覆挺有意思:「我們知道這演算法很蠢,還需要大改,但至少你能看到我們在實時掙扎著改進。別的社交平台不敢這麼幹。」

image

這話有兩層意思。一是承認演算法有問題,二是拿「透明」當賣點。

這是 X 第二次開源演算法。2023 年那版程式碼三年沒更新,早就和實際系統脫節了。這次完全重寫,核心模型從傳統機器學習換成了 Grok transformer,官方說法是「徹底消除了手工特徵工程」。

翻譯成人話:以前的演算法靠工程師手動調參數,現在讓 AI 直接看你的互動歷史來決定推不推你的內容。

對內容創作者來說,這意味著以前那套「幾點發文最好」「帶什麼 tag 漲粉」的玄學可能不靈了。

我們也翻了翻開源的 Github 倉庫,在 AI 的輔助下,發現程式碼裡確實藏著一些硬邏輯,值得扒一扒。

演算法邏輯變化:從手工定義,到 AI 自動判斷

先說清楚新舊版本的區別,不然後面的討論容易混。

2023 年,推特開源的那版叫 Heavy Ranker,本質就是傳統機器學習。工程師要手動定義幾百個「特徵」:這則貼文有沒有圖、發文人粉絲多少、發佈時間離現在多久、貼文裡有沒有連結...

然後給每個特徵配權重,調來調去,看哪個組合效果好。

這次開源的新版叫 Phoenix,架構完全不同,你可以理解成一個更加依賴 AI 大模型的演算法,核心是用 Grok 的 transformer 模型,和 ChatGPT、Claude 用的是同一類技術。

官方 README 文件裡寫得很直白:「We have eliminated every single hand-engineered feature。」

傳統那種靠手工提取內容特徵的規則,一個不剩,全砍了。

那現在,這個演算法靠什麼判斷一個內容到底好不好?

答案是靠你的行為序列。你過去按讚過什麼、回覆過誰、在哪些貼文上停留超過兩分鐘、封鎖過哪類帳號。Phoenix 把這些行為餵給 transformer,讓模型自己學出規律並進行總結。

image

打個比方:舊演算法像一張人工編寫的評分表,每項打勾算分;

新演算法像一個看過你所有瀏覽記錄的 AI,直接猜你下一秒想看什麼。

對創作者來說,這意味著兩件事:

第一,以前那些「最佳發文時間」「黃金標籤」之類的技巧,參考價值變低了。因為模型不再看這些固定特徵,它看的是每個用戶的個人偏好。

第二,你的內容能不能被推出去,越來越取決於「看到你內容的人會怎麼反應」。這個反應被量化成了 15 種行為預測,我們下一章細說。

演算法在預測你的 15 種反應

Phoenix 拿到一則待推薦的貼文後,會預測當前用戶看到這則內容可能產生的 15 種行為:

  1. 正向行為:如按讚、回覆、轉發、引用轉發、點擊貼文、點擊作者主頁、看完一半以上影片、展開圖片、分享、停留超過一定時長、關注作者
  2. 負向行為:如點「不感興趣」、Block 作者、Mute 作者、檢舉

每種行為對應一個預測機率。比如模型判斷你有 60% 機率按讚這則貼文、5% 機率封鎖這個作者等等。

然後演算法做一件簡單的事:把這些機率乘以各自的權重,加起來,得到一個總分。

image

公式長這樣:

Final Score = Σ ( weight × P(action) )

正向行為的權重是正數,負向行為的權重是負數。

總分高的貼文排前面,低的沉下去。

跳出公式,其實說白了就是:

現在一個內容好不好,真的不由內容本身寫的好不好決定了(當然可讀性和利他性是傳播的基礎);而是更多的取決於「這則內容會讓你做出什麼反應」。演算法不在乎貼文本身的品質,它只在乎你的行為。

按這個思路想,極端情況下一個低俗但讓人忍不住回覆吐槽的貼文,得分可能比一個優質但沒人互動的貼文更高。這套系統的底層邏輯或許就是如此。

不過,新開源版本的演算法沒公開具體行為權重的數值,但 2023 年那版公開過。

舊版參考:一次檢舉 = 738 次按讚

接下來我們可以扒一下 23 年的那組數據,雖然是舊的,但能幫你理解各種行為在演算法眼裡的「價值」差多少。

2023 年 4 月 5 日,X 確實在 GitHub 上公開過一組權重數據。

直接上數字:

image

翻譯的再直白一些:

數據來源:舊版 GitHub twitter/the-algorithm-ml 倉庫,點擊可以查看原演算法

幾個數字值得細看。

第一,按讚幾乎不值錢。 權重只有 0.5,是所有正向行為裡最低的。演算法眼裡,一個按讚的價值約等於零。

第二,對話互動才是硬通貨。 「你回覆,作者又回覆你」的權重是 75,是按讚的 150 倍。演算法最想看到的不是單向的讚,而是來回的對話。

第三,負向反饋代價極高。 一次 Block 或 Mute(-74)需要 148 次按讚才能抵消。一次檢舉(-369)需要 738 次按讚。而且這些負分會累積到你的帳號信譽分裡,影響後續所有貼文的分發。

第四,影片完播率權重低得離譜。 只有 0.005,幾乎可以忽略。這和抖音、TikTok 形成鮮明對比,那兩個平台把完播率當核心指標。

官方在同一份文件裡也寫了:「The exact weights in the file can be adjusted at any time... Since then, we have periodically adjusted the weights to optimize for platform metrics.」

權重隨時可能調,而且確實調過。

新版本沒公開具體數值,但 README 裡寫的邏輯框架一樣:正向加分,負向扣分,加權求和。

具體數字可能變了,但量級關係大概率還在。你回覆別人的評論,比收到 100 個讚更有用。讓人想 Block 你,比沒人互動更糟糕。

知道這些後,我們創作者能做什麼

扒完推特的新舊演算法程式碼,結合來看,提煉幾條可操作的結論。

1.回覆你的評論者。 權重表裡「作者回覆評論者」是最高分項(+75),比用戶單方面按讚高 150 倍。不是讓你去求評論,而是有人評論了就回。哪怕回一句「謝謝」,演算法也會記一筆。

2.別讓人想劃走。 一次 block 的負面影響需要 148 次按讚才能抵消。爭議內容確實容易引發互動,但如果互動方式是「這人煩死了,block」,你的帳號信譽分會持續受損,影響後續所有貼文的分發。爭議流量是雙刃劍,砍別人之前先砍自己。

3.外鏈放評論區。 演算法不想把用戶導出站外。正文帶連結會被降權,這點 Musk 自己公開說過。想導流的話,正文寫內容,連結扔第一條評論。

4.別刷屏。 新版程式碼裡有個 Author Diversity Scorer,作用是給同一作者連續出現的貼文降權。設計意圖是讓用戶的 feed 更多樣,副作用是你連發十條不如精發一條。

6.沒有「最佳發文時間」了。 舊版演算法有「發佈時間」這個人工特徵,新版說砍就砍了。Phoenix 只看用戶行為序列,不看貼文是幾點發的。那些「週二下午三點發文效果最好」的攻略,參考價值越來越低。

以上是程式碼層面能讀出來的東西。

還有一些加分減分項來自 X 的公開文件,不在這次開源的倉庫裡:藍標認證有加成、全大寫會被降權、敏感內容觸發 80% 觸達率削減。這些規則沒開源,就不展開了。

總結來看,這次開源的東西挺實在。

完整的系統架構、候選內容的召回邏輯、排序打分的流程、各種過濾器的實現。程式碼主要是 Rust 和 Python,結構清晰,README 寫得比很多商業項目都詳細。

但有幾樣關鍵的東西沒放出來。

1.權重參數沒公開。 程式碼裡只寫了「正向行為加分,負向行為扣分」,具體按讚值多少分、block 扣多少分,沒說。2023 年那版至少把數字亮出來了,這次只給了公式框架。

2.模型權重沒公開。 Phoenix 用的是 Grok transformer,但模型本身的參數沒放。你能看到模型怎麼被調用,看不到模型內部怎麼算的。

3.訓練數據沒公開。 模型是用什麼數據訓出來的、用戶行為怎麼採樣、正負樣本怎麼構造,都沒說。

打個比方,這次開源相當於告訴你「我們用加權求和算總分」,但沒告訴你權重是多少;告訴你「我們用 transformer 預測行為機率」,但沒告訴你 transformer 裡面長什麼樣。

橫向比較的話,TikTok 和 Instagram 連這些都沒公開過。X 這次開源的資訊量,確實比其他主流平台多。只是離「完全透明」還有距離。

這不是說開源沒有價值。對創作者和研究者來說,能看到程式碼總比看不到強。

AI
歡迎加入Odaily官方社群