BTC
ETH
HTX
SOL
BNB
Xem thị trường
简中
繁中
English
日本語
한국어
ภาษาไทย
Tiếng Việt

X's New Algorithm Revealed: Likes Are Almost Worthless, This Action's Value Soars 150x

深潮TechFlow
特邀专栏作者
2026-01-20 09:14
Bài viết này có khoảng 3533 từ, đọc toàn bộ bài viết mất khoảng 6 phút
Thuật toán không quan tâm đến nội dung, mà chỉ quan tâm đến việc nội dung có thể khiến bạn làm gì.
Tóm tắt AI
Mở rộng
  • Quan điểm cốt lõi: X (Twitter cũ) đã mở mã nguồn thuật toán đề xuất phiên bản mới Phoenix. Thay đổi cốt lõi là chuyển từ thuật toán cũ phụ thuộc vào các đặc trưng được định nghĩa thủ công sang mô hình hoàn toàn được điều khiển bởi AI mô hình lớn (Grok transformer). Bằng cách dự đoán 15 hành vi tương tác của người dùng để sắp xếp nội dung, điều này đã thay đổi đáng kể logic cơ bản của việc phân phối nội dung.
  • Yếu tố then chốt:
    1. Cải tiến kiến trúc thuật toán: Phiên bản Phoenix mới hoàn toàn loại bỏ kỹ thuật đặc trưng thủ công, thay vào đó sử dụng mô hình Grok transformer, dựa trên chuỗi hành vi lịch sử của người dùng (như thích, trả lời, chặn) để dự đoán và đề xuất nội dung.
    2. Cơ chế sắp xếp nội dung: Thuật toán dự đoán xác suất người dùng có thể thực hiện 15 hành vi tích cực (như trả lời, chia sẻ lại) và tiêu cực (như báo cáo, chặn) đối với nội dung, sau đó tính tổng trọng số để đưa ra điểm tổng nhằm quyết định thứ tự sắp xếp nội dung.
    3. Thay đổi chiến lược của người sáng tạo: Các mẹo như "thời gian đăng bài tốt nhất" trong phiên bản cũ không còn hiệu quả. Khuyến khích người sáng tạo tích cực trả lời bình luận (trọng số rất cao), tránh gây ra các hành vi tiêu cực như người dùng chặn, và đề xuất đặt liên kết ngoài trong phần bình luận thay vì trong nội dung chính.
    4. Tính minh bạch và hạn chế: Lần mở mã nguồn này cung cấp đầy đủ kiến trúc hệ thống và logic, nhưng không công khai các tham số trọng số cụ thể, tham số nội bộ của mô hình cũng như dữ liệu huấn luyện, vẫn còn khoảng cách so với "hoàn toàn minh bạch".

Tác giả gốc: David, TechFlow

Vào chiều ngày 20 tháng 1, X đã công khai mã nguồn thuật toán đề xuất phiên bản mới.

Phản hồi mà Musk đính kèm khá thú vị: "Chúng tôi biết thuật toán này rất ngớ ngẩn, vẫn cần sửa đổi lớn, nhưng ít nhất bạn có thể thấy chúng tôi đang vật lộn để cải thiện nó trong thời gian thực. Các nền tảng mạng xã hội khác không dám làm điều này."

image

Câu nói này có hai lớp ý nghĩa. Một là thừa nhận thuật toán có vấn đề, hai là lấy "tính minh bạch" làm điểm bán hàng.

Đây là lần thứ hai X công khai mã nguồn thuật toán. Phiên bản mã năm 2023 đã không được cập nhật trong ba năm và từ lâu đã tách rời khỏi hệ thống thực tế. Lần này được viết lại hoàn toàn, mô hình cốt lõi đã chuyển từ máy học truyền thống sang Grok transformer, theo cách nói chính thức là "đã loại bỏ hoàn toàn kỹ thuật đặc trưng thủ công".

Dịch sang ngôn ngữ thông thường: thuật toán cũ dựa vào kỹ sư điều chỉnh thủ công các tham số, bây giờ để AI trực tiếp xem lịch sử tương tác của bạn để quyết định có đẩy nội dung của bạn hay không.

Đối với những người sáng tạo nội dung, điều này có nghĩa là bộ "huyền học" cũ như "đăng bài vào giờ nào là tốt nhất", "dùng tag gì để tăng follower" có thể không còn hiệu quả.

Chúng tôi cũng đã xem qua kho lưu trữ Github được công khai mã nguồn, với sự hỗ trợ của AI, phát hiện trong mã thực sự ẩn chứa một số logic cứng, đáng để khám phá.

Thay đổi logic thuật toán: Từ định nghĩa thủ công đến phán đoán tự động bằng AI

Trước tiên hãy làm rõ sự khác biệt giữa phiên bản cũ và mới, nếu không cuộc thảo luận sau này dễ bị nhầm lẫn.

Năm 2023, phiên bản mà Twitter công khai mã nguồn gọi là Heavy Ranker, bản chất là máy học truyền thống. Kỹ sư phải định nghĩa thủ công hàng trăm "đặc trưng": bài đăng này có hình ảnh không, người đăng có bao nhiêu follower, thời gian đăng cách bây giờ bao lâu, trong bài có liên kết không...

Sau đó gán trọng số cho mỗi đặc trưng, điều chỉnh qua lại, xem tổ hợp nào hiệu quả tốt.

Phiên bản mới được công khai mã nguồn lần này gọi là Phoenix, kiến trúc hoàn toàn khác, bạn có thể hiểu nó là một thuật toán phụ thuộc nhiều hơn vào mô hình AI lớn, cốt lõi là sử dụng mô hình transformer của Grok, cùng loại công nghệ với ChatGPT và Claude.

Tài liệu README chính thức viết rất thẳng thắn: "We have eliminated every single hand-engineered feature."

Những quy tắc truyền thống dựa vào việc trích xuất đặc trưng nội dung thủ công, một cái không còn, tất cả đều bị loại bỏ.

Vậy bây giờ, thuật toán này dựa vào cái gì để đánh giá một nội dung cuối cùng có tốt hay không?

Câu trả lời là dựa vào chuỗi hành vi của bạn. Bạn đã thích gì trong quá khứ, đã trả lời ai, đã dừng lại trên bài đăng nào quá hai phút, đã chặn loại tài khoản nào. Phoenix đưa những hành vi này vào transformer, để mô hình tự học ra quy luật và tổng kết.

image

Ví dụ: thuật toán cũ giống như một bảng chấm điểm được viết thủ công, mỗi mục đánh dấu tính điểm;

Thuật toán mới giống như một AI đã xem tất cả lịch sử duyệt web của bạn, trực tiếp đoán bạn muốn xem gì trong giây tiếp theo.

Đối với người sáng tạo, điều này có nghĩa là hai điều:

Thứ nhất, những kỹ thuật cũ như "thời gian đăng bài tốt nhất", "tag vàng" có giá trị tham khảo thấp hơn. Bởi vì mô hình không còn xem những đặc trưng cố định này, nó xem sở thích cá nhân của mỗi người dùng.

Thứ hai, nội dung của bạn có được đẩy hay không, ngày càng phụ thuộc vào "người xem nội dung của bạn sẽ phản ứng thế nào". Phản ứng này được định lượng thành 15 loại dự đoán hành vi, chúng ta sẽ nói chi tiết ở chương tiếp theo.

Thuật toán đang dự đoán 15 loại phản ứng của bạn

Sau khi Phoenix nhận được một bài đăng cần đề xuất, nó sẽ dự đoán 15 loại hành vi mà người dùng hiện tại có thể tạo ra khi xem nội dung này:

  1. Hành vi tích cực: như thích, trả lời, chia sẻ lại, trích dẫn chia sẻ lại, nhấp vào bài đăng, nhấp vào trang chủ tác giả, xem hơn một nửa video, mở rộng hình ảnh, chia sẻ, dừng lại quá một khoảng thời gian nhất định, theo dõi tác giả
  2. Hành vi tiêu cực: như nhấp "Không quan tâm", Chặn tác giả, Tắt tiếng tác giả, báo cáo

Mỗi hành vi tương ứng với một xác suất dự đoán. Ví dụ, mô hình đánh giá bạn có 60% xác suất thích bài đăng này, 5% xác suất chặn tác giả này, v.v.

Sau đó thuật toán làm một việc đơn giản: nhân các xác suất này với trọng số tương ứng của chúng, cộng lại, được một tổng điểm.

image

Công thức như thế này:

Điểm cuối cùng = Σ ( trọng số × P(hành động) )

Trọng số của hành vi tích cực là số dương, trọng số của hành vi tiêu cực là số âm.

Bài đăng có tổng điểm cao xếp trước, điểm thấp chìm xuống.

Thoát khỏi công thức, thực chất nói đơn giản là:

Bây giờ một nội dung có tốt hay không, thực sự không còn do bản thân nội dung viết có hay hay không quyết định (tất nhiên tính dễ đọc và tính vị tha là nền tảng của lan truyền); mà phụ thuộc nhiều hơn vào "nội dung này sẽ khiến bạn phản ứng thế nào". Thuật toán không quan tâm đến chất lượng của bài đăng, nó chỉ quan tâm đến hành vi của bạn.

Nghĩ theo hướng này, trong trường hợp cực đoan, một bài đăng tầm thường nhưng khiến người ta không nhịn được trả lời để chê bai, điểm số có thể cao hơn một bài đăng chất lượng nhưng không có tương tác. Logic cơ bản của hệ thống này có lẽ là như vậy.

Tuy nhiên, phiên bản thuật toán mới được công khai mã nguồn không công khai giá trị số cụ thể của trọng số hành vi, nhưng phiên bản năm 2023 đã công khai.

Tham khảo phiên bản cũ: Một lần báo cáo = 738 lần thích

Tiếp theo chúng ta có thể xem xét nhóm dữ liệu năm 23 đó, mặc dù là cũ, nhưng có thể giúp bạn hiểu các hành vi khác nhau trong mắt thuật toán "giá trị" chênh lệch bao nhiêu.

Ngày 5 tháng 4 năm 2023, X thực sự đã công khai một nhóm dữ liệu trọng số trên GitHub.

Trực tiếp đưa ra con số:

image

Dịch thẳng thắn hơn một chút:

Nguồn dữ liệu: Phiên bản cũ Kho lưu trữ GitHub twitter/the-algorithm-ml, nhấp để xem thuật toán gốc

Một vài con số đáng xem xét kỹ.

Thứ nhất, thích hầu như không có giá trị. Trọng số chỉ có 0.5, là thấp nhất trong tất cả các hành vi tích cực. Trong mắt thuật toán, giá trị của một lần thích gần như bằng không.

Thứ hai, tương tác hội thoại mới là tiền tệ cứng. Trọng số của "bạn trả lời, tác giả lại trả lời bạn" là 75, gấp 150 lần thích. Điều thuật toán muốn thấy nhất không phải là thích một chiều, mà là hội thoại qua lại.

Thứ ba, phản hồi tiêu cực có cái giá cực cao. Một lần Block hoặc Mute (-74) cần 148 lần thích để bù đắp. Một lần báo cáo (-369) cần 738 lần thích. Hơn nữa, những điểm trừ này sẽ tích lũy vào điểm uy tín tài khoản của bạn, ảnh hưởng đến phân phối tất cả các bài đăng tiếp theo.

Thứ tư, trọng số tỷ lệ xem hết video thấp đến mức khó tin. Chỉ có 0.005, gần như có thể bỏ qua. Điều này tạo nên sự tương phản rõ rệt với Douyin và TikTok, hai nền tảng đó coi tỷ lệ xem hết là chỉ số cốt lõi.

Chính thức cũng viết trong cùng một tài liệu: "The exact weights in the file can be adjusted at any time... Since then, we have periodically adjusted the weights to optimize for platform metrics."

Trọng số có thể điều chỉnh bất cứ lúc nào, và thực sự đã được điều chỉnh.

Phiên bản mới không công khai giá trị số cụ thể, nhưng logic khung được viết trong README giống nhau: tích cực cộng điểm, tiêu cực trừ điểm, tổng có trọng số.

Con số cụ thể có thể đã thay đổi, nhưng quan hệ cấp độ có khả năng vẫn còn. Bạn trả lời bình luận của người khác, hữu ích hơn nhận 100 lượt thích. Khiến người ta muốn Block bạn, tệ hơn là không có tương tác.

Sau khi biết những điều này, chúng ta - những người sáng tạo có thể làm gì

Sau khi xem xét mã thuật toán cũ và mới của Twitter, kết hợp lại, đúc kết một số kết luận có thể thao tác được.

1. Trả lời người bình luận của bạn. Trong bảng trọng số, "tác giả trả lời người bình luận" là mục điểm cao nhất (+75), cao gấp 150 lần so với người dùng chỉ thích một chiều. Không phải bảo bạn đi cầu xin bình luận, mà là có người bình luận thì hãy trả lời. Dù chỉ trả lời một câu "cảm ơn", thuật toán cũng sẽ ghi nhận một bút.

2. Đừng khi

AI
Chào mừng tham gia cộng đồng chính thức của Odaily
Nhóm đăng ký
https://t.me/Odaily_News
Nhóm trò chuyện
https://t.me/Odaily_CryptoPunk
Tài khoản chính thức
https://twitter.com/OdailyChina
Nhóm trò chuyện
https://t.me/Odaily_CryptoPunk
Tìm kiếm
Mục lục bài viết
Tải ứng dụng Odaily Nhật Báo Hành Tinh
Hãy để một số người hiểu Web3.0 trước
IOS
Android