BTC
ETH
HTX
SOL
BNB
ดูตลาด
简中
繁中
English
日本語
한국어
ภาษาไทย
Tiếng Việt

X เผยอัลกอริทึมใหม่: การกดไลค์แทบไม่มีมูลค่า พฤติกรรมนี้มีมูลค่าเพิ่มขึ้น 150 เท่า

深潮TechFlow
特邀专栏作者
2026-01-20 09:14
บทความนี้มีประมาณ 3533 คำ การอ่านทั้งหมดใช้เวลาประมาณ 6 นาที
อัลกอริทึมไม่สนใจเนื้อหาของตัวเนื้อหาเอง แต่สนใจว่าเนื้อหาจะทำให้คุณทำอะไรได้บ้าง
สรุปโดย AI
ขยาย
  • ประเด็นหลัก: X (เดิมคือทวิตเตอร์) เปิดเผยซอร์สโค้ดของอัลกอริทึมแนะนำเวอร์ชันใหม่ Phoenix การเปลี่ยนแปลงหลักคือการเปลี่ยนจากอัลกอริทึมเก่าที่พึ่งพาคุณลักษณะที่กำหนดด้วยมือ ไปสู่โหมดที่ขับเคลื่อนโดย AI โมเดลขนาดใหญ่ (Grok transformer) อย่างสมบูรณ์ โดยการคาดการณ์พฤติกรรมการโต้ตอบ 15 ประเภทของผู้ใช้เพื่อจัดลำดับเนื้อหา ซึ่งเปลี่ยนแปลงตรรกะพื้นฐานของการกระจายเนื้อหาอย่างมีนัยสำคัญ
  • องค์ประกอบสำคัญ:
    1. นวัตกรรมโครงสร้างอัลกอริทึม: Phoenix เวอร์ชันใหม่ละทิ้งการสร้างคุณลักษณะด้วยมือโดยสิ้นเชิง หันมาใช้โมเดล Grok transformer แทน โดยอ้างอิงจากลำดับพฤติกรรมในอดีตของผู้ใช้ (เช่น การกดไลค์ ตอบกลับ ปิดกั้น) เพื่อคาดการณ์และแนะนำเนื้อหา
    2. กลไกการจัดลำดับเนื้อหา: อัลกอริทึมคาดการณ์ความน่าจะเป็นที่ผู้ใช้จะมีพฤติกรรมเชิงบวก (เช่น ตอบกลับ รีทวีต) และเชิงลบ (เช่น รายงาน ปิดกั้น) ต่อเนื้อหา 15 ประเภท นำมาหารวมน้ำหนักเพื่อได้คะแนนรวมในการตัดสินใจจัดลำดับเนื้อหา
    3. การเปลี่ยนแปลงกลยุทธ์ผู้สร้างสรรค์: เทคนิคเก่าเช่น "เวลาโพสต์ที่ดีที่สุด" ใช้การไม่ได้อีกต่อไป ส่งเสริมให้ผู้สร้างสรรค์ตอบกลับความคิดเห็นอย่างกระตือรือร้น (มีน้ำหนักสูงมาก) หลีกเลี่ยงการกระตุ้นพฤติกรรมเชิงลบเช่นการถูกผู้ใช้ปิดกั้น และแนะนำให้วางลิงก์ภายนอกในส่วนความคิดเห็นแทนที่จะอยู่ในเนื้อหาหลัก
    4. ความโปร่งใสและข้อจำกัด: การเปิดซอร์สโค้ดครั้งนี้ให้โครงสร้างระบบและตรรกะที่สมบูรณ์ แต่ไม่ได้เปิดเผยพารามิเตอร์น้ำหนักเฉพาะ พารามิเตอร์ภายในโมเดล และข้อมูลการฝึกอบรม ซึ่งยังห่างจาก "ความโปร่งใสอย่างสมบูรณ์"

ผู้เขียนต้นฉบับ: David, TechFlow ของ Shenchao

ในบ่ายวันที่ 20 มกราคม X ได้เปิดซอร์สอัลกอริทึมแนะนำเวอร์ชันใหม่

การตอบกลับที่ Musk แนบมาค่อนข้างน่าสนใจ: "เรารู้ว่าอัลกอริทึมนี้โง่ ยังต้องปรับปรุงใหญ่ แต่อย่างน้อยคุณก็เห็นว่าเรากำลังดิ้นรนปรับปรุงมันแบบเรียลไทม์ แพลตฟอร์มโซเชียลอื่นไม่กล้าทำแบบนี้"

image

คำพูดนี้มีความหมายสองชั้น หนึ่งคือยอมรับว่าอัลกอริทึมมีปัญหา สองคือใช้ "ความโปร่งใส" เป็นจุดขาย

นี่เป็นการเปิดซอร์สอัลกอริทึมครั้งที่สองของ X รหัสเวอร์ชันปี 2023 ไม่ได้อัปเดตมา 3 ปีแล้ว หลุดจากระบบจริงไปนานแล้ว ครั้งนี้เขียนใหม่ทั้งหมด โมเดลหลักเปลี่ยนจากแมชชีนเลิร์นนิงแบบดั้งเดิมเป็น Grok transformer ภาษาทางการคือ "กำจัดฟีเจอร์ที่สร้างด้วยมืออย่างสิ้นเชิง"

แปลเป็นภาษาคน: อัลกอริทึมเก่าใช้วิศวกรปรับพารามิเตอร์ด้วยมือ ตอนนี้ให้ AI ดูประวัติการโต้ตอบของคุณโดยตรงเพื่อตัดสินใจว่าจะแนะนำเนื้อหาของคุณหรือไม่

สำหรับผู้สร้างเนื้อหา นี่หมายความว่าวิธีลึกลับแบบเก่าที่ว่า "โพสต์เวลาไหนดีที่สุด" "ใช้แท็กอะไรเพื่อเพิ่มผู้ติดตาม" อาจใช้ไม่ได้แล้ว

เราก็ได้ลองดูที่เก็บ Github ที่เปิดซอร์ส ด้วยความช่วยเหลือของ AI พบว่าในโค้ดมีตรรกะแข็งบางอย่างซ่อนอยู่จริงๆ คุ้มค่าที่จะขุดคุ้ย

การเปลี่ยนแปลงตรรกะของอัลกอริทึม: จากนิยามด้วยมือ สู่การตัดสินใจอัตโนมัติโดย AI

อธิบายความแตกต่างระหว่างเวอร์ชันเก่าและใหม่ให้ชัดก่อน ไม่เช่นนั้นการสนทนาต่อไปจะสับสน

ปี 2023 ทวิตเตอร์เปิดซอร์สเวอร์ชันที่ชื่อ Heavy Ranker ซึ่งโดยพื้นฐานคือแมชชีนเลิร์นนิงแบบดั้งเดิม วิศวกรต้องนิยาม "ฟีเจอร์" นับร้อยด้วยมือ: โพสต์นี้มีรูปไหม, ผู้โพสต์มีผู้ติดตามกี่คน, เวลาโพสต์ห่างจากตอนนี้กี่ชั่วโมง, ในโพสต์มีลิงก์ไหม...

แล้วกำหนดน้ำหนักให้แต่ละฟีเจอร์ ปรับไปมา ดูว่าชุดไหนได้ผลดี

เวอร์ชันใหม่ที่เปิดซอร์สครั้งนี้ชื่อ Phoenix โครงสร้างต่างกันโดยสิ้นเชิง คุณสามารถเข้าใจได้ว่าเป็นอัลกอริทึมที่พึ่งพาโมเดลใหญ่ AI มากขึ้น โดยแกนกลางใช้โมเดล transformer ของ Grok ซึ่งเป็นเทคโนโลยีประเภทเดียวกับที่ ChatGPT และ Claude ใช้

เอกสาร README ทางการเขียนตรงไปตรงมา: "We have eliminated every single hand-engineered feature."

กฎแบบดั้งเดิมที่ใช้การดึงฟีเจอร์เนื้อหาด้วยมือ ไม่เหลือสักอย่าง ตัดทิ้งทั้งหมด

แล้วตอนนี้ อัลกอริทึมนี้ใช้อะไรตัดสินว่าเนื้อหาไหนดีจริงๆ?

คำตอบคือใช้ลำดับพฤติกรรมของคุณ คุณเคยกดไลค์อะไร ตอบกลับใคร ค้างอยู่บนโพสต์ไหนนานกว่าสองนาที บล็อกบัญชีประเภทไหน Phoenix เอาพฤติกรรมเหล่านี้ป้อนให้ transformer ให้โมเดลเรียนรู้กฎและสรุปด้วยตัวเอง

image

เปรียบเทียบ: อัลกอริทึมเก่าเหมือนตารางให้คะแนนที่เขียนด้วยมือ ทุกข้อที่ติ๊กได้คะแนน

อัลกอริทึมใหม่เหมือน AI ที่ดูประวัติการเรียกดูทั้งหมดของคุณ เดาโดยตรงว่าคุณอยากดูอะไรในวินาทีถัดไป

สำหรับผู้สร้างเนื้อหา นี่หมายถึงสองสิ่ง:

หนึ่ง เทคนิคเก่าๆ เช่น "เวลาโพสต์ที่ดีที่สุด" "แท็กทองคำ" ค่าอ้างอิงลดลง เพราะโมเดลไม่ดูฟีเจอร์ตายตัวเหล่านี้แล้ว มันดูความชอบส่วนบุคคลของผู้ใช้แต่ละคน

สอง เนื้อหาของคุณจะถูกแนะนำหรือไม่ ขึ้นอยู่กับ "คนที่เห็นเนื้อหาของคุณจะตอบสนองอย่างไร" มากขึ้นเรื่อยๆ การตอบสนองนี้ถูกวัดเป็น 15 พฤติกรรมที่คาดการณ์ไว้ เราจะพูดถึงในบทถัดไป

อัลกอริทึมกำลังคาดการณ์ 15 การตอบสนองของคุณ

หลังจาก Phoenix ได้รับโพสต์ที่รอแนะนำ มันจะคาดการณ์พฤติกรรม 15 ประเภทที่ผู้ใช้ปัจจุบันอาจมีเมื่อเห็นเนื้อหานี้:

  1. พฤติกรรมเชิงบวก: เช่น กดไลค์, ตอบกลับ, รีทวีต, อ้างอิงรีทวีต, คลิกโพสต์, คลิกหน้าโปรไฟล์ผู้เขียน, ดูวิดีโอเกินครึ่ง, ขยายรูปภาพ, แชร์, ค้างเกินระยะเวลาหนึ่ง, ติดตามผู้เขียน
  2. พฤติกรรมเชิงลบ: เช่น กด "ไม่สนใจ", บล็อกผู้เขียน, ปิดเสียงผู้เขียน, รายงาน

แต่ละพฤติกรรมสอดคล้องกับความน่าจะเป็นที่คาดการณ์ เช่น โมเดลตัดสินว่าคุณมีความน่าจะเป็น 60% ที่จะกดไลค์โพสต์นี้ 5% ที่จะบล็อกผู้เขียนนี้ เป็นต้น

จากนั้นอัลกอริทึมทำสิ่งง่ายๆ: นำความน่าจะเป็นเหล่านี้คูณด้วยน้ำหนักของแต่ละอัน แล้วรวมกัน ได้คะแนนรวม

image

สูตรเป็นแบบนี้:

Final Score = Σ ( weight × P(action) )

น้ำหนักของพฤติกรรมเชิงบวกเป็นจำนวนบวก น้ำหนักของพฤติกรรมเชิงลบเป็นจำนวนลบ

โพสต์ที่ได้คะแนนรวมสูงอยู่ด้านหน้า คะแนนต่ำจมลง

ออกจากสูตร จริงๆ แล้วพูดง่ายๆ คือ:

ตอนนี้เนื้อหาดีหรือไม่ ไม่ได้ขึ้นอยู่กับว่าเนื้อหานั้นเขียนดีหรือไม่แล้ว (แน่นอนว่าความอ่านง่ายและความเอื้อเฟื้อเป็นพื้นฐานของการแพร่กระจาย); แต่ขึ้นอยู่กับ "เนื้อหานี้จะทำให้คุณตอบสนองอย่างไร" มากขึ้น อัลกอริทึมไม่สนใจคุณภาพของโพสต์เอง มันสนใจแค่พฤติกรรมของคุณ

คิดตามแนวทางนี้ ในกรณีสุดโต่ง โพสต์หยาบคายแต่ทำให้คนอดไม่ได้ที่จะตอบกลับเพื่อวิจารณ์ อาจได้คะแนนสูงกว่าโพสต์คุณภาพสูงแต่ไม่มีใครโต้ตอบ ตรรกะพื้นฐานของระบบนี้อาจเป็นเช่นนี้

อย่างไรก็ตาม อัลกอริทึมเวอร์ชันใหม่ที่เปิดซอร์สไม่ได้เปิดเผยค่าตัวเลขน้ำหนักพฤติกรรมที่เฉพาะเจาะจง แต่เวอร์ชันปี 2023 เคยเปิดเผย

อ้างอิงเวอร์ชันเก่า: หนึ่งการรายงาน = 738 ไลค์

ต่อไปเราสามารถขุดข้อมูลชุดปี 23 นั้นได้ แม้จะเป็นของเก่า แต่ช่วยให้คุณเข้าใจว่า "มูลค่า" ของพฤติกรรมต่างๆ ในสายตาของอัลกอริทึมต่างกันแค่ไหน

วันที่ 5 เมษายน 2023 X เคยเปิดเผยชุดข้อมูลน้ำหนักบน GitHub จริงๆ

ดูตัวเลขโดยตรง:

image

แปลให้ตรงไปตรงมาขึ้นอีก:

แหล่งข้อมูล: เวอร์ชันเก่า GitHub twitter/the-algorithm-ml repository คลิกเพื่อดูอัลกอริทึมต้นฉบับ

มีตัวเลขหลายตัวที่ควรดูอย่างละเอียด

หนึ่ง การกดไลค์แทบไม่มีมูลค่า น้ำหนักมีแค่ 0.5 ต่ำที่สุดในบรรดาพฤติกรรมเชิงบวกทั้งหมด ในสายตาของอัลกอริทึม มูลค่าของหนึ่งไลค์ประมาณเท่ากับศูนย์

สอง การโต้ตอบแบบบทสนทนาเป็นสินทรัพย์แข็ง น้ำหนักของ "คุณตอบกลับ แล้วผู้เขียนตอบกลับคุณ" คือ 75 ซึ่งเป็น 150 เท่าของการกดไลค์ สิ่งที่อัลกอริทึมอยากเห็นมากที่สุดไม่ใช่การไลค์ทางเดียว แต่เป็นการสนทนาที่ไปมา

สาม การตอบรับเชิงลบมีต้นทุนสูงมาก การบล็อกหรือปิดเสียงหนึ่งครั้ง (-74) ต้องใช้การกดไลค์ 148 ครั้งเพื่อชดเชย การรายงานหนึ่งครั้ง (-369) ต้องใช้การกดไลค์ 738 ครั้ง และคะแนนลบเหล่านี้จะสะสมในคะแนนชื่อเสียงบัญชีของคุณ ส่งผลต่อการกระจายโพสต์ทั้งหมดในอนาคต

สี่ อัตราการดูวิดีโอจนจบมีน้ำหนักต่ำอย่างไม่น่าเชื่อ มีแค่ 0.005 เกือบจะมองข้ามได้ สิ่งนี้ตัดกันอย่างชัดเจนกับ Douyin และ TikTok ซึ่งสองแพลตฟอร์มนั้นใช้อัตราการดูจนจบเป็นตัวชี้วัดหลัก

ทางการเขียนในไฟล์เดียวกันว่า: "The exact weights in the file can be adjusted at any time... Since then, we have periodically adjusted the weights to optimize for platform metrics."

น้ำหนักสามารถปรับได้ตลอดเวลา และเคยปรับจริงๆ

เวอร์ชันใหม่ไม่ได้เปิดเผยค่าตัวเลขเฉพาะ แต่ตรรกะเฟรมเวิร์กที่เขียนใน README เหมือนกัน: เชิงบวกเพิ่มคะแนน เชิงลบหักคะแนน รวมน้ำหนัก

ตัวเลขเฉพาะอาจเปลี่ยนไป แต่ความสัมพันธ์ในระดับปริมาณน่าจะยังอยู่ การที่คุณตอบกลับความคิดเห็นของคนอื่น มีประโยชน์มากกว่าการได้รับ 100 ไลค์ การทำให้คนอยากบล็อกคุณ แย่กว่าการไม่มีใครโต้ตอบ

หลังจากรู้สิ่งเหล่านี้แล้ว เราผู้สร้างเนื้อหาสามารถทำอะไรได้บ้าง

หลังจากขุดโค้ดอัลกอริทึมเก่าและใหม่ของทวิตเตอร์แล้ว เมื่อมองรวมกัน สกัดข้อสรุปที่ปฏิบัติได้หลายข้อ

1. ตอบกลับผู้ที่แสดงความคิดเห็นต่อคุณ ในตารางน้ำหนัก "ผู้เขียนตอบกลับผู้แสดงความคิดเห็น" เป็นรายการคะแนนสูงสุด (+75) สูงกว่าการที่ผู้ใช้กดไลค์ฝ่ายเดียว 150 เท่า ไม่ใช่ให้คุณไปขอความคิดเห็น แต่ถ้ามีคนแสดงความคิดเห็นแล้วก็ตอบกลับ แม้ตอบแค่ "ขอบคุณ" อัลกอริทึมก็จะบันทึกไว้

2. อย่าให้คนอยากเลื่อนผ่าน ผลกระทบเชิงลบของการบล็อกหนึ่งครั้งต้องใช้การกดไลค์ 148 ครั้งเพื่อชดเชย เนื้อหาที่ก่อให้เกิดการโต้แย้งย่อมกระตุ้นการโต้ตอบได้ง่าย แต่ถ้าวิธีโต้ตอบคือ "คนนี้น่ารำคาญ บล็อกเลย" คะแนนชื่อเสียงบัญชีของคุณจะเสียหายอย่างต่อเนื่อง ส่งผลต่อการกระจายโพสต์ทั้งหมดในอนาคต กระแสการโต้แย้งเป็นดาบสองคม ก่อนจะฟันคนอื่น ฟันตัวเองก่อน

3. วางลิงก์ภายนอกในส่วนความคิดเห็น อัลกอริทึมไม่อยากนำผู้ใช้ออกนอกไซต์ การมีลิงก์ในเนื้อหาหลักจะถูกลดน้ำหนัก ข้อนี้ Musk เองเคยเปิดเผยต่อสาธารณะ ถ้าอยากนำกระแส เขียนเนื้อหาในส่วนหลัก โยนลิงก์ไปไว้ในความคิดเห็นแรก

4. อย่าโพสต์รัว ในโค้ดเวอร์ชันใหม่มี Author Diversity Scorer ซึ่งมีหน้าที่ลดน้ำหนักโพสต์ของผู้เขียนเดียวกันที่ปรากฏต่อเนื่องกัน วัตถุประสงค์การออกแบบคือทำให้ฟีดของผู้ใช้มีความหลากหลายมากขึ้น ผลข้างเคียงคือคุณโพสต์สิบครั้งติดต่อกันไม่ดีเท่าการโพสต์หนึ่งครั้งอย่างมีคุณภาพ

6. ไม่มี "เวลาโพสต์ที่ดีที่สุด" อีกแล้ว อัลกอริทึมเวอร์ชันเก่ามีฟีเจอร์ "เวลาโพสต์" ที่สร้างด้วยมือ เวอร์ชันใหม่บอกว่าตัดทิ้งแล้ว Phoenix ดูแค่ลำดับพฤติกรรมผู้ใช้ ไม่ดูว่าโพสต์โพสต์เวลาไหน คู่มือที่ว่า "โพสต์บ่ายสามโมงวันอังคารได้ผลดีที่สุด" มีค่าอ้างอิงน้อยลงเรื่อยๆ

ข้างต้นคือสิ่งที่อ่านได้จากระดับโค้ด

ยังมีรายการเพิ่มคะแนน/หักคะแนนอื่นๆ ที่มาจากเอกสารสาธารณะของ X ไม่ได้อยู่ในที่เก็บที่เปิดซอร์สครั้งนี้: การรับรองตราสีน้ำเงินมีโบนัส การใช้ตัวพิมพ์ใหญ่ทั้งหมดจะถูกลดน้ำหนัก เนื้อหาอ่อนไหวกระตุ้นการ

AI
ยินดีต้อนรับเข้าร่วมชุมชนทางการของ Odaily
กลุ่มสมาชิก
https://t.me/Odaily_News
กลุ่มสนทนา
https://t.me/Odaily_CryptoPunk
บัญชีทางการ
https://twitter.com/OdailyChina
กลุ่มสนทนา
https://t.me/Odaily_CryptoPunk
ค้นหา
สารบัญบทความ
ดาวน์โหลดแอพ Odaily พลาเน็ตเดลี่
ให้คนบางกลุ่มเข้าใจ Web3.0 ก่อน
IOS
Android