预测世界杯淘汰赛,不同AI水平差这么多?
Original: Odaily (@OdailyChina)
Author: Asher (@Asher_ 0210)

ก่อนแต่ละแมตช์ของฟุตบอลโลก ฉันจะให้ AI ทำนายผล ซึ่งเกือบทุกโมเดลให้คำอธิบายที่มีเหตุผลและละเอียดมาก
บางโมเดลพูดถึงมูลค่าทีม บางอันแยกวิเคราะห์ข้อมูลรอบแบ่งกลุ่ม บางอันวิเคราะห์อาการบาดเจ็บและแท็กติก และบางอันก็ให้สกอร์ต่อเวลาพิเศษ หรือจุดโทษมาเลย เมื่อดูเผินๆ ChatGPT, Grok, Qwen, DeepSeek, Gemini, Claude ก็เหมือนจะมีความรู้เรื่องฟุตบอลดีทุกตัว
แต่ในฐานะผู้ใช้ตลาดทำนาย สิ่งที่ฉันสนใจจริงๆ ไม่ใช่ว่าโมเดลไหนอธิบายได้ครบถ้วนกว่า แต่เป็นโมเดลไหนที่น่าเชื่อถือมากกว่ากัน
เมื่อฟุตบอลโลกเข้าสู่รอบน็อคเอาท์ Odaily เริ่มตั้งแต่แมตช์แรก ด้วยการใช้คำถามที่ใกล้เคียงกันที่สุดถามโมเดล AI ต่างๆ ก่อนแข่ง และหลังจากแข่งก็เทียบกับผลจริงเพื่อดูว่าโมเดลไหนแค่วิเคราะห์ได้เหมือนจริง และโมเดลไหนที่สามารถจับแนวทางการแข่งขันได้จริงๆ ก่อนเกมจะเริ่ม
จนถึงตอนนี้ รอบน็อคเอาท์ที่ผ่านมา แคนาดาชนะแอฟริกาใต้ 1-0 บราซิลชนะญี่ปุ่นแบบหืดจับ 2-1 เยอรมนีถูกปารากวัยลากเข้าสู่การดวลจุดโทษแล้วตกรอบ เนเธอร์แลนด์ก็พ่ายแพ้ต่อโมร็อกโกในการดวลจุดโทษเช่นกัน และในแมตช์เบลเยียมพบเซเนกัล การแข่งขันก็ดำเนินไปถึงสกอร์ 2-2 ก่อนจะพลิกกลับมาในต่อเวลาพิเศษ ทำให้ความไม่แน่นอนของรอบน็อคเอาท์ถึงขีดสุด
DeepSeek และ Gemini สร้างตำนานจากการคาดเดาแมตช์โมร็อกโก
จุดที่น่าจดจำที่สุดในตอนนี้คือการคาดการณ์ของ DeepSeek และ Gemini สำหรับเกมเนเธอร์แลนด์ vs โมร็อกโก ก่อนเกมนี้ มันง่ายมากที่จะเลือกข้างผิด—เนเธอร์แลนด์มีกระดานทีมที่แข็งแกร่งกว่า มีผู้เล่นที่สมบูรณ์กว่า โมเดล AI หลายตัวรู้ว่าโมร็อกโกไม่ใช่ทีมที่อ่อน แต่สุดท้ายก็ยังเชื่อว่าเนเธอร์แลนด์จะผ่านไปได้
สิ่งที่ทำให้ DeepSeek และ Gemini โดดเด่นคือพวกมันไม่ได้หยุดแค่ที่ "เกมนี้จะสูสี" แต่เขียนบทต่อไปให้ด้วย Gemini ให้คำทำนายก่อนแข่งว่าผลในเวลาปกติคือ 1-1 และโมร็อกโกชนะในการดวลจุดโทษ ผลปรากฏว่าเกมจบที่ 1-1 จริงๆ และโมร็อกโกชนะจุดโทษ 3-2 ส่งเนเธอร์แลนด์ตกรอบ พวกมันไม่เพียงแค่ทายถูกทาง แต่ยังทายได้ใกล้เคียงว่าเกมจะถูกลากเข้าสู่จุดโทษยังไง และใครจะยิ้มได้ในที่สุด

Gemini ทำนายการแข่งขันระหว่างเนเธอร์แลนด์กับโมร็อกโก
DeepSeek ก็ใกล้เคียงเช่นกัน มันประเมินว่าแมตช์นี้มีโอกาสสูงที่จะจบ 1-1 หรือ 0-0 ในเวลาปกติ และอาจถูกลากไปถึงต่อเวลาพิเศษหรือจุดโทษ โดยโน้มเอียงไปทางโมร็อกโกที่จะอาศัยการป้องกันและโต้กลับเพื่อพลิกชนะผ่านเข้ารอบ

DeepSeek ทำนายการแข่งขันระหว่างเนเธอร์แลนด์กับโมร็อกโก
หลังจากเกมนี้ การมีตัวตนของ DeepSeek และ Gemini ก็พุ่งสูงขึ้นทันที โดยเฉพาะ Gemini ครั้งนี้ดูเหมือนไม่ใช่แค่การคาดการณ์ก่อนแข่ง แต่เหมือนได้ดูบทภาพยนตร์ของเกมมาก่อน
Grok และ Qwen ทายสกอร์เจาะจงได้ต่อเนื่อง มีความเสถียรมากกว่าที่คิด
นอกจาก DeepSeek และ Gemini ที่โดดเด่นในแมตช์โมร็อกโกแล้ว Grok และ Qwen ก็ไม่ได้ไร้ตัวตน จุดเด่นที่สุดของพวกมันคือ ในแมตช์ที่ทิศทางผลชนะเลิศค่อนข้างชัดเจน พวกมันไม่เพียงแต่ทายถูกว่าทีมไหนจะผ่านเข้ารอบ แต่ยังทายสกอร์ที่ใกล้เคียงกับผลจริงอีกด้วย
ยกตัวอย่างแอฟริกาใต้กับแคนาดา ก่อนแข่ง โมเดล AI ส่วนใหญ่เชียร์แคนาดา แต่ความเห็นต่างคือแคนาดาจะชนะได้สบายหรือไม่ Grok ทำนายก่อนเกมว่าแคนาดาจะชนะ 1-0 และ Qwen ก็ทำนายว่าจะชนะขาดหนึ่งประตูเช่นกัน สุดท้ายแคนาดาก็ชนะด้วยประตูเดียวเท่านั้น ไม่ได้เป็นชัยชนะถล่มทลายอย่างที่หลายคนคิด

Qwen ทำนายการแข่งขันระหว่างแอฟริกาใต้กับแคนาดา
แมตช์บราซิลกับญี่ปุ่นก็คล้ายกัน โมเดล AI ส่วนใหญ่คิดว่าบราซิลแข็งแกร่งกว่า แต่ญี่ปุ่นจะสามารถเกาะติดเกมได้หรือไม่คือกุญแจสำคัญ Grok และ Qwen ต่างทำนายสกอร์ว่าจะเป็น 2-1 และสุดท้ายเกมก็จบลงที่บราซิลชนะแบบหืดจับ 2-1 สิ่งที่พวกมันมองถูกไม่ใช่แค่ "บราซิลจะชนะ" แต่คือญี่ปุ่นจะสร้างปัญหาให้บราซิลได้มากพอ
สำหรับแมตช์ไอวอรี่โคสต์กับนอร์เวย์ ทั้งสองโมเดลก็ทำนายได้ค่อนข้างแม่นยำเช่นกัน นอร์เวย์มีฮาแลนด์ ทิศทางการเข้ารอบไม่ยากที่จะเข้าใจ แต่การปะทะทางร่างกายและการโจมตีทางปีกของไอวอรี่โคสต์ก็จะไม่ทำให้เกมกลายเป็นด้านเดียว Grok และ Qwen ต่างทำนายว่านอร์เวย์จะชนะ 2-1 และสกอร์สุดท้ายก็ตรงกับ "บท" นี้พอดี

Grok ทำนายการแข่งขันระหว่างไอวอรี่โคสต์กับนอร์เวย์
ข้อดีของ Grok และ Qwen คือการมองแมตช์เด่นได้ละเอียดกว่า พวกมันไม่ได้เขียนบทใหญ่แบบโมร็อกโกโค่นเนเธอร์แลนด์ไว้ล่วงหน้า แต่ในแมตช์ของแคนาดา บราซิล นอร์เวย์ ฝรั่งเศส เหล่านี้ พวกมันให้ทิศทางผู้ชนะและสกอร์ที่ใกล้เคียง กล่าวอีกนัยหนึ่ง พวกมันอาจไม่ใช่ตัวจับม้ามืดที่ดีที่สุด แต่ถนัดในการประเมินว่าทีมเต็งจะชนะแบบถล่มทลาย หรือชนะแบบหืดจับ
ChatGPT ไม่มีสกอร์เทพมากนัก แต่วิเคราะห์กระบวนการแข่งขันได้ค่อนข้างแม่น
ChatGPT ไม่ได้ทำนายล่วงหน้าแบบ Gemini ว่าโมร็อกโกจะชนะเนเธอร์แลนด์ด้วยจุดโทษ หรือทำนายสกอร์เจาะจงต่อเนื่องแบบ Grok และ Qwen แต่ข้อดีของมันคือ—ในหลายแมตช์ที่ก่อนแข่งดูเหมือนทีมเต็งจะเหนือกว่า ChatGPT จะเตือนอย่างชัดเจนกว่าเล็กน้อยว่าเกมนี้อาจไม่ง่ายอย่างที่คิด
ยกตัวอย่างบราซิลกับญี่ปุ่น ChatGPT ทำนายว่าบราซิลจะเข้ารอบ แต่ไม่ได้เขียนว่าเกมจะเป็นชัยชนะง่ายๆ ของบราซิล กลับพูดถึงการกดดัน การวิ่ง และระเบียบวินัยของญี่ปุ่นที่จะทำให้บราซิลเล่นไม่สะดวก และอาจมีโอกาสทำประตูนำหรือตีเสมอได้ สำหรับแมตช์ไอวอรี่โคสต์กับนอร์เวย์ก็คล้ายกัน ChatGPT ทำนายนอร์เวย์เข้ารอบ แต่บอกล่วงหน้าว่านี่ไม่ใช่เกมง่าย การปะทะทางร่างกาย การโจมตีทางปีก และความสามารถในการเปลี่ยนเกมของไอวอรี่โคสต์จะสร้างปัญหาให้ได้
นอกจากนี้ ในแมตช์น็อคเอาท์ระหว่างอังกฤษกับสาธารณรัฐประชาธิปไตยคองโก ChatGPT ก็ไม่ได้เขียนแค่ว่าอังกฤษจะชนะขาด แต่คิดว่าเกมนี้อาจจะค่อนข้างตึงเครียด สาธารณรัฐประชาธิปไตยคองโกจะใช้การป้องกันต่ำเพื่อดึงจังหวะเกม สุดท้ายอังกฤษถึงแม้จะเข้ารอบ แต่ก็ไม่ได้ชนะอย่างสบาย

ChatGPT ทำนายการแข่งขันระหว่างอังกฤษกับสาธารณรัฐประชาธิปไตยคองโก
จุดแข็งของ ChatGPT ไม่ใช่อยู่ที่การทำนายสกอร์สุดท้ายได้แม่นทุกครั้ง แต่อยู่ที่การบอกล่วงหน้าได้บ่อยครั้งว่าอุปสรรคของเกมอยู่ตรงไหน มันเหมาะที่จะใช้เพื่อทำความเข้าใจเกม แต่อาจไม่เหมาะถ้าต้องการดูแค่สกอร์สุดท้าย มันสามารถอธิบายกระบวนการได้ค่อนข้างแม่น แต่เมื่อต้องเขียนถึงม้ามืดจริงๆ ก็ยังขาดความเด็ดขาดอยู่บ้าง
การตกรอบของเยอรมนี กลายเป็นภาพความล้มเหลวโดยรวมของโมเดล AI
หากแมตช์ก่อนหน้านี้ยังพอเห็นจุดเด่นของแต่ละโมเดลที่แตกต่างกัน แล้วแมตช์เยอรมนีกับปารากวัยก็คือภาพความล้มเหลวโดยรวม
ก่อนแข่ง โมเดล AI ทั้งหมดอยู่ข้างเยอรมนี ChatGPT, Grok, Qwen, Gemini, Claude ต่างก็เชียร์เยอรมนี สกอร์ที่ทำนายส่วนใหญ่อยู่ที่ 2-0, 3-0 หรือ 3-1 เหตุผลก็เหมือนกันหมด: คิดว่าเยอรมนีมีกระดานทีมที่แข็งแกร่งกว่า มีความลึกของขุมกำลังที่ดีกว่า และมีพลังโจมตีมากกว่า
แต่ผลลัพธ์ก็คือเกิดปัญหาขึ้นในแมตช์นี้ โมเดล AI ประเมินความสามารถของปารากวัยในการทำให้เกมติดหล่มต่ำเกินไป เยอรมนีไม่สามารถจัดการเกมให้จบในเวลาปกติได้ และไม่สามารถทำลายความตายมือในต่อเวลาพิเศษได้ สุดท้ายก็ถูกปารากวัยลากเข้าสู่การดวลจุดโทษและตกรอบ
ตอนนี้ใครแม่นที่สุด?
จากแมตช์น็อคเอาท์ที่ผ่านมา ลักษณะของแต่ละโมเดลเริ่มปรากฏชัด
DeepSeek และ Gemini มีจุดเด่นที่สุด พวกมันไม่เพียงแต่สามารถทำนายว่าแบรนด์ดังอย่างบราซิล ฝรั่งเศส จะผ่านเข้ารอบ แต่ในแมตช์ม้ามืดที่ตัดสินยากกว่า ก็ให้คำตอบที่มีน้ำหนักมาก การแข่งขันเนเธอร์แลนด์กับโมร็อกโก ข้อได้เปรียบสำคัญที่สุดของพวกมันคือกล้าที่จะเขียนบทโมร็อกโกพลิกชนะและการดวลจุดโทษล่วงหน้า โดยเฉพาะ Gemini ที่ทำนายโดยตรงว่าโมร็อกโกจะชนะจุดโทษ แมตช์นี้โดดเด่นมากจริงๆ
Grok และ Qwen เป็นเหมือน "นักแม่นสกอร์" มากกว่า พวกมันทำนายสกอร์เจาะจงได้หลายครั้ง โดยเฉพาะในแมตช์แคนาดา บราซิล นอร์เวย์ ฝรั่งเศส ที่ทำผลงานได้ดี แต่ปัญหาคือเมื่อเจอทีมดั้งเดิมอย่างเยอรมนี เนเธอร์แลนด์ สุดท้ายก็ยังเอนเอียงไปทางทีมเต็ง
ChatGPT และ Claude เป็นเหมือน "นักวิเคราะห์" มากกว่า เขียนเหตุผลได้ครบถ้วน ทิศทางส่วนใหญ่ไม่เพี้ยน และสามารถเตือนความเสี่ยงในการต่อเวลาพิเศษได้ แต่ปัญหาคือ พวกมันมักจะมองเห็นว่าเกมไม่ดีที่จะชนะง่าย แต่ก็ไม่กล้าที่จะสรุปไปทางม้ามืด เนเธอร์แลนด์กับโมร็อกโกก็เป็นเช่นนั้น เห็นความเสี่ยงต่อเวลาและจุดโทษชัดเจน แต่สุดท้ายก็ยังเชื่อเนเธอร์แลนด์มากกว่า
ดังนั้น แทนที่จะรีบถามว่าโมเดลไหนรู้เรื่องฟุตบอลที่สุด ก็ควรดูว่าพวกมันเหมาะสมกับสถานการณ์แบบไหนมากกว่า


