AI Dự Đoán Thực Lục: Muốn Kiếm Tiền Trên Thị Trường Dự Đoán Bằng AI? Nhưng Nó Có Thể Còn Chưa Đọc Kỹ Đề Bài

Odaily资深作者

2026-01-04 08:41

Bài viết này có khoảng 2312 từ, đọc toàn bộ bài viết mất khoảng 4 phút

Vốn định dùng trí tuệ tập thể để "giáng cấp tấn công", nhưng trong tình trạng thiếu định hướng, AI vẫn thường xuyên ảo giác.

Tóm tắt AI

Mở rộng

Quan điểm cốt lõi: AI có biểu hiện tốt hơn một số con người trên thị trường dự đoán.
Yếu tố then chốt:
1. Tỷ lệ thắng của Grok là 75%, cao hơn con người (66.7%).
2. AI phụ thuộc vào tìm kiếm và logic, nhưng tồn tại sự phán đoán sai.
3. Dự đoán của AI không phụ thuộc vào dữ liệu thị trường, tránh xu hướng đám đông.
Tác động thị trường: AI có thể trở thành công cụ phân tích thị trường mới.
Ghi chú tính kịp thời: Tác động trung hạn.

Original | Odaily

Author｜Nan Zhi (@Assassin_Malvo)

Sau khi hầu hết các lĩnh vực bị chứng minh là sai, thị trường dự đoán đã trở thành một trong số ít lĩnh vực vẫn đang tăng trưởng tích cực trong cộng đồng Crypto. Vào ngày 20 tháng 11, Nan Zhi bắt đầu thử nghiệm việc tìm kiếm "smart money" trên thị trường dự đoán bằng cách tiếp cận tương tự như tìm kiếm "smart money" trong Meme vào năm ngoái, và đã đạt được kết quả khá tốt trong giai đoạn đầu.

Đầu tháng 12, đúng vào thời điểm Gemini 3 Pro ra mắt, khi đang thử nghiệm các mô hình liên quan, tôi nghĩ đến việc liệu có thể sử dụng AI để phân tích và dự đoán thị trường dự đoán hay không, và để con người đối đầu với AI để xem bên nào dự đoán chính xác hơn.

Khi giới thiệu về thị trường dự đoán, người ta thường tuyên bố rằng nó thúc đẩy thị trường tiến gần hơn đến "sự thật" bằng cách "cho phép những người có hiểu biết đặt cược bằng tiền thật". Tuy nhiên, cũng có người cho rằng Crypto + thị trường dự đoán cho phép "người trong cuộc" kiếm lợi nhuận một cách an toàn từ chênh lệch thông tin, từ đó thúc đẩy thị trường phát triển theo hướng "kết quả nội bộ". Về bản chất, đây là cuộc đối đầu giữa hai quan điểm: "trí tuệ đám đông" và "sự thật nằm trong tay số ít". Dự đoán của AI thiên về "trí tuệ đám đông" hơn, do đó cần có một lượng lớn kiến thức và hiểu biết có thể sử dụng được.

Vì vậy, về vấn đề lựa chọn mô hình AI, ban đầu đã chọn Gemini và Grok, vì cả hai dựa vào nền tảng Google và X, có thể tiếp cận trực tiếp nhất với lượng lớn kiến thức và hiểu biết. Gần đây, Nan Zhi đã bổ sung thêm sự kết hợp "Doubao + kiến thức từ Douyin", nhưng do số lượng câu hỏi dự đoán còn ít nên sẽ không đề cập trong bài viết này.

Quy tắc cơ bản

Phiên bản AI: Gemini 2.5 pro (tích hợp tìm kiếm Google), Grok 4 Fast (được gọi thông qua OpenRouter, kích hoạt tính năng tìm kiếm gốc)
Lựa chọn câu hỏi: Con người chọn câu hỏi để đặt cược, AI theo dõi và dự đoán, nhưng loại trừ các chủ đề thuộc lĩnh vực Crypto
Nội dung đầu vào: Tiêu đề chính thức (title), Mô tả chính thức (Description), Các phương án trả lời tùy chọn (thực tế chỉ có Yes và No)

Lưu ý: Các câu hỏi trên Polymarket được chia thành danh mục chính Event và danh mục con Market. Danh mục chính Event là những câu hỏi rộng như "Ai sẽ là Chủ tịch Fed tiếp theo?" hay "Khi nào Strategy sẽ bán Bitcoin?". Dưới mỗi Event lại bao gồm N thị trường con, ví dụ như "Liệu Hassett có trở thành Chủ tịch Fed tiếp theo không?" hay "Strategy sẽ bán Bitcoin trước ngày 31 tháng 3 năm 2026?". Để phù hợp với dự đoán của con người, ở đây chọn Market làm câu hỏi để AI đánh giá, không cung cấp các lựa chọn khác. Ví dụ, chỉ yêu cầu AI đánh giá "Liệu Hassett có trở thành Chủ tịch Fed tiếp theo không?" thay vì yêu cầu nó chọn người có khả năng nhất từ N ứng cử viên.

Thiết kế prompt:
Yêu cầu AI tìm kiếm tin tức mới nhất, thông báo chính thức, báo cáo phân tích của chuyên gia
Yêu cầu loại bỏ, cấm sử dụng dữ liệu từ thị trường dự đoán
Đưa ra phán đoán dựa trên "bằng chứng" và sử dụng suy luận logic
Chỉ được phép xuất ra Yes hoặc No, và giải thích logic suy luận trong một đoạn văn

Kết quả hiện tại

Trong số các câu hỏi dự đoán, đã có 21 câu được thanh toán. Grok có tỷ lệ thắng cao nhất là 75%, con người là 66.7%, và Gemini thấp nhất là 52.4%. Kết quả hiện tại có thể được xem trên trang web liên quan.

AI đã mắc những sai lầm gì?

Gemini đôi khi đánh giá sai thời gian hiện tại

Trong câu hỏi "Will Trump's approval rating hit 35% in 2025?", Gemini cho biết hiện tại là nửa đầu năm 2025, nên mọi thứ đều có thể xảy ra, và đã đưa ra câu trả lời một cách tùy tiện.

Tuy nhiên, khi tác giả sử dụng chương trình để yêu cầu Gemini trực tiếp xuất thời gian hiện tại, Gemini có thể đưa ra câu trả lời đúng. Hiện vẫn chưa rõ tại sao lại có nhận thức sai lầm về thời gian như vậy.

AI thiếu chiều sâu suy nghĩ

Trong câu hỏi "Gemini 3.0 Flash released by December 16?", Grok dựa trên việc "gần đây chính thức chỉ đề cập đến Gemini 3 Pro và các phiên bản liên quan 2.5, rất ít khi đề cập đến 3 Flash, do đó không đủ bằng chứng để đánh giá", chỉ xem xét thông tin hiện tại.

Trong khi đó, Gemini chỉ ra rằng "Gemini 1.0 được phát hành vào tháng 12 năm 2023, và phiên bản thử nghiệm của Gemini 2.0 Flash ra mắt vào tháng 12 năm 2024. Tiếp tục theo mô hình này, việc phát hành phiên bản 3.0 vào cuối năm 2025 là hợp lý", và phát hiện ra "một bản demo bị rò rỉ gần đây (ngày 14 tháng 12 năm 2025) về 'Gemini 3.0 Flash' đang lan truyền trong cộng đồng mạng, làm tăng thêm khả năng nó sẽ sớm được công bố chính thức".

Mặc dù xét về kết luận, câu trả lời của Gemini lại là sai, nhưng trong câu hỏi này, có thể thấy rõ ràng sự khác biệt đáng kể về phạm vi tài liệu mà hai mô hình dựa vào.

AI suy luận dựa trên kiến thức phổ thông thay vì dựa trên bằng chứng + logic

Trong câu hỏi "Trump approval Up or Down this week?", Gemini cho biết "việc dự đoán tỷ lệ ủng hộ trong một tuần duy nhất sau hơn một năm là rất không chắc chắn", một lần nữa xuất hiện tình trạng "đánh giá sai thời gian". Sau đó, Gemini nói rằng "trong bất kỳ tuần bình thường nào, xác suất xảy ra sự kiện dẫn đến sự sụt giảm nhẹ tỷ lệ ủng hộ có thể cao hơn một chút so với xác suất xảy ra sự kiện tích cực có thể làm tăng đáng kể tỷ lệ ủng hộ", vì vậy khả năng tỷ lệ ủng hộ giảm là cao hơn. Kết luận được tạo ra chỉ dựa trên giả định chủ quan mang tính kiến thức phổ thông.

Trong khi đó, trong câu hỏi này, Grok dựa trên các báo cáo tin tức như "đóng cửa chính phủ, lo ngại về kinh tế, tranh cãi về chính sách nhập cư và tác động tiêu cực từ những lời chỉ trích về cái chết của Rob Reiner" cũng như dữ liệu thăm dò ý kiến, phù hợp với thiết kế dự kiến.

Đánh giá sai điều kiện thanh toán

Trong câu hỏi "Will Trump release the Epstein files by December 20?", cả Gemini và Grok đều đã biết rằng "chính phủ sẽ công bố 'hàng trăm nghìn trang' tài liệu vào thứ Sáu (ngày 19 tháng 12)". Trong khi đó, điều kiện thanh toán chỉ rõ: "Nếu chính phủ công khai phát hành bất kỳ tài liệu nào liên quan đến các hoạt động bất hợp pháp của Epstein và chưa được công bố trước ngày được liệt kê, thì sẽ được đánh giá là Yes".

Tuy nhiên, dưới điều kiện này, Gemini lại cho rằng "việc hoàn thành việc công bố 'tất cả' các tài liệu trước ngày 20 tháng 12 là không thể", rõ ràng đã đánh giá sai điều kiện cần thiết để thanh toán, do đó đã đưa ra câu trả lời sai.

Tóm tắt

Tóm lại, tỷ lệ dự đoán chính xác của Grok đã vượt qua những "smart money" kiếm được hàng trăm nghìn, hàng triệu USD trên thị trường dự đoán. Tuy nhiên, khi đi sâu vào tìm hiểu logic dự đoán của nó, vẫn còn rất nhiều điểm có thể hướng dẫn và sửa chữa.

Gemini

thị trường dự đoán

Chào mừng tham gia cộng đồng chính thức của Odaily