BTC
ETH
HTX
SOL
BNB
查看行情
简中
繁中
English
日本語
한국어
ภาษาไทย
Tiếng Việt

AI預測實錄:想靠AI在預測市場賺錢?但它可能連題目都沒看清

南枳
Odaily资深作者
2026-01-04 08:41
本文約2312字,閱讀全文需要約4分鐘
本想靠群體智慧降維打擊,但缺乏引導情況下 AI 依舊幻覺頻出。
AI總結
展開
  • 核心觀點:AI在預測市場表現優於部分人類。
  • 關鍵要素:
    1. Grok勝率75%,高於人類66.7%。
    2. AI依賴搜尋與邏輯,但存在誤判。
    3. AI預測不依賴市場數據,避免跟風。
  • 市場影響:AI或成為新的市場分析工具。
  • 時效性標註:中期影響。

原創 | Odaily(@OdailyChina

作者|南枳(@Assassin_Malvo

在多數賽道被證偽後,預測市場成為加密貨幣圈內少數仍在正向增長的賽道之一。11月20日,南枳開始嘗試用去年尋找迷因幣聰明錢的思路來尋找預測市場的聰明錢,並在初期取得了較好的成果

12月初,正值Gemini 3 Pro上線,在測試相關模型時想到是否可以使用AI對預測市場進行分析和預測,並由人類對陣AI,看哪一方的預測更為準確。

在介紹預測市場時,通常宣稱其通過「讓有見解的人使用真金白銀下注」,從而推動市場向「真相」靠攏。但也有人認為,加密貨幣+預測市場讓「內幕人士」可以安全地獲取資訊差所帶來的利潤,從而帶動市場向「內幕結果」發展。這本質上是「群體智慧」與「真理掌握在少數人手中」兩種觀點的交鋒,而AI預測更偏向於「群體智慧」,因此需要有大量的可用知識和見解。

所以在如何選擇AI模型的問題上,初步選用了Gemini和Grok,因為兩者分別依靠Google和X平台,可以最直接地獲取大量的知識與見解。近期南枳又新增了「豆包+抖音知識」的組合,但由於預測題目尚不多,本篇暫不涉及。

基本規則

  • AI版本:Gemini 2.5 pro(自帶Google搜尋)、Grok 4 Fast(透過OpenRouter調用,啟用原生搜尋功能)
  • 題目選擇:由人類選擇下注題目,AI跟隨預測,但排除了加密貨幣板塊
  • 輸入內容:官方題目(title)、官方描述(Description)、可選答案(其實只有Yes和No)

註:Polymarket的題目分為大類Event和子類Market。大類Event是像「誰是下一任聯準會主席」、「Strategy什麼時候會賣出比特幣」這種大範圍的題目,Event下面又包含了N個子類市場,例如「哈賽特是否會成為下一任聯準會主席」、「Strategy在2026年3月31日前會賣出比特幣」這種具體的選擇。為了與人類預測對齊,這裡選擇了Market作為AI判斷的題目,不向其輸入其他選項。例如只讓它判斷「哈賽特是否會成為下一任聯準會主席」,而非讓它從N個候選人中選出最有可能的那一個。

  • 提示詞設計:
  • 要求AI搜尋最新新聞、官方公告、專家分析報告
  • 要求剔除、禁止使用預測市場數據
  • 基於「證據」,運用邏輯推理進行判斷
  • 只允許輸出Yes和No,並用一段話闡述推理邏輯

當前結果

在預測題目中,已結算21個。Grok勝率最高,為75%;人類為66.7%;而Gemini最低,為52.4%。目前結果可在相關網站查看。

AI犯了什麼錯?

Gemini偶爾誤判當前時間

在題目「Will Trump's approval rating hit 35% in 2025?」中,Gemini表示目前是2025年上半年,所以一切皆有可能,胡亂給出了答案。

但作者使用程式直接要求Gemini輸出當前時間時,Gemini能夠給出正確答案,尚不清楚為何會出現這樣的錯誤時間認知。

AI思考深度不足

在題目「Gemini 3.0 Flash released by December 16?」中,Grok根據「官方最近只提及Gemini 3 Pro及2.5相關版本,極少提及3 Flash,因此證據不足不能判斷」,只考慮了當下資訊。

而Gemini指出「Gemini 1.0於2023年12月發布,而Gemini 2.0 Flash的實驗版於2024年12月推出。延續這一模式,在2025年底推出3.0版本是合乎邏輯的」,並且發現了「最近(2025年12月14日)在網路社群中流傳的一個關於『Gemini 3.0 Flash』的洩漏演示,進一步增強了其即將公開發布的可能性」。

雖然從結論上來看,Gemini的答案反而是錯誤的,但在本題目中可以看出兩者所依賴的資料廣度存在明顯差距。

AI基於常識而非基於證據+邏輯進行推斷

在題目「Trump approval Up or Down this week?」中,Gemini表示「對一年多以後的單週民意調查支持率進行預測具有高度的不確定性」,首先再次出現了「時間誤判」的情況。然後Gemini表示「在任何一個普通星期內,出現導致支持率輕微下降的事件的概率,可能略高於出現能顯著提升支持率的正面事件的概率」,所以支持率下降的可能性更大。生成的結論僅依據主觀常識假設。

而本題目中,Grok基於「政府關門、經濟擔憂、移民政策爭議以及對羅伯·萊納去世評論引發的負面反彈影響」等新聞報導以及民調數據,符合設計預期。

結算條件判斷有誤

在題目「Will Trump release the Epstein files by December 20?」中,Gemini和Grok均已知道「政府將於週五(12月19日)公布『數十萬頁』文件」,而結算條件中明確指出「政府公開發布任何與愛潑斯坦非法活動相關且在所列日期前未公開的文件,即判斷為Yes」。

然而在這一條件下,Gemini表示「在12月20日之前完成『所有』文件的公布是不可能的」,明顯誤判了結算所需要的條件,因此給出了錯誤答案。

小結

綜上所述,Grok的預測勝率已經超越了那些在預測市場上盈利數十萬、數百萬美元的聰明錢,但深入探究其預測邏輯,仍有大量可以引導、改正的地方。

Gemini
AI
預測市場
歡迎加入Odaily官方社群