BTC
ETH
HTX
SOL
BNB
查看行情
简中
繁中
English
日本語
한국어
ภาษาไทย
Tiếng Việt

浙大研究團隊提出新路徑:把人腦理解世界的方式教給 AI

Kei
特邀专栏作者
2026-04-05 04:31
本文約1742字,閱讀全文需要約3分鐘
主流觀點認為模型參數越多,就會越接近人類思考的方式。然而浙大團隊4月1日在Nature Communications上發表的一篇論文則提出了不同的觀點。他們發現當模型(主要為SimCLR、CLIP、DINOv2)規模變大後,識別具體事物的能力確實會繼續提高,但理解抽象概念的能力不僅沒有提高,甚至會有所下降。
AI總結
展開
  • 核心觀點:浙江大學團隊研究發現,大模型參數規模的增長主要提升具體概念識別能力,但會削弱抽象概念理解能力,這揭示了AI與人腦在概念組織方式上的根本差異,並提出了利用腦信號引導模型結構優化的新方向。
  • 關鍵要素:
    1. 研究發現,當模型參數從2206萬增至3.0437億,具體概念任務準確率從74.94%升至85.87%,而抽象概念任務準確率則從54.37%降至52.82%。
    2. 人腦擅長構建層級化概念關係以遷移知識,而模型更依賴數據中的表面特徵,難以穩定形成高級抽象分類。
    3. 團隊提出用人類觀看圖片時的腦信號作為監督,將人腦的概念組織結構遷移給深度神經網絡。
    4. 經腦信號訓練後,模型在少樣本學習和新情境下的抽象概念識別任務中表現顯著提升,平均提升20.5%,甚至超越參數量更大的對照模型。
    5. 該研究將行業焦點從「更大規模」轉向「更優結構」,旨在讓AI的思考方式更接近人腦,實現真正的抽象理解和知識遷移能力。

大模型一直在變大,主流觀點認為模型參數越多,就會越接近人類思考的方式。然而浙大團隊4月1日在Nature Communications上發表的一篇論文則提出了不同的觀點(原文連結:https://www.nature.com/articles/s41467-026-71267-5)。他們發現當模型(主要為SimCLR、CLIP、DINOv2)規模變大後,識別具體事物的能力確實會繼續提高,但理解抽象概念的能力不僅沒有提高,甚至會有所下降。當參數從 2206 萬增加到 3.0437 億後,具體概念任務從 74.94% 升到 85.87%,抽象概念任務從 54.37% 降到 52.82%。

人類和模型思考方式的區別

人腦處理概念時,會先形成一套分類關係。天鵝和貓頭鷹長得不一樣,人還是會把它們放進鳥這一類。再往上,鳥和馬還能繼續放進動物這一層。人看到新東西時,常常會先想,它和以前見過的什麼東西像,大概屬於哪一類。人會持續學習新概念,再把經驗組織起來,用這套關係去識別新事物、適應新情境。

模型也會分類,但形成方式不同。它主要靠大規模數據裡反覆出現的形式。具體對象出現得越多,模型越容易把它認出來。到了更大的類別這一步,模型就比較吃力了。它需要抓住多個對象之間的共同點,再把這些共同點歸到同一類裡。現有模型在這裡還有明顯短板。參數繼續增大後,具體概念任務會提升,而抽象概念任務有時還會下降。

人腦和模型的共同點,是內部都會形成一套分類關係。但是雙方側重點不同,人腦的高階視覺區域會自然分出生物和非生物這類大類。而模型能把具體對象分開,但很難去穩定形成這種更大的分類。這個差別導致人腦更容易把舊經驗用到新對象上,所以面對沒見過的東西時,我們能快速分類。而模型則更依賴現有知識,所以遇到新對象時,更容易停在表面特徵上。論文提出的方法,就是圍繞這個特點展開,用腦信號去約束模型內部結構,讓它更接近人腦的分類方式。

浙大團隊的解決方案

團隊給出的解決方案也很獨特,並不是繼續堆參數,而是拿少量腦信號做監督。這裡的腦信號,來自人看圖片時的大腦活動記錄。論文原文寫的是,把 human conceptual structures transfer 給 DNNs。意思就是把人腦怎麼分類、怎麼歸納、怎麼把相近概念放在一起,盡量教給模型。

團隊用 150 個已知的訓練類別和 50 個沒見過的測試類別做實驗。結果顯示,隨著這套訓練推進,模型和腦表徵之間的距離持續縮小。這個變化同時出現在兩個類別中,這說明模型學到的不是單個樣本,而是真正開始學習一種更接近人腦的概念組織方式。

經過這套訓練後,模型在樣本很少時的學習能力更強,面對新情況時表現也更好了。在一個只給極少示例、卻要求模型區分生物和非生物這類抽象概念的任務裡,模型平均提升了 20.5%,還超過了參數量大得多的對照模型。團隊還另外做了 31 組專門測試,幾類模型都出現了接近一成的提升。

過去幾年,模型行業熟悉的路徑是更大的模型規模。浙大團隊則選擇了另一個方向,從bigger is better 走向 structured is smarter。規模擴張確實很有用,但主要提高的是熟悉任務裡的表現。人類那種抽象理解和遷移能力對AI來說同樣至關重要,這需要在未來讓AI的思考結構更加接近人腦。這個方向的價值,在於它把行業注意力從單純的規模擴張,重新拉回到認知結構本身。

Neosoul與未來

這引出了一個更大的可能性,AI 的進化,未必只發生在模型訓練階段。模型訓練可以決定AI怎樣組織概念,怎樣形成更高品質的判斷結構。再進入真實世界之後,AI的另一層進化才剛開始:AI agent 的判斷如何被記錄,如何被檢驗,如何在真實的互相競爭中不斷成長進化,如同人類般自我學習自我進化。這也正是Neosoul現在所做的。Neosoul不只是讓AI agent 產出答案,而是把AI agent 放進一個持續預測、持續驗證、持續結算、持續篩選的系統裡,讓其不斷在預測與結果中優化自身,讓更好的結構被保留,讓更差的結構被淘汰。浙大團隊與Neosoul共同指向的,其實是同一個目標:讓 AI 不再只會做題,更是要具備全面的思考能力,不斷進化。

Web 4.0