BTC
ETH
HTX
SOL
BNB
查看行情
简中
繁中
English
日本語
한국어
ภาษาไทย
Tiếng Việt

Karpathy為何突然加入Anthropic,只能當Dario的「-2」?

星球君的朋友们
Odaily资深作者
2026-05-20 07:48
本文約4817字,閱讀全文需要約7分鐘
一個做過Hinton和李飛飛學生、奧特曼同事、馬斯克直屬下屬的人,為什麼甘願做Dario Amodei的「-2」?Anthropic又為什麼非要招他?
AI總結
展開
  • 核心觀點:OpenAI共同創辦人、特斯拉前AI總監Andrej Karpathy宣布加入Anthropic,將組建團隊專注於利用Claude模型加速預訓練研究。此舉標誌著Anthropic在人才爭奪中的重大勝利,並預示著「AI自我改進」的進化飛輪可能加速。
  • 關鍵要素:
    1. Karpathy加入Anthropic預訓練團隊,由Nick Joseph領導,任務是利用Claude自身來加速預訓練研究,旨在用更少算力訓出更好模型。
    2. Karpathy的地位源於其定義行業概念典範的能力(如「Software 2.0」、「Vibe Coding」),而非單純的技術能力,被視為連接理論與實踐的橋樑。
    3. 這是兩年內第三位從OpenAI投向Anthropic的核心人物,此前有Jan Leike和John Schulman,人才單向流動加劇,突顯Anthropic「以研究質量取勝」路線的吸引力。
    4. Anthropic的Mythos模型展現出「湧現」能力,能在未經專門訓練的情況下自主發現深層系統漏洞,證明預訓練提升能帶來超越預期的能力。
    5. Karpathy的加入可能讓Anthropic這個最強模型成為改進自身訓練的工具,實現「AI改進AI」的飛輪,一旦成功將改寫當前算力和數據的競賽邏輯。

原文編輯:馬可

原文來源:新智元

5 月 19 日晚上 11 點,Andrej Karpathy 親自官宣加入了 Anthropic。

圖片

這個名字的分量不需要多解釋。

OpenAI 聯合創始人,特斯拉前 AI 總監,「Vibe Coding」之父,全球最有影響力的 AI 教育者。

他在 AI 領域的地位,大概相當於籃球界的詹姆斯,到哪支隊伍都是頭條。

他在 X 上只發了三句話。

圖片

https://x.com/karpathy/status/2056753169888334312

第一句說 LLM 前沿的未來幾年「尤其具有塑造性」。第三句說他仍然熱愛教育。中間那句最關鍵,五個詞,「回歸研發」。

這是兩年內第三位從 OpenAI 陣營投奔 Anthropic 的核心人物。

也是一個即將 40 歲、功成名就、財務自由的人,主動選擇去給別人的下屬當下屬。

為什麼走?為什麼是 Anthropic?Anthropic 又為什麼非要招他?

每一個問題背後都有一層值得拆開看的東西。

他去做什么

Karpathy 本週已經開始工作,進入了 Anthropic 預訓練團隊。

這個團隊由 Nick Joseph 領導,負責 Claude 所有大規模訓練運行。

Anthropic 發言人向 TechCrunch 確認,Karpathy 將組建一個新的子團隊,專注於用 Claude 自身來加速預訓練研究。

Nick Joseph 也在 X 上補充了背景,「他將建立一個團隊,專注於用 Claude 加速預訓練研究本身。」

圖片

https://x.com/nickevanjoseph/status/2056760504949842219

TechCrunch 評價稱,「Karpathy 是少數能在 LLM 理論與大規模訓練實踐之間架起橋樑的研究者之一。」

Axios 則把這件事定性為「Anthropic 在人才爭奪中的重大勝利」。

同日宣布加入 Anthropic 的還有網路安全專家 Chris Rohlf,此前 xAI 創始成員 Ross Nordeen 也在本月早些時候加入。人才流向的方向性越來越明顯。

圖片

https://x.com/chrisrohlf/status/2056744653165092983

在 Polymarket 的數據可以作為市場情緒的旁證——交易者給 Anthropic 在 6 月底擁有最佳 AI 模型的概率定價為 65%,而 OpenAI 為 4%。

圖片

https://polymarket.com/event/which-company-has-best-ai-model-end-of-june

Karpathy 的加入進一步強化了這個判斷。

定義者 Karpathy

要理解這次加入的重量,需要理解 Karpathy 這個人的稀缺性。

他的稀缺不在於技術能力,頂級研究者有一批。

他的稀缺,在於他能用一個詞改變整個行業理解某件事的方式。

1986 年生於斯洛伐克,15 歲移民加拿大多倫多。

在多倫多大學讀本科時選修了 Geoffrey Hinton 的課程並參加了他的讀書會。

Hinton 是深度學習復興運動的精神領袖,2018 年圖靈獎得主,2024 年諾貝爾物理學獎得主。

圖片

Karpathy 是最早被這把火點燃的年輕人之一。

之後在 Stanford 師從另一位傳奇人物李飛飛,博士期間創建了 CS231n 課程。

圖片

這門課從 2015 年的 150 名學生漲到 2017 年的 750 人,全部影片講義公開上網,成為全球無數工程師自學深度學習的第一站,更是電腦視覺第一神課,沒有之一。

圖片

2015 年,他成為 OpenAI 的創始研究科學家。

圖片

2017 年被馬斯克招至特斯拉擔任 AI 高級總監,推動自動駕駛走向純視覺方案。

在這次挖角中,馬斯克承受了巨大的壓力。

圖片

https://www.cnbc.com/2026/05/19/anthropic-hires-openai-cofounder-andrej-karpathy-former-tesla-ai-lead.html

同年,Karpathy 在 Medium 上發表了一篇文章,提出了「Software 2.0」概念,主張神經網路權重就是新的程式碼,資料集就是新的原始碼,梯度下降就是新的編譯器。

這個框架重塑了整個行業對「什麼是程式設計」的認知。

2022 年離開特斯拉後,他在 YouTube 上創建了「Neural Networks: Zero to Hero」系列課程,頻道突破百萬訂閱。

同期的開源專案 micrograd、nanoGPT、nanochat,程式碼量極少但精準擊中核心概念,被稱為「可運行的教科書」。

2025 年 2 月,他造出了「Vibe Coding」一詞,被柯林斯詞典選為年度詞彙。

圖片

https://x.com/karpathy/status/1886192184808149383

6 月在 YC AI Startup School 演講中提出「Software 3.0」和「Agent 的十年」框架,成為當年討論最廣的 AI 演講之一。

TIME 在 2024 年將他列入「AI 領域最具影響力 100 人」。

從 Hinton,到李飛飛,到奧特曼,再到馬斯克,他在每個節點都站在最前沿。

但他留下的最持久的東西不是任何一個產品或論文,而是那些概念框架。

Software 2.0、Vibe Coding、LLM OS。這些詞改變了人們思考 AI 的方式。

圖片

為什麼甘願做「-2」

Karpathy 的職業生涯有一條清晰的線索,他追逐的從來不是頭銜。

他做過Hinton和李飛飛的學生、奧特曼的同事、馬斯克的直接下屬。

每一段經歷裡,他的組織架構位置都是高層。

現在他加入 Anthropic,直接上司是 Nick Joseph,預訓練負責人。

圖片

Nick Joseph 彙報給 Dario Amodei。

Karpathy 在組織架構中排到了第三層。

Nick Joseph 是 Anthropic 創始 11 人之一,此前在 Vicarious 和 OpenAI 工作。

在 OpenAI 期間,他在安全團隊做程式碼模型,看到 GPT-3 微調之後能寫程式碼,意識到 AI 可以自我改進,於是跟著安全團隊的領導一起離開,創建了 Anthropic。

他的團隊訓出了 Claude 全系列模型,包括 Mythos。

Karpathy 願意在 Nick Joseph 下面做研究,原因很簡單,這個位置離他想做的事最近。

回溯他的每一次職業變動,驅動力都是同一個,「此刻最大的實驗在哪裡」。

2017 年去 Tesla,因為自動駕駛是 Software 2.0 最大的實驗場。

2022 年離開,因為架構已定,剩下的是工程優化。

2023 年回 OpenAI,因為 ChatGPT 隨著 GPT-4 發佈帶來的爆發期是最刺激的前沿。

2024 年創辦 Eureka Labs,想驗證 AI 原生教育的假設。

2026 年加入 Anthropic,因為「用 AI 研究 AI」的預訓練革命正在這裡發生。

每一次離開都不是出於不滿,而是當下的位置不再是最大的實驗所在。

為什麼不回 OpenAI?人才流向給出了答案。

Jan Leike,OpenAI 前對齊負責人,2024 年 5 月加入 Anthropic。

圖片

OpenAI 聯合創始人 John Schulman,同年 8 月跟進。

圖片

現在輪到了 Karpathy。

兩年三人,全部單向流動,沒有任何可比的反向案例。

OpenAI 的戰略重心已經從純研究轉向了平台化和收購。Chat.com、io Products、Windsurf、TBPN,收購間隔越來越短,金額越來越大。

這是一家正在變成「AI 時代消費巨頭」的公司。

對一個想「回歸研發」的研究者來說,Anthropic「以研究質量取勝」的路線更有吸引力。

Anthropic 為什麼如此想要他

Anthropic 的招聘動機可以分成幾層。

最表層是技術需求。

Anthropic 的算力預算再大,也比不過微軟撐腰的 OpenAI 和坐擁 TPU 的谷歌。

純堆算力的競賽,Anthropic 贏不了。

它必須找到一種用更少算力訓出更好模型的方法。

「用 Claude 加速預訓練研究」就是這條路線,而 Karpathy 同時具備預訓練理論深度、大規模工程經驗、和對 AI 輔助研究的直覺,三者兼備的人極少。

再往下是人才信號。

兩年三位 OpenAI 核心人物單向流入 Anthropic,「一線研究者用腳投票」的敘事已經成型。

每一個 Karpathy 級別的加入,都在降低下一個頂級人才加入的心理門檻。人才吸引人才,飛輪自轉。

還有 IPO 前的品牌鍍金。

Anthropic 正在以 9000 億美元估值談 300 億美元融資,IPO 準備也在推進。

Karpathy 是 AI 領域公眾辨識度最高的技術人物之一,百萬 YouTube 訂閱,年度詞彙造詞者,22 萬 GitHub 星標的 CLAUDE.md 倉庫。

他的名字出現在 Anthropic 的員工名單上,直接給了投行一句可以寫進招股書的話。

但最有意思的一層可能是 Anthropic 沒有明確作為招聘動機、卻註定會收穫最大回報的東西:Karpathy 定義範式的能力。

他在 Anthropic 做的任何技術探索都會被他公開談論:推文、部落格、YouTube 影片。

當他用他特有的方式給正在發生的事情命名時,Anthropic 就自然成為那個範式的原產地。

招了一個頂級預訓練研究者,附帶獲得了行業最有影響力的技術敘事者。

飛輪的

創始人
技術
AI