BTC
ETH
HTX
SOL
BNB
查看行情
简中
繁中
English
日本語
한국어
ภาษาไทย
Tiếng Việt

為什麼OpenAI反而在追趕Claude Code?

区块律动BlockBeats
特邀专栏作者
2026-03-13 13:00
本文約9923字,閱讀全文需要約15分鐘
Anthropic更早押注AI編程,OpenAI戰略節奏錯位。
AI總結
展開
  • 核心觀點:OpenAI在AI編程代理領域的競爭中一度落後於Anthropic,這主要源於其早期戰略重心轉向ChatGPT和多模態模型,導致資源分散;如今正通過內部整合、技術迭代和市場競爭,全力追趕並取得顯著進展。
  • 關鍵要素:
    1. 戰略錯位:ChatGPT的巨大成功使OpenAI資源傾斜,原Codex團隊被拆分,AI編程產品開發在2023-2024年間幾乎停滯。
    2. 對手領先:Anthropic更早專注於編程能力,其產品Claude Code於2025年發布後迅速獲得市場認可,貢獻了其近20%的年化收入。
    3. 內部追趕:OpenAI在2024年底重組團隊,加速開發基於o系列推理模型(如o1、o3)的編程代理產品,並於2025年推出Codex。
    4. 市場策略:通過提供遠高於訂閱費的使用額度吸引開發者,Codex用戶規模從2025年9月僅為Claude Code的5%,快速增長至2026年1月的約40%。
    5. 合作制約:與微軟的緊密合作關係(如為GitHub Copilot提供模型)及收購Windsurf的失敗,一定程度上限制了OpenAI獨立推出競爭性產品的路徑。
    6. 行業影響:AI編程代理正從輔助工具轉變為能獨立完成任務的「代理」,引發了關於軟體開發流程變革和白領工作被重新定義的廣泛討論。

原文標題:Inside OpenAI's Race to Catch Up to Claude Code

原文作者:Maxwell Zeff,Wired

原文編譯:Peggy,BlockBeats

編者按:在 AI 程式設計代理迅速崛起的當下,曾憑 ChatGPT 引領生成式 AI 浪潮的 OpenAI,卻在這一關鍵賽道上意外成為「追趕者」。與之形成鮮明對比的是,由前 OpenAI 成員創立的 Anthropic,憑藉 Claude Code 在開發者社群和企業市場迅速走紅,成為 AI 程式設計工具領域的重要領先者之一。

本文透過對 OpenAI 高階主管、工程師以及多位開發者的採訪,揭示了這場競賽背後的真實過程:從早期 OpenAI Codex 項目被拆分、資源轉向 ChatGPT 與多模態模型,到內部團隊重新整合、加速推出 AI 程式設計產品,OpenAI 正在經歷一次從戰略忽視到全面追趕的轉折。某種意義上,這並非技術能力的落後,而是戰略節奏的錯位:ChatGPT 的爆發改變了公司優先級,與 Microsoft 的合作關係限制了產品路徑,而 Anthropic 則更早押注 AI 程式設計賽道。

在這場競賽背後,更深層的問題也逐漸浮現:當 AI 代理開始承擔越來越多的認知型工作時,軟體開發流程乃至白領勞動本身,都可能被重新定義。

以下為原文:

OpenAI 執行長 Sam Altman 把雙腿盤在辦公椅上,仰頭望著天花板,像是在思考某個尚未成形的答案。某種程度上,這也與環境有關。

OpenAI 位於舊金山 Mission Bay 的新總部,是一座由玻璃與淺色木材構成的現代建築,氣質近乎「科技聖殿」。前台後的展示架上擺放著介紹「AI 時代」(Eras of AI)的手冊,彷彿在描繪一條通往技術啟示的路徑。樓梯牆面上貼滿了人工智慧發展的里程碑海報,其中一張記錄著這樣一個時刻:成千上萬名觀眾透過直播見證,一台機器在《Dota 2》比賽中擊敗頂級電競戰隊。走廊裡,研究員穿著印有標語的團隊周邊衫來來往往,其中一件寫著:「好的研究需要時間。」當然,理想情況下,不必太久。

我們坐在一間巨大的會議室裡。我向 Altman 拋出的問題,與正在席捲產業的 AI 程式設計革命有關,以及為什麼 OpenAI 似乎並未在這一波浪潮中佔據領先位置。

如今,數以百萬計的軟體工程師已經開始將部分程式設計工作交給 AI 處理,這讓矽谷許多人第一次真正直面一個現實:自動化可能會觸及他們自己的崗位。程式設計代理(coding agents)也因此成為少數幾個企業願意為 AI 支付高價的應用場景之一。按理說,這樣的時刻完全可能,甚至應該成為 OpenAI 樓梯牆上海報中的下一次「勝利時刻」。但現在,佔據頭條位置的名字卻並不是它。

這家公司的對手是 Anthropic,一家由前 OpenAI 成員創立的 AI 公司。憑藉其程式設計代理產品 Claude Code,Anthropic 獲得了爆發式成長。公司在 2 月披露,該產品已貢獻近五分之一的業務規模,對應年化收入超過 250 億美元。相比之下,據一位知情人士透露,截至 1 月底,OpenAI 自家的程式設計產品 OpenAI Codex 的年化收入僅略高於 100 億美元。

問題在於:為什麼在這場 AI 程式設計競賽中,OpenAI 反而落在了後面?

「先發優勢的價值非常大。」Sam Altman 沉思片刻後說道,「這一點,我們在 ChatGPT 上已經體驗過。」

不過,在他看來,現在正是 OpenAI 全面發力 AI 程式設計的時機。他認為,公司現有的模型能力已經足夠強大,可以支撐高度複雜的程式設計代理(coding agents)。當然,這樣的能力並非偶然,公司為此投入了數十億美元用於模型訓練。

「這將會是一門巨大的生意,」Altman 說,「不僅因為它本身帶來的經濟價值,也因為程式設計所能釋放的通用生產力。」他停頓了一下,又補充道:「我很少輕易使用這個詞,但我認為,這很可能是那種規模達到數兆美元的市場之一。」

更進一步,他認為,OpenAI Codex 或許是通向通用人工智慧(AGI)的「最可能路徑」。按照 OpenAI 的定義,所謂 AGI,是一種能夠在絕大多數具有經濟價值的工作中超越人類表現的 AI 系統。

Sam Altman,OpenAI 執行長。攝影:Mark Jayson Quines。

不過,儘管 Altman 以一種從容不迫的姿態做出自信判斷,過去幾年公司內部的真實情況卻要複雜得多。為了了解更完整的內部故事,我採訪了 30 多位知情人士,包括在公司批准下接受採訪的現任 OpenAI 高階主管與員工,以及一些在匿名條件下介紹公司內部運作情況的前員工。綜合這些敘述,可以看到一個並不常見的局面:OpenAI 正在奮力追趕。

時間回到 2021 年。當時,Altman 和其他 OpenAI 高階主管邀請《WIRED》記者 Steven Levy 來到他們位於舊金山 Mission 區的早期辦公室,觀看一項新技術演示。這是一項基於 GPT-3 衍生出來的項目,使用來自 GitHub 的大量開源程式碼進行訓練。

在現場演示中,高階主管們展示了這款名為 OpenAI Codex 的工具如何接收自然語言指令,並生成簡單的程式碼片段。

「它實際上可以在電腦世界裡替你執行操作,」當時,OpenAI 總裁兼聯合創辦人 Greg Brockman 這樣解釋,「你擁有的是一個能夠真正執行命令的系統。」即便在當時,OpenAI 的研究人員也已經普遍認為,Codex 將成為建構「超級助手」(super assistant)的關鍵技術。

那段時間,Altman 和 Brockman 的日程幾乎被與 Microsoft 的會議填滿——這家軟體巨頭正是 OpenAI 最大的投資方。微軟計劃利用 Codex 為其首批商業化 AI 產品之一提供技術支援:一款名為 GitHub Copilot 的程式碼補全工具,可以直接嵌入程式設計師日常使用的開發環境中。

一位早期 OpenAI 員工回憶說,在那個階段,Codex「基本只能做自動補全」。但微軟高階主管仍將其視為 AI 時代到來的重要訊號。

2022 年 6 月,當 GitHub Copilot 正式公開發布時,短短幾個月內便吸引了數十萬用戶。

Greg Brockman,OpenAI 總裁。攝影:Mark Jayson Quines。

最初負責 Codex 的 OpenAI 團隊隨後被調往其他項目。一位早期員工回憶稱,公司當時的判斷是:未來模型本身就會具備程式設計能力,因此沒有必要長期維持一個獨立的 Codex 項目團隊。一部分工程師被調去參與 DALL-E 2 的開發,另一部分則轉向訓練 GPT-4。在當時看來,這是讓 OpenAI 更接近 AGI 的關鍵路徑。

隨後,2022 年 11 月 ChatGPT 上線,並在兩個月內獲得超過 1 億用戶。公司內部幾乎所有其他項目都因此被迫暫停。此後的幾年裡,OpenAI 實際上沒有一支專門負責 AI 程式設計產品的團隊。一位曾參與 Codex 項目的前成員表示,在 ChatGPT 走紅之後,AI 程式設計似乎不再屬於公司新的「消費級產品優先」戰略範疇。與此同時,業內普遍認為這一領域已經被 GitHub Copilot「覆蓋」,而那本質上是 Microsoft 的主場。OpenAI 主要只是提供底層模型支援。

因此,在 2023 年和 2024 年,OpenAI 的資源更多投向多模態 AI 模型與智慧代理(agents)。這些系統被設計為能夠同時理解文字、圖像、影片和音訊,並像人類一樣操作游標與鍵盤。這一方向在當時看起來更符合產業趨勢:Midjourney 的圖像生成模型在社交網路上迅速走紅,而產業普遍認為,大語言模型必須能夠「看見」和「聽見」世界,才能真正邁向更高層次的智慧。

相比之下,Anthropic 選擇了一條不同路徑。雖然該公司同樣在開發聊天機器人和多模態模型,但它似乎更早意識到程式設計能力的潛力。在最近的一檔播客中,Brockman 也承認,Anthropic 從很早階段就「高度專注於程式設計能力」。他指出,Anthropic 在訓練模型時不僅使用了學術競賽中的複雜程式設計題,還加入了來自真實程式碼倉庫的大量「混亂」程式碼問題。

「這是我們後來才意識到的一課,」Brockman 說。

2024 年初,Anthropic 開始使用這些真實程式碼倉庫資料訓練 Claude 3.5 Sonnet。當該模型在 6 月發布時,許多用戶對其程式設計能力印象深刻。

這種表現尤其在一家名為 Cursor 的新創公司中得到驗證。這家由一群二十多歲年輕人創立的公司,開發了一款 AI 程式設計工具,允許開發者用自然語言描述需求,由 AI 直接修改程式碼。當 Cursor 接入 Anthropic 的新模型後,其用戶規模迅速成長,一位接近該公司的知情人士透露。

幾個月後,Anthropic 開始在內部測試自己的程式設計代理產品,Claude Code。

隨著 Cursor 的人氣不斷上升,OpenAI 一度試圖收購這家新創公司。但據多位接近該公司的消息人士透露,Cursor 的創始團隊在談判尚未深入之前就拒絕了這一提議。他們認為 AI 程式設計產業潛力巨大,因此希望繼續保持獨立發展。

Andrey Mishchenko,OpenAI Codex 研究負責人。攝影:Mark Jayson Quines。

當時,OpenAI 正在訓練其首個所謂的「推理模型」,OpenAI o1。這類模型能夠在給出答案之前,對問題進行逐步推理。OpenAI 在發布時表示,該模型在「準確生成與除錯複雜程式碼」方面表現尤為突出。

Mishchenko 解釋說,AI 模型之所以在程式設計能力上取得明顯進步,一個重要原因在於:程式設計是一種「可驗證任務」(verifiable task)。程式碼要麼能運行,要麼不能運行,這為模型提供了非常明確的回饋訊號。一旦出錯,系統就能迅速知道哪裡出了問題。OpenAI 正是利用這種回饋循環,不斷讓 o1 在更複雜的程式設計問題上進行訓練。

「如果沒有在程式碼庫中自由探索、實施修改並測試自身結果的能力——這些都屬於『推理』能力的一部分——那麼今天的程式設計代理不可能達到現在的水平。」他說。

到 2024 年 12 月,OpenAI 內部已經出現多個小團隊開始專注於 AI 程式設計代理。其中一個團隊由 Mishchenko 與 Thibault Sottiaux 共同領導。Sottiaux 曾任職於 Google DeepMind,如今是 OpenAI 的 Codex 負責人。

起初,他們對程式設計代理的興趣主要來自內部研發需求,希望利用 AI 自動化完成大量重複性的工程工作,例如管理模型訓練任務、監控 GPU 叢集運行狀態等。

另一項並行的嘗試則由 Alexander Embiricos 主導。他此前負責 OpenAI 的多模態代理項目,如今擔任 Codex 的產品負責人。Embiricos 曾開發過一個名為 Jam 的演示項目,並在公司內部迅速傳播開來。

Thibault Sottiaux,OpenAI Codex 負責人。攝影:Mark Jayson Quines。

與透過滑鼠和鍵盤控制電腦不同,Jam 可以直接存取電腦的命令列。2021 年的 Codex 演示還只是展示 AI 為人類生成程式碼,由人類手動運行;而 Embiricos 的版本則可以自己執行這些程式碼。他回憶說,當時看著一頁即時記錄 Jam 操作行為的網頁在自己筆記型電腦上不斷刷新更新,內心幾乎被震撼到。

「有一段時間,我一直在想,多模態互動可能是實現我們使命的路徑。比如人類整天與 AI 共享螢幕、一起工作。」Embiricos 說,「後來突然變得非常清晰:也許,讓模型直接獲得對電腦的程式化存取權限,才是實現這一目標的真正方式。」

這些分散的項目花了幾個月時間才逐漸整合成一個統一方向。到 2025 年初,當 OpenAI 完成對 OpenAI o3 的訓練時,這是一款在程式設計任務上比 OpenAI o1 更進一步優化的模型,公司終於擁有了建構真正 AI 程式設計產品的技術基礎。但與此同時,Anthropic 的 Claude Code 已經準備公開發布。

在 Claude Code 發布之前(2025 年 2 月以「有限研究預覽」形式推出,5 月全面上線),當時 AI 程式設計領域的主流模式還被稱為 「vibe coding」。開發者透過 AI 輔助工具推動項目進展,由人類掌控方向,而 AI 在過程中補充具體實現。這類工具已經吸引了數億美元投資。

但 Anthropic 的新產品改變了這一模式。像 Jam 演示一樣,Claude Code 可以直接透過電腦的命令列運行,這意味著它能夠存取開發者的全部檔案與應用程式。程式設計不再只是「AI 輔助」,而是開發者可以把整項工作直接交給 AI 代理完成。

面對這一變化,OpenAI 開始加速推出競爭產品。Sottiaux 回憶說,他在 2025 年 3 月組建了一支「衝刺團隊」(sprint team),任務是在幾週內整合公司內部多個團隊,盡快推出 AI 程式設計產品。

與此同時,Altman 還嘗試透過收購來實現「彎道超車」,以 300 億美元收購 AI 程式設計新創公司 Windsurf。OpenAI 高層認為,這筆交易將為公司帶來一個成熟的 AI 程式設計產品、一支經驗豐富的團隊,以及現成的企業客戶基礎。

但這筆收購案隨後陷入停滯。據 The Wall Street Journal 報導,問題出在 OpenAI 的最大合作夥伴 Microsoft。微軟希望能夠獲得 Windsurf 的智慧財產權存取權。自 2021 年以來,微軟一直使用 OpenAI 的模型為 GitHub Copilot 提供技術支援,這一產品也成為微軟財報電話會議中的亮點之一。但隨著 Cursor、Windsurf 以及 Claude Code 推出新的 AI 程式設計代理體驗,GitHub Copilot 開始顯得停留在上一代 AI 工具階段。如果 OpenAI 再推出一款新的程式設計產品,對微軟來說未必是好消息。

這筆收購談判正好發生在 OpenAI 與微軟關係最緊張的時期。雙方當時正在重新談判合作協議,而 OpenAI 試圖削弱微軟對其 AI 產品與算力資源的控制權。最終,Windsurf 收購案成為這場博弈的犧牲品。到 7 月,OpenAI 放棄了這筆交易。隨後,Google 聘請了 Windsurf 的創始團隊,而其餘員工則被另一家 AI 程式設計公司 Cognition 收購。

「我當時當然很希望這筆交易能夠完成,」Altman 說,「但並不是每一筆交易都能掌控。」他表示,雖然原本希望 Windsurf 的收購「能在一定程度上加速我們的進展」,但他對 Codex 團隊的發展勢頭同樣印象深刻。在談判進行的同時,Sottiaux 和 Embiricos 仍在持續開發產品並推出更新。

到 8 月,Altman 決定全面加速推進。

Alexander Embiricos,OpenAI Codex 產品負責人。攝影:Mark Jayson Quines。

Greg Brockman 衡量 AI 能力最喜歡的一種方式,是他自己設計的一款小遊戲,「反向圖靈測試」(Reverse Turing Test)。幾年前他親手寫下了這個遊戲的程式碼,如今則會把任務交給 AI 代理,從零開始重新實現。

遊戲規則很簡單:兩名人

創始人
AI
歡迎加入Odaily官方社群