Anthropic打造出史上最強AI模型，卻不敢發布……

Azuma

Odaily资深作者

@azuma_eth

2026-04-08 03:58

本文約2631字，閱讀全文需要約4分鐘

短短幾週時間，新模型識別出了數千個從未被發現的新漏洞，甚至還自行構建了攻擊路徑。

AI總結

展開

核心觀點：Anthropic聯合多家科技巨頭啟動「玻璃之翼」計劃，旨在透過其革命性的AI模型Mythos提前發現並修復全球關鍵軟體中的安全漏洞，以應對AI能力提升對網路安全格局帶來的雙重影響。
關鍵要素：
1. Mythos是人類首個參數超十萬億的AI模型，訓練成本達100億美元，在編碼、推理及網路安全測試中性能大幅超越現有頂級模型。
2. 該模型在幾週內自主發現了數千個零日漏洞，包括OpenBSD中一個存在27年的高危漏洞，展現了接近頂級駭客的自動化攻防能力。
3. 出於安全考慮，Anthropic不直接公開發布Mythos，而是透過「玻璃之翼」計劃，聯合頭部企業進行有限度的漏洞排查與修復。
4. 計劃將提供1億美元模型使用額度，並向開源安全組織捐贈400萬美元，以支持全球軟體安全加固工作。
5. Anthropic認為，儘管AI可能降低攻擊門檻，但其在主動防禦和構建更安全軟體方面的價值同樣巨大，關鍵在於防禦體系的同步進化。

原創 | Odaily（@OdailyChina）

作者｜Azuma（@azuma_eth）

4 月 8 日，Claude 背後的 AI 開發公司 Anthropic 官方宣布將推出一項名為「玻璃之翼」（Project Glasswing）的新計劃，該計劃將與亞馬遜、蘋果、博通、思科、CrowdStrike、谷歌、摩根大通、Linux 基金會、微軟、輝達和 Palo Alto Networks 等多家頭部大廠聯合推進。

Anthropic 表示，這是一項旨在保護全球最關鍵軟體的緊急舉措，各方將共同使用 Mythos Preview 版本來發現並修復當前世界賴以生存的系統中的潛在缺陷。

所謂 Mythos，即 Anthropic 正在開發的下一代 AI 模型，這是人類歷史上第一個總參數突破十萬億量級的模型（與之相對，當前市面上的主流模型參數量都在數千億到一萬億級別），訓練成本達到了驚人的 100 億美元。相較於 Claude 當前最強大的模型 Opus 4.6，Mythos 在軟體編碼、學術推理和網路安全等測試中得分均大幅提高。

關於 Mythos 的傳言上週便已在市場流傳，當時市場的普遍擔憂是 —— 擁有網路安全特化能力的 Mythos 是否會影響當前的安全攻防格局？如若被惡意利用，是否會造成更大規模的安全事故？Odaily 當時亦曾報導此事，並曾與業界安全專家、慢霧創始人餘弦探討對加密貨幣行業安全攻防的潛在影響（詳見《Odaily 專訪餘弦：Anthropic 核彈級新模型洩漏，如何影響加密安全攻防？》），但當時 Anthropic 方面並未公開承認 Mythos 的存在，因此相關資訊仍然有限。

4 月 8 日，隨著「玻璃之翼」計劃的公布，Anthropic 也披露了更多 Mythos 的相關細節。基於 Anthropic 方面公布的實測案例來看，Anthropic 對於 Mythos 的能力並未誇大，以至於該公司甚至不敢直接公開發布該模型，以防被駭客群體惡意利用，而是計劃先通過「玻璃之翼」計劃讓頭部大廠試用排查，提前修補潛在漏洞。

Mythos 秀肌肉：幾週時間，挖出數千個「零日漏洞」

在談及 Mythos 的實力時，Anthropic 直言表示，該模型的誕生意味著一個嚴峻的事實已經到來 —— AI 模型的編碼能力已經達到了極高的水平，在發現和利用軟體漏洞方面，它們幾乎可以超越除了最熟練的人類之外的所有人。

根據 Anthropic 方面的披露，在短短幾週時間內，Anthropic 使用 Mythos 識別出了數千個零日漏洞（即此前連軟體開發者自身都未曾發現的缺陷），其中許多屬於高危漏洞，問題覆蓋了所有主流作業系統和主流瀏覽器，並波及一系列其他關鍵軟體。

Anthropic 給出了幾個頗具代表性的案例：

Mythos 發現了 OpenBSD 中一個存在 27 年的漏洞，該系統一直以「極度安全」著稱，被廣泛用於防火牆等關鍵基礎設施，而這一漏洞允許攻擊者遠端直接使系統崩潰；
在被大量軟體使用的視訊處理庫 FFmpeg 中，Mythos 找到了一個存在 16 年的漏洞，該問題所在程式碼曾被自動化測試觸發超過 500 萬次，但始終未被發現；
Mythos 還能夠將 Linux 核心中的多個漏洞自動串聯，從普通使用者權限升級至完全控制伺服器。

更令人擔憂的是，Anthropic 表示這些漏洞大多是 Mythos 在幾乎無人干預的情況下「自主發現並構造利用路徑」的，這或許意味著 AI 已經開始具備類似頂級駭客團隊的自動化攻防能力。

在評測基準上，Mythos 較 Opus 4.6 也呈現出了斷層級的進化。例如在網路安全漏洞復現測試中，Mythos 達到 83.1%，而 Opus 4.6 則為 66.6%；在多項編碼與推理測試中，Mythos 的得分同樣實現大幅領先。

或許正是因為 Mythos 的能力過於強大，Anthropic 並沒有選擇直接開放模型，而是先推出了「玻璃之翼」計劃，讓整個網際網路提前「加固」。

通過該計劃，Anthropic 將向計劃參與方提前開放 Mythos Preview 版本，用於發現並修復其基礎系統中的漏洞或弱點——重點聚焦於本地漏洞檢測、二進位程式黑盒測試、終端安全加固以及系統滲透測試等任務。

Anthropic 還承諾，將向計劃參與方提供總計 1 億美元的模型使用額度，以支持整個研究預覽階段的使用。此後，Mythos Preview 版本將以每百萬輸入 / 輸出 tokens 分別 25 美元 / 125 美元的價格向參與方開放（參與者也可通過 Claude API、Amazon Bedrock、Google Cloud Vertex AI 以及 Microsoft Foundry 存取該模型）。除去模型使用額度外，Anthropic 還會通過 Linux 基金會向 Alpha-Omega 和 OpenSSF 捐贈 250 萬美元，並向 Apache 軟體基金會捐贈 150 萬美元，以幫助開源軟體維護者應對不斷變化的安全環境。

Anthropic 計劃逐步擴大「玻璃之翼」的參與範圍，並持續推進數月，同時盡可能分享經驗，以便其他組織能夠將相關經驗應用於自身安全建設。90 天內，Anthropic 將公開報告階段性成果，包括已修復的漏洞以及可披露的安全改進措施。