BTC
ETH
HTX
SOL
BNB
查看行情
简中
繁中
English
日本語
한국어
ภาษาไทย
Tiếng Việt

Anthropic打造出史上最強AI模型,卻不敢發布……

Azuma
Odaily资深作者
@azuma_eth
2026-04-08 03:58
本文約2631字,閱讀全文需要約4分鐘
短短幾週時間,新模型識別出了數千個從未被發現的新漏洞,甚至還自行構建了攻擊路徑。
AI總結
展開
  • 核心觀點:Anthropic聯合多家科技巨頭啟動「玻璃之翼」計劃,旨在透過其革命性的AI模型Mythos提前發現並修復全球關鍵軟體中的安全漏洞,以應對AI能力提升對網路安全格局帶來的雙重影響。
  • 關鍵要素:
    1. Mythos是人類首個參數超十萬億的AI模型,訓練成本達100億美元,在編碼、推理及網路安全測試中性能大幅超越現有頂級模型。
    2. 該模型在幾週內自主發現了數千個零日漏洞,包括OpenBSD中一個存在27年的高危漏洞,展現了接近頂級駭客的自動化攻防能力。
    3. 出於安全考慮,Anthropic不直接公開發布Mythos,而是透過「玻璃之翼」計劃,聯合頭部企業進行有限度的漏洞排查與修復。
    4. 計劃將提供1億美元模型使用額度,並向開源安全組織捐贈400萬美元,以支持全球軟體安全加固工作。
    5. Anthropic認為,儘管AI可能降低攻擊門檻,但其在主動防禦和構建更安全軟體方面的價值同樣巨大,關鍵在於防禦體系的同步進化。

原創 | Odaily(@OdailyChina

作者|Azuma(@azuma_eth

4 月 8 日,Claude 背後的 AI 開發公司 Anthropic 官方宣布將推出一項名為「玻璃之翼」(Project Glasswing)的新計劃,該計劃將與亞馬遜、蘋果、博通、思科、CrowdStrike、谷歌、摩根大通、Linux 基金會、微軟、輝達和 Palo Alto Networks 等多家頭部大廠聯合推進。

Anthropic 表示,這是一項旨在保護全球最關鍵軟體的緊急舉措,各方將共同使用 Mythos Preview 版本來發現並修復當前世界賴以生存的系統中的潛在缺陷。

所謂 Mythos,即 Anthropic 正在開發的下一代 AI 模型,這是人類歷史上第一個總參數突破十萬億量級的模型(與之相對,當前市面上的主流模型參數量都在數千億到一萬億級別),訓練成本達到了驚人的 100 億美元。相較於 Claude 當前最強大的模型 Opus 4.6,Mythos 在軟體編碼、學術推理和網路安全等測試中得分均大幅提高。

關於 Mythos 的傳言上週便已在市場流傳,當時市場的普遍擔憂是 —— 擁有網路安全特化能力的 Mythos 是否會影響當前的安全攻防格局?如若被惡意利用,是否會造成更大規模的安全事故?Odaily 當時亦曾報導此事,並曾與業界安全專家、慢霧創始人餘弦探討對加密貨幣行業安全攻防的潛在影響(詳見《Odaily 專訪餘弦:Anthropic 核彈級新模型洩漏,如何影響加密安全攻防?》),但當時 Anthropic 方面並未公開承認 Mythos 的存在,因此相關資訊仍然有限。

4 月 8 日,隨著「玻璃之翼」計劃的公布,Anthropic 也披露了更多 Mythos 的相關細節。基於 Anthropic 方面公布的實測案例來看,Anthropic 對於 Mythos 的能力並未誇大,以至於該公司甚至不敢直接公開發布該模型,以防被駭客群體惡意利用,而是計劃先通過「玻璃之翼」計劃讓頭部大廠試用排查,提前修補潛在漏洞。

Mythos 秀肌肉:幾週時間,挖出數千個「零日漏洞」

在談及 Mythos 的實力時,Anthropic 直言表示,該模型的誕生意味著一個嚴峻的事實已經到來 —— AI 模型的編碼能力已經達到了極高的水平,在發現和利用軟體漏洞方面,它們幾乎可以超越除了最熟練的人類之外的所有人。

根據 Anthropic 方面的披露,在短短幾週時間內,Anthropic 使用 Mythos 識別出了數千個零日漏洞(即此前連軟體開發者自身都未曾發現的缺陷),其中許多屬於高危漏洞,問題覆蓋了所有主流作業系統和主流瀏覽器,並波及一系列其他關鍵軟體。

Anthropic 給出了幾個頗具代表性的案例:

  • Mythos 發現了 OpenBSD 中一個存在 27 年的漏洞,該系統一直以「極度安全」著稱,被廣泛用於防火牆等關鍵基礎設施,而這一漏洞允許攻擊者遠端直接使系統崩潰; 
  • 在被大量軟體使用的視訊處理庫 FFmpeg 中,Mythos 找到了一個存在 16 年的漏洞,該問題所在程式碼曾被自動化測試觸發超過 500 萬次,但始終未被發現; 
  • Mythos 還能夠將 Linux 核心中的多個漏洞自動串聯,從普通使用者權限升級至完全控制伺服器。 

更令人擔憂的是,Anthropic 表示這些漏洞大多是 Mythos 在幾乎無人干預的情況下「自主發現並構造利用路徑」的,這或許意味著 AI 已經開始具備類似頂級駭客團隊的自動化攻防能力。

在評測基準上,Mythos 較 Opus 4.6 也呈現出了斷層級的進化。例如在網路安全漏洞復現測試中,Mythos 達到 83.1%,而 Opus 4.6 則為 66.6%;在多項編碼與推理測試中,Mythos 的得分同樣實現大幅領先。

或許正是因為 Mythos 的能力過於強大,Anthropic 並沒有選擇直接開放模型,而是先推出了「玻璃之翼」計劃,讓整個網際網路提前「加固」。

通過該計劃,Anthropic 將向計劃參與方提前開放 Mythos Preview 版本,用於發現並修復其基礎系統中的漏洞或弱點——重點聚焦於本地漏洞檢測、二進位程式黑盒測試、終端安全加固以及系統滲透測試等任務。

Anthropic 還承諾,將向計劃參與方提供總計 1 億美元的模型使用額度,以支持整個研究預覽階段的使用。此後,Mythos Preview 版本將以每百萬輸入 / 輸出 tokens 分別 25 美元 / 125 美元的價格向參與方開放(參與者也可通過 Claude API、Amazon Bedrock、Google Cloud Vertex AI 以及 Microsoft Foundry 存取該模型)。除去模型使用額度外,Anthropic 還會通過 Linux 基金會向 Alpha-Omega 和 OpenSSF 捐贈 250 萬美元,並向 Apache 軟體基金會捐贈 150 萬美元,以幫助開源軟體維護者應對不斷變化的安全環境。

Anthropic 計劃逐步擴大「玻璃之翼」的參與範圍,並持續推進數月,同時盡可能分享經驗,以便其他組織能夠將相關經驗應用於自身安全建設。90 天內,Anthropic 將公開報告階段性成果,包括已修復的漏洞以及可披露的安全改進措施。

技術只會不斷升級,但也無需太過憂心

AI 正在不可逆地改變我們所熟悉的這個世界,包括本文所聚焦的網路安全領域。隨著漏洞被發現與利用的門檻大幅降低,人們不免會產生擔憂,AI 是否會成為惡意行為者手中的利刃,威脅現有的網路安全平衡?(PS:對於需要將真金白銀置於錢包系統或鏈上協議的加密貨幣使用者而言,這一擔憂會尤其強烈。)

針對這一問題,Anthropic 認為「我們仍有理由保持樂觀」,AI 模型之所以危險,正是因為它們具備在不法分子手中造成危害的能力,但於此同時,AI 在發現和修復重要軟體缺陷以及開發更安全的新軟體方面也具有著不可估量的價值。

可以預見的是,未來幾年 AI 的能力仍將快速進化,但在新的攻擊手段出現之時,新的防禦機制也會同步湧現。技術升級不可避免,但這並不意味著風險必然失控 —— 只要防禦體系同步進化,甚至能夠借助 AI 建立更高強度的安全護城河。

安全
技術
AI
歡迎加入Odaily官方社群