Anthropic, 사상 최강의 AI 모델을 만들었지만 공개를 주저하다...

Azuma

Odaily资深作者

@azuma_eth

2026-04-08 03:58

이 기사는 약 2631자로, 전체를 읽는 데 약 4분이 소요됩니다

불과 몇 주 만에, 새로운 모델은 수천 개의 이전에 발견되지 않은 새로운 취약점을 식별했으며, 심지어 스스로 공격 경로를 구축하기까지 했습니다.

AI 요약

펼치기

핵심 관점: Anthropic은 여러 기술 거대 기업들과 함께 '글래스 윙(Glass Wings)' 프로젝트를 시작하여, 그들의 혁신적인 AI 모델 '미토스(Mythos)'를 통해 글로벌 핵심 소프트웨어의 보안 취약점을 사전에 발견 및 수복함으로써, AI 능력 향상이 사이버 보안 환경에 미치는 양면적 영향을 대응하고자 합니다.
핵심 요소:
1. 미토스는 인류 최초로 매개변수가 10조를 초과하는 AI 모델로, 훈련 비용은 100억 달러에 달하며, 코딩, 추론 및 사이버 보안 테스트에서 기존 최고 수준 모델을 크게 능가하는 성능을 보였습니다.
2. 이 모델은 몇 주 만에 자율적으로 수천 개의 제로데이 취약점을 발견했으며, OpenBSD에 존재한 지 27년 된 고위험 취약점도 포함되어 있어, 최고 수준의 해커에 근접한 자동화된 공격 및 방어 능력을 보여주었습니다.
3. 안전상의 이유로, Anthropic은 미토스를 직접 공개적으로 출시하지 않고, '글래스 윙' 프로젝트를 통해 주요 기업들과 제한된 범위의 취약점 점검 및 수복 작업을 진행하고 있습니다.
4. 이 프로젝트는 1억 달러 상당의 모델 사용 한도를 제공하며, 오픈소스 보안 조직에 400만 달러를 기부하여 글로벌 소프트웨어 보안 강화 작업을 지원할 예정입니다.
5. Anthropic은 AI가 공격 진입 장벽을 낮출 수 있지만, 능동적 방어와 더 안전한 소프트웨어 구축 측면에서의 가치 또한 막대하며, 핵심은 방어 체계의 동시적 진화에 있다고 보고 있습니다.

Original | Odaily (@OdailyChina)

Author｜Azuma (@azuma_eth)

4월 8일, Claude의 배후 AI 개발사인 Anthropic은 공식적으로 '유리 날개'(Project Glasswing)라는 새로운 계획을 추진할 것이라고 발표했습니다. 이 계획은 아마존, 애플, 브로드컴, 시스코, CrowdStrike, 구글, JP모건, Linux 재단, 마이크로소프트, 엔비디아, Palo Alto Networks 등 여러 주요 대기업들과 함께 추진될 예정입니다.

Anthropic은 이것이 전 세계적으로 가장 중요한 소프트웨어를 보호하기 위한 긴급 조치이며, 각 참여 기관들은 Mythos Preview 버전을 공동으로 사용하여 현재 세계가 의존하고 있는 시스템 내 잠재적 결함을 발견하고 수정할 것이라고 밝혔습니다.

소위 Mythos는 Anthropic이 개발 중인 차세대 AI 모델로, 인류 역사상 처음으로 총 파라미터 수가 10조(兆) 규모를 돌파한 모델입니다(이에 비해 현재 시장의 주류 모델 파라미터 수는 수천억에서 1조 수준입니다). 훈련 비용은 놀라운 100억 달러에 달합니다. Claude의 현재 가장 강력한 모델인 Opus 4.6에 비해 Mythos는 소프트웨어 코딩, 학술적 추론 및 사이버 보안 테스트에서 점수가 크게 향상되었습니다.

Mythos에 대한 소문은 지난주부터 시장에 퍼지기 시작했으며, 당시 시장의 보편적인 우려는 사이버 보안 특화 능력을 가진 Mythos가 현재의 보안 공격 및 방어 구도에 영향을 미칠 것인지, 악의적으로 이용될 경우 더 큰 규모의 보안 사고를 초래할 수 있을지에 대한 것이었습니다. Odaily도 당시 이 문제를 보도했으며, 업계 보안 전문가이자 SlowMist 창립자인 Yu Xian과 암호화폐 업계 보안 공격 및 방어에 대한 잠재적 영향에 대해 논의한 바 있습니다(자세한 내용은 《Odaily 인터뷰: Yu Xian, Anthropic의 핵폭탄급 신규 모델 유출, 암호화폐 보안 공격 및 방어에 어떤 영향을 미칠까?》 참조). 그러나 당시 Anthropic 측은 Mythos의 존재를 공개적으로 인정하지 않았기 때문에 관련 정보는 여전히 제한적이었습니다.

4월 8일, '유리 날개' 계획의 발표와 함께 Anthropic은 Mythos에 대한 더 많은 세부 사항을 공개했습니다. Anthropic 측이 공개한 실제 테스트 사례를 바탕으로 볼 때, Anthropic은 Mythos의 능력을 과장하지 않았으며, 이 회사는 해커 집단의 악의적 이용을 막기 위해 이 모델을 직접 공개적으로 출시하지 않고, '유리 날개' 계획을 통해 주요 대기업들이 먼저 시험 사용하여 잠재적 취약점을 사전에 수정할 계획입니다.

Mythos의 실력 과시: 몇 주 만에 수천 개의 '제로데이 취약점' 발견

Mythos의 실력에 대해 언급하면서 Anthropic은 이 모델의 탄생이 엄중한 사실이 도래했음을 의미한다고 직설적으로 밝혔습니다. 즉, AI 모델의 코딩 능력이 극히 높은 수준에 도달했으며, 소프트웨어 취약점을 발견하고 이용하는 데 있어 가장 숙련된 인간을 제외한 거의 모든 사람을 능가할 수 있다는 것입니다.

Anthropic 측의 공개에 따르면, 단 몇 주 만에 Anthropic은 Mythos를 사용하여 수천 개의 제로데이 취약점(소프트웨어 개발자 자신조차 이전에 발견하지 못한 결함)을 식별했습니다. 이 중 많은 수가 고위험 취약점으로, 모든 주요 운영 체제와 주요 브라우저를 포함한 일련의 다른 핵심 소프트웨어에 영향을 미치는 문제였습니다.

Anthropic은 몇 가지 대표적인 사례를 제시했습니다:

Mythos는 OpenBSD에서 27년 동안 존재해온 취약점을 발견했습니다. 이 시스템은 '극도로 안전하다'는 명성을 가지고 있으며 방화벽 등 핵심 인프라에 널리 사용되고 있습니다. 이 취약점은 공격자가 원격으로 시스템을 직접 충돌시킬 수 있게 합니다.
많은 소프트웨어에서 사용되는 비디오 처리 라이브러리 FFmpeg에서 Mythos는 16년 동안 존재해온 취약점을 찾았습니다. 이 문제가 있는 코드는 자동화 테스트에서 500만 번 이상 트리거되었지만 결코 발견되지 않았습니다.
Mythos는 또한 Linux 커널 내 여러 취약점을 자동으로 연결하여 일반 사용자 권한에서 서버를 완전히 제어하는 권한으로 상승시킬 수 있습니다.

더욱 우려되는 점은, Anthropic이 이러한 취약점 대부분이 거의 인간의 개입 없이 Mythos가 '자율적으로 발견하고 이용 경로를 구성한' 것이라고 밝힌 것입니다. 이는 AI가 이미 최고 수준의 해커 팀과 유사한 자동화된 공격 및 방어 능력을 갖추기 시작했음을 의미할 수 있습니다.

평가 벤치마크에서도 Mythos는 Opus 4.6에 비해 격차가 큰 진화를 보여주었습니다. 예를 들어, 사이버 보안 취약점 재현 테스트에서 Mythos는 83.1%를 달성한 반면 Opus 4.6은 66.6%였습니다. 여러 코딩 및 추론 테스트에서도 Mythos의 점수는 크게 앞섰습니다.

아마도 Mythos의 능력이 너무 강력하기 때문에 Anthropic은 모델을 직접 공개하는 대신 먼저 '유리 날개' 계획을 내놓아 전체 인터넷을 사전에 '강화'하기로 선택한 것 같습니다.

이 계획을 통해 Anthropic은 계획 참여자들에게 Mythos Preview 버전을 사전에 개방할 예정입니다. 이는 그들의 기반 시스템 내 취약점이나 약점을 발견하고 수정하는 데 사용될 것입니다. 주요 초점은 로컬 취약점 탐지, 바이너리 프로그램 블랙박스 테스트, 엔드포인트 보안 강화 및 시스템 침투 테스트와 같은 작업에 맞춰질 것입니다.

Anthropic은 또한 계획 참여자들에게 총 1억 달러 규모의 모델 사용 크레딧을 제공할 것을 약속하여 전체 연구 미리보기 단계의 사용을 지원할 것입니다. 이후 Mythos Preview 버전은 참여자들에게 입력/출력 토큰 100만 개당 각각 25달러/125달러의 가격으로 제공될 예정입니다(참여자는 Claude API, Amazon Bedrock, Google Cloud Vertex AI 및 Microsoft Foundry를 통해 이 모델에 접근할 수도 있습니다). 모델 사용 크레딧 외에도 Anthropic은 Linux 재단을 통해 Alpha-Omega와 OpenSSF에 250만 달러를 기부하고, Apache 소프트웨어 재단에 150만 달러를 기부하여 오픈소스 소프트웨어 유지 관리자들이 변화하는 보안 환경에 대응할 수 있도록 돕겠다고 밝혔습니다.

Anthropic은 '유리 날개'의 참여 범위를 점진적으로 확대하고 수개월 동안 지속적으로 추진할 계획이며, 가능한 한 경험을 공유하여 다른 조직들이 관련 경험을 자체 보안 구축에 적용할 수 있도록 할 것입니다. 90일 이내에 Anthropic은 수정된 취약점 및 공개 가능한 보안 개선 조치를 포함한 단계적 성과를 공개적으로 보고할 예정입니다.

기술은 계속해서 업그레이드되지만, 너무 걱정할 필요는 없다

AI는 우리가 익숙한 이 세상을 되돌릴 수 없이 변화시키고 있으며, 이 글에서 집중하는 사이버 보안 분야도 포함됩니다. 취약점 발견과 이용의 문턱이 크게 낮아짐에 따라 사람들은 AI가 악의적 행위자들의 손에 든 칼이 되어 기존의 사이버 보안 균형을 위협할지 우려하지 않을 수 없습니다. (PS: 실제 자금을 지갑 시스템이나 체인상 프로토콜에 보관해야 하는 암호화폐 사용자들에게는 이러한 우려가 특히 강할 것입니다.)

이 문제에 대해 Anthropic은 '우리는 여전히 낙관적일 이유가 있다'고 생각합니다. AI 모델이 위험한 이유는 불법 분자들의 손에서 피해를 입힐 수 있는 능력을 갖추고 있기 때문이지만, 동시에 AI는 중요한 소프트웨어 결함을 발견하고 수정하며 더 안전한 새로운 소프트웨어를 개발하는 데에도 헤아릴 수 없는 가치를 지니고 있습니다.

예상할 수 있듯이, 향후 몇 년 동안 AI의 능력은 여전히 빠르게 진화할 것이지만, 새로운 공격 수단이 나타날 때 새로운 방어 메커니즘도 동시에 나타날 것입니다. 기술 업그레이드는 불가피하지만, 이는 반드시 위험이 통제 불능 상태가 된다는 의미는 아닙니다. 방어 체계가 동시에 진화하고, 심지어 AI를 활용하여 더 높은 강도의 보안 방어벽을 구축할 수만 있다면 말입니다.

안전

기술

Odaily 공식 커뮤니티에 가입하세요