Anthropic이 "너무 강한 모델"을 공개하지 않기로 했다 — Claude Mythos Preview와 Project Glasswing

2026년 4월 7일 Anthropic이 Claude Mythos Preview를 발표했다.

동시에 이 모델을 일반 공개하지 않겠다고 선언했다.

AI 회사가 자기 최신 모델을 공개하지 않는다. 이례적인 결정이다. 이유를 들어보면 더 이례적이다.

“이 모델이 너무 강해서” 공개하면 위험하다는 것이다.

GPT-5.4 글에서 Anthropic이 펜타곤 계약을 거부한 이야기를 다뤘다. Mythos는 그 연장선에 있다.

기술을 만드는 것과 기술의 영향을 통제하는 것 사이에서 Anthropic이 내린 또 하나의 선택이다.

이번 글에서는 Mythos Preview가 무엇이고, 왜 이런 결정이 나왔으며,

AI 엔지니어 입장에서 이게 어떤 의미인지를 정리한다.

1. Claude Mythos Preview는 무엇인가

Mythos Preview는 Anthropic이 “지금까지 만든 것 중 가장 강력한 모델”이라고 직접 표현한 범용 모델이다. Anthropic 대변인은 Fortune 인터뷰에서 이 모델이 “a step change in capabilities”를 나타낸다고 말했다.

범용 모델이라는 점이 중요하다. 사이버보안 전용 모델이 아니다.

추론, 코딩, 분석 전반에서 성능이 올라갔는데 그중 사이버보안 능력이 특히 압도적으로 튀어나온 것이다.

Anthropic의 공식 표현은 이렇다.

“이 모델은 전반적으로 강하지만, 컴퓨터 보안 작업에서 특히 두드러지게 뛰어나다

(performs strongly across the board, but is strikingly capable at computer security tasks).”

2. 벤치마크: Opus 4.6과의 차이

Mythos Preview의 벤치마크를 Opus 4.6과 비교하면 격차가 명확하다.

벤치마크                      Mythos Preview    Opus 4.6
SWE-bench Verified            93.9%            80.8%     (+13.1pp)
Terminal-Bench 2.0            82.0%            65.4%     (+16.6pp)
CyberGym                     83.1%            66.6%     (+16.5pp)
Humanity's Last Exam (tools)  64.7%            53.1%     (+11.6pp)

SWE-bench Verified 93.9%는 현존하는 모든 모델 중 최고 수치다.

GPT-5.4가 SWE-Bench Pro에서 57.7%를 기록했던 것과 비교하면 세대 차이라고 부를 만하다.

Terminal-Bench 2.0과 CyberGym에서 16pp 이상의 차이가 나는데

이 두 벤치마크가 각각 터미널 환경에서의 에이전트 작업 능력과 사이버보안 능력을 측정한다.

Anthropic이 “사이버보안에서 특히 강하다”고 한 것이 수치로 확인되는 부분이다.

다만 Anthropic은 “Mythos가 전통적인 보안 벤치마크를 대부분 포화(saturate)시켜 실제 제로데이 취약점을 사용한 새로운 평가 방식으로 전환했다”고 밝혔다.

기존 벤치마크로는 이 모델의 보안 능력을 제대로 측정할 수 없다는 뜻이다.

3. 제로데이 수천 개: 왜 이게 무서운 이야기인가

이 모델에 대한 보도에서 가장 많이 인용된 사실이 있다.

내부 테스트에서 모든 주요 운영체제(Windows, macOS, Linux)와

모든 주요 웹 브라우저에서 수천 개의 제로데이 취약점을 자율적으로 발견했다.

가장 오래된 것은 OpenBSD에 27년간 존재했던 버그였다.

제로데이(zero-day)는 개발자도 모르는 취약점이다. 패치가 없다.

보안 업계에서 제로데이 하나의 가치는 수십만 달러에서 수백만 달러에 이른다.

국가 단위 사이버 공격에 사용되는 무기이기도 하다.

그런 취약점을 AI 모델이 “수천 개” 찾아냈다.

Fortune은 이 모델이 “Fortune 100 기업을 다운시키거나, 인터넷 핵심 인프라를 마비시키거나, 국방 시스템을 침투할 수 있는 능력을 가진 최초의 AI 모델”이라고 표현했다.

Axios는 “대부분의 권력자들이 이에 대한 준비가 되어 있지 않다”고 보도했다.

AI 엔지니어 관점에서 이 대목이 불편한 이유가 있다.

이전 글에서 Agent에게 Tool을 줄 때 “이 Tool을 잘못 쓰면 무슨 일이 생기는가?”를 물어야 한다고 썼다.

이 모델은 그 질문의 답이 “인터넷이 마비될 수 있다” 수준인 Tool을 스스로 만들어낼 수 있다.

4. Project Glasswing: 공개 대신 방어를 선택하다

Anthropic은 이 모델을 일반 공개하는 대신 Project Glasswing이라는 방어적 컨소시엄을 만들었다.

핵심 논리는 이렇다. 이 수준의 모델이 공개되면 공격자가 먼저 악용할 수 있다.

그래서 방어자에게 먼저 시간을 주겠다는 것이다.

모델을 방어 목적으로만 제한 제공해 방어 측이 취약점을 먼저 패치할 수 있게 하겠다는 전략이다.

참여 기관 12곳은 다음과 같다.

Amazon Web Services    
Apple           
Broadcom
Cisco                  
CrowdStrike     
Google
JPMorganChase          
Linux Foundation 
Microsoft
NVIDIA                 
Palo Alto Networks  
Anthropic

이 12곳 외에 추가로 40개 검증된 조직이 접근 가능하다.

핵심 인프라를 운영하는 조직이 대상이다.

Anthropic은 이 프로젝트에 1억 달러($100M) 규모의 모델 사용 크레딧을 투입한다고 밝혔다.

모델 접근은 Claude API, Amazon Bedrock, Google Vertex AI, Microsoft Foundry를 통해 이루어진다.

접근 방식은 초대제(invitation-only)다. 셀프 서비스 가입은 불가능하다.

일반 개발자가 API 키를 받아서 쓸 수 있는 모델이 아니다.

5. 가격: Opus 4.6의 5배

Mythos Preview의 가격은 다음과 같다.

모델                입력 (1M tokens)   출력 (1M tokens)
Mythos Preview      $25.00            $125.00
Opus 4.6            $5.00             $25.00
Sonnet 4.6          $3.00             $15.00
GPT-5.4             $2.50             $15.00

Opus 4.6 대비 정확히 5배다. 출력 토큰 기준으로 GPT-5.4보다 8.3배 비싸다.

이전 글에서 다뤘던 비용 계산 공식을 적용해보면 이렇다.

# 일간 코멘터리를 생성한다고 가정
# 입력 2,500토큰, 출력 400토큰 (기존 Opus 4.6과 동일 세팅)

Opus 4.6:   (2,500 / 1M × $5) + (400 / 1M × $25)  = $0.0225
Mythos:     (2,500 / 1M × $25) + (400 / 1M × $125) = $0.1125

# 1회 호출 비용이 5배. 하루 1회면 월 $3.375
# 하루 100회 호출하는 서비스라면 월 $337.50

현재는 Project Glasswing 참여 기관에만 열려 있으니 일반 개발자에게 직접적인 비용 문제는 아니다.

하지만 이 가격 구조가 시사하는 바가 있다.

모델 성능이 올라갈수록 비용 곡선이 선형이 아니라 지수적으로 움직일 수 있다는 것이다.

이전 글에서 정리했던 모델 라우팅 전략이 선택이 아니라 필수가 되는 시점이 가까워지고 있다.

6. Anthropic의 선택이 의미하는 것

GPT-5.4 글에서 이런 이야기를 했다.

“어떤 모델을 쓸지는 벤치마크로 결정할 수 있지만

어떤 회사의 인프라 위에 시스템을 올릴지는 그 맥락까지 고려해야 한다.”

여기에서 그 맥락이 더 선명해졌다.

Anthropic은 지난 두 달 사이에 두 번의 큰 결정을 했다.

2월에는 펜타곤의 자율 무기 탑재 요구를 거부해서 계약을 잃었다.

4월에는 자사 최강 모델을 공개하지 않는 대신 1억 달러를 들여 방어 프로젝트를 만들었다.

두 결정 모두 단기적으로는 매출 손실이다.

모델을 공개하면 API 수익이 나온다. 군사 계약을 수락하면 대형 매출이 생긴다. 둘 다 하지 않았다.

Cal Newport은 자신의 블로그에서 “Mythos가 정말 무서운 것인지, 아니면 과대광고인지”를 물었다.

Schneier on Security의 Bruce Schneier도 Project Glasswing의 실효성에 대해 분석글을 올렸다.

회의적 시각도 분명히 존재한다.

하지만 AI 엔지니어 입장에서 주목할 점은 다른 곳에 있다.

모델이 충분히 강해지면 “공개할 것인가, 통제할 것인가”가 실제 비즈니스 결정이 된다는 것이다.

지금까지 AI 업계의 경쟁은 “누가 먼저 더 강한 모델을 공개하는가”였다.

Mythos는 그 경쟁의 규칙 자체가 바뀔 수 있음을 보여주는 사례다.

7. AI 엔지니어에게 실질적으로 달라지는 것

현재 Preview를 직접 쓸 수 있는 개발자는 극소수다.

그렇다면 이 발표가 나머지 AI 엔지니어들에게 의미하는 것은 무엇인가.

첫째, 모델 성능 곡선의 방향이 확인되었다.

Opus 4.6에서 이 모델까지의 도약은 Opus 4.5에서 4.6까지의 변화보다 훨씬 크다.

SWE-bench 80.8%에서 93.9%로의 점프는 코딩 에이전트가

“도와주는 수준”에서 “대부분 혼자 하는 수준”으로 이동했음을 의미한다.

이 방향이 유지된다면, 에이전트 시스템의 설계 전제 자체가 바뀐다.

둘째, 보안이 AI 엔지니어링의 핵심 관심사로 올라온다.

이전 글에서 Agent에게 Tool을 줄 때 세 가지 원칙을 정리했다.

기본은 금지, 읽기와 쓰기를 분리, 비용이 드는 Tool은 승인 필수.

이 원칙은 “Agent가 실수할 수 있다”는 전제에서 나왔다.

하이엔드급 모델이 일반화되면 전제가 달라진다.

“Agent가 의도적으로 보안 취약점을 찾아낼 수 있다”가 된다.

Tool 권한 설계가 비용 통제를 넘어 보안 통제의 영역으로 확장된다.

셋째, 모델 접근 자체가 차별화 요소가 되는 시대가 올 수 있다.

지금까지는 모든 개발자가 같은 모델에 접근할 수 있었다. API 키만 있으면 됐다.

이 모델은 처음으로 “자격이 있는 조직만 접근 가능한 모델”이 등장한 사례다.

이 패턴이 확산되면 어떤 모델에 접근할 수 있는지가 기업의 기술 경쟁력을 좌우하게 될 수도 있다.

마무리하며

Preview를 한 줄로 정리하면 “모델이 너무 강해져서 공개 자체가 리스크가 된 최초의 사례”다.

이게 과대광고인지 진짜 전환점인지는 아직 판단하기 이르다.

Project Glasswing 참여 기관들이 실제로 얼마나 많은 취약점을 패치하는지와

그 과정에서 해당 모델의 기여가 어느 정도인지를 지켜봐야 한다.

방향은 읽힌다. AI 모델의 경쟁축이 “성능”에서 “성능 + 통제”로 이동하고 있다.

이전 글에서 “Tool 권한 설계”가 에이전트 시스템의 핵심이라고 했는데

이제 그 원칙이 모델 제공사(provider) 수준에서도 적용되기 시작한 것이다.

Anthropic이 옳은 선택을 했는지는 시간이 답해줄 것이다.

확실한 건 AI 엔지니어로서 “모델이 할 수 있는 것”뿐 아니라

“모델이 해서는 안 되는 것”을 같이 생각해야 하는 시대가 왔다는 것이다.

참고 출처

Anthropic ‘Mythos’ AI model representing ‘step change’ (Fortune, 2026.03.26): https://fortune.com/2026/03/26/anthropic-says-testing-mythos-powerful-new-ai-model-after-data-leak-reveals-its-existence-step-change-in-capabilities/
Claude Mythos Preview 공식 페이지 (Anthropic): https://red.anthropic.com/2026/mythos-preview/
Project Glasswing 공식 페이지 (Anthropic): https://www.anthropic.com/glasswing
Anthropic debuts Mythos in cybersecurity initiative (TechCrunch, 2026.04.07): https://techcrunch.com/2026/04/07/anthropic-mythos-ai-model-preview-security/
Anthropic is limiting access to Mythos (Fortune, 2026.04.10): https://fortune.com/2026/04/10/anthropic-mythos-ai-driven-cybersecurity-risks-already-here/
Claude Mythos Preview Benchmarks, Pricing & Project Glasswing (llm-stats.com): https://llm-stats.com/blog/research/claude-mythos-preview-launch
Anthropic Releases Claude Mythos Preview (InfoQ, 2026.04): ㅊ
On Anthropic’s Mythos Preview and Project Glasswing (Schneier on Security, 2026.04): https://www.schneier.com/blog/archives/2026/04/on-anthropics-mythos-preview-and-project-glasswing.html
Is Claude Mythos “Terrifying” or Just Hype? (Cal Newport, 2026.04): https://calnewport.com/is-claude-mythos-terrifying-or-just-hype/

Anthropic이 “너무 강한 모델”을 공개하지 않기로 했다 — Claude Mythos Preview와 Project Glasswing

1. Claude Mythos Preview는 무엇인가

2. 벤치마크: Opus 4.6과의 차이

3. 제로데이 수천 개: 왜 이게 무서운 이야기인가

4. Project Glasswing: 공개 대신 방어를 선택하다

5. 가격: Opus 4.6의 5배

6. Anthropic의 선택이 의미하는 것

7. AI 엔지니어에게 실질적으로 달라지는 것

마무리하며

함께 읽으면 좋은 글

글쓴이 · Plutojoshua

“Anthropic이 “너무 강한 모델”을 공개하지 않기로 했다 — Claude Mythos Preview와 Project Glasswing”에 대한 1개의 생각

댓글 남기기 응답 취소