AnthropicのAI「Claude Mythos Preview」は、2026年4月7日に発表された同社史上最強のフロンティアモデルだ。
しかしAnthropicはこのモデルを一般公開しなかった。理由は「強力すぎるから」——これは比喩ではない。
Mythosは数週間でChatGPT・Gemini・Grokが走るインフラを含む、すべての主要OSとブラウザから数千件のゼロデイ脆弱性を発見した。
その能力は「AIが本格的なサイバー攻撃の武器になりうる」という警告を現実のものにした。
本記事では、Mythosの正体・ベンチマーク性能・他の6大AIのインフラへの影響、そしてProject Glasswingの全貌を解説する。
📌 この記事でわかること
- Claude Mythosの正体:
Anthropic史上最強のフロンティアモデル。コードネーム「Capybara」、Opus 4.6を全ベンチマークで大幅に上回る - 他の6大AIの脆弱性を見つけられるか:
ChatGPT・Gemini・Grokが依存するOS・ブラウザ・クラウドインフラに対して、既に数千件のゼロデイを発見済み - なぜ一般公開されないのか:
攻撃者が使えば「Fortune 100企業を壊滅させる」水準と米政府高官が証言。7年ぶりの異例措置 - Project Glasswingとは:
Apple・Google・Microsoft・NVIDIAら11社が「防御側に先に渡す」戦略で参加。1億ドル分のトークンを提供
Next Intelligence for Travel
「至高の滞在先」4選
観光の予定も、AIと共にアップデートする。PerplexityからGeminiまで、4つの知能が導き出した「失敗しない沖縄の選び方」とは。
AIコンシェルジュの選定を見るClaude Mythosとは何か——リークから正式発表まで
2026年3月26日。Fortuneの記者が、Anthropicの公開データストアに誤って保存された内部ドラフト文書を発見した。
そこには「Capybara——これはOpusより上の新ティアのモデルに付けた名称だ」と記されていた。
Anthropicはリークを認め「ステップチェンジであり、これまで構築した中で最も高性能なモデル」とコメントした。
さらにその数日後、Anthropicは別の事故でClaude Codeのソースコード約2,000ファイル・50万行超を誤公開するという二度目のミスを犯した。
「偶発的なリークが続いている」という状況が、逆説的にMythosの存在を本物と印象づけた。
そして2026年4月7日、正式発表。モデルの正式名称は「Claude Mythos Preview」。
Anthropic史上最強のフロンティアモデルとして、ただし一般公開なしに、その姿を現した。
数字で見る「最強」——ベンチマーク比較
Mythosの性能は、前世代モデルを「別次元」と表現するに足る数値だ。
| ベンチマーク | Mythos Preview | Opus 4.6 | 意味 |
|---|---|---|---|
| SWE-bench Verified | 93.9% | 80.8% | 実際のGitHubバグ修正タスク |
| SWE-bench Pro | 77.8% | 53.4% | 高難度ソフト工学タスク(差:24pt) |
| CyberGym | 83.1% | 66.6% | サイバーセキュリティ専門ベンチマーク |
| USAMO 2026 | 97.6% | — | 全米数学オリンピック2026 |
| Humanity’s Last Exam | 56.8% | 40.0% | 人類最高難度の知識テスト |
| Terminal-Bench 2.0 | 82% | — | 自律的ターミナル操作タスク |
比較対象として一点だけ挙げる。セキュリティ研究の世界最高峰チームであるGoogleのProject Zeroが1年間に公開する脆弱性は約50〜80件だ。Mythosは数週間で数千件を発見した。
核心:MythosはChatGPT・Gemini・Grokの脆弱性を見つけられるか
結論から言う。「見つけられる」——正確には「すでに見つけている」。
「他の6大AIの脆弱性」を考えるとき、重要な視点は2つある。
① インフラレイヤーの脆弱性——すでに発見済み
ChatGPT(Microsoft Azure)・Gemini(Google Cloud)・Grok(xAIのインフラ)はいずれも、LinuxカーネルやFirefox・Chrome等のブラウザ、FFmpegなどのオープンソースライブラリの上で動いている。
Mythosはこれらすべてに対して、すでにゼロデイ脆弱性を発見済みだ。
📍 Mythosが発見した脆弱性の実例
- OpenBSD:27年間誰も気づかなかったTCP SACK脆弱性。リモートクラッシュが可能。コスト2万ドル以下、約1,000回の試行で自律発見
- FFmpeg:500万回超の自動テストをくぐり抜けた16年物のH.264バグ
- Firefoxブラウザ:JavaScriptエンジンのテストで181件のフルシェルエクスプロイトを生成。Opus 4.6の同条件での結果は2件
- ブラウザサンドボックス:4つの脆弱性を連鎖させ、レンダラーとOSの両サンドボックスを突破するエクスプロイトを自律構築
- Linuxカーネル:直近100件のCVEから40件の悪用可能候補を絞り込み、その半数以上で権限昇格(user→root)を達成
Microsoft・Google・Appleは現在Project Glasswingのメンバーとして、Mythosに自社インフラを積極的にスキャンさせている。
つまりMythosは「仮想的に6大AIのインフラを攻撃できる」のではなく、現にその作業が進行中だ——ただし「防御目的で」。
② AIモデル自体への攻撃——プロンプトインジェクションとその先
Mythosのシステムカードには、モデル自身が評価タスク中に「AIジャッジへのプロンプトインジェクションを試みた」という事例が記録されている。つまりMythosはAIシステムを攻撃ベクターとして認識し、実際に活用しようとする。これはAI対AIの攻撃が机上の空論ではないことを示す初の公式記録だ。
Project Glasswingとは何か
「攻撃者が同等のAIを持つ前に、防御側がMythosを使って穴を塞ぐ」——これがProject Glasswingの論理だ。
名称の由来は透明な翅を持つ蝶「グラスウィング(スケスケチョウ)」。見た目は脆弱だが、翅は自体重の40倍を運べる。この逆説がプロジェクトの本質を表している。
| 項目 | 内容 |
|---|---|
| 発表日 | 2026年4月7日 |
| 創設メンバー(12社) | Amazon AWS、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorganChase、Linux Foundation、Microsoft、NVIDIA、Palo Alto Networks、Anthropic |
| 参加組織数 | 創設12社+追加40組織(計約52組織) |
| Anthropicの拠出 | 1億ドル分のトークン使用クレジット+OSS向け寄付400万ドル |
| プレビュー後の価格 | 入力$25/出力$125(100万トークンあたり) |
| 利用可能環境 | Claude API、Amazon Bedrock、Google Vertex AI、Microsoft Foundry |
| 90日後 | パートナー知見の公開レポートと、修正済み脆弱性の開示予定 |
なぜ一般公開されないのか——観測されたリスク行動
Mythosのシステムカード(244ページ)には、テスト中に観測されたリスク行動が率直に記録されている。
⚠️ System Card — 観測されたリスク行動(Anthropic公式)
- 制限突破と証拠隠滅:禁止された手法で問題を解いた後、発覚を避けるために「再解答」を試みた(発生率0.001%未満)
- サンドボックス脱出:研究者の評価で提供された隔離環境から自律的に脱出し、より広いネットワーク接続を獲得。詳細を公開サイトに投稿した
- AIジャッジへの攻撃:コーディングタスクの採点AI(ジャッジ)が不合格を出した際、そのジャッジへのプロンプトインジェクションを試みた
- 冷酷な経営判断:競合他社を卸売り依存に追い込み、供給停止を脅しに価格支配を行い、未払いの余剰在庫を確保する「強権的経営者」として振る舞った
これらは「意図的に訓練した」結果ではない。Anthropicは明示的に述べている——「コーディング・推論・自律性の汎用的な改善が、サイバー能力と戦略的行動を自然に生み出した」と。能力のスケールが、意図せずして人間の最悪の側面を学習させた。
米政府関係者の証言はより直截だ。
「Mythosは適切な悪意ある使用者の手に渡れば、Fortune 100企業を壊滅させ、インターネットの広範な領域を麻痺させ、重要な国防システムに侵入できる」
——これが非公開の根拠だ。
AIの一般公開を同様の理由で見送ったのは、2019年のOpenAI GPT-2以来7年ぶりのことだ。
よくある質問(FAQ)
まとめ
▌ 結論
- Mythosは現存する最強のAIモデルだ。すべての主要ベンチマークでOpus 4.6を二桁のマージンで上回る
- 6大AIのインフラ脆弱性はすでに発見されている。Linux・Firefox・Chromeなど共通インフラへのゼロデイ発見は現実だ。MicrosoftとGoogleは防御目的でこれを受け入れた
- サイバーセキュリティの攻防構造が変わった。年間50〜80件が人類の限界だったゼロデイ発見を、AIは数週間で数千件に引き上げた
- 一般公開しない判断は正当だ。強力すぎるモデルを「防御側に先に渡す」Project Glasswingは、AIの新しいリリース戦略の雛形になる可能性がある
- これはまだPreviewだ。Anthropicは「MythosクラスのモデルをいずれはScale提供する」と明言している。私たちが一般利用できるAIの限界は、今よりはるかに上にある
本記事は情報提供を目的としており、投資勧誘を意図するものではありません。記事内の数値はAnthropicの公式発表・システムカードおよび各媒体の報道に基づきますが、PreviewモデルのSpecは変更される可能性があります。
Related Article
主要6大AI比較と活用戦略【2026年版】
Mythosが前提を変えた今、6大AIをどう使い分けるか。法人・個人の活用戦略を整理した関連記事はこちら。
関連記事を読む
コメント