Claude Mythos(クロード・ミュトス)

くろーどみゅとす

Claude Mythos(クロード・ミュトス)

Claude Mythosとは、Anthropicが開発したサイバーセキュリティ特化のフロンティアモデルであり、大規模コードベースの脆弱性発見・エクスプロイト生成・修正パッチ作成を一貫して自律的に実行できる。

Mythos の位置付け

Claude Mythos Preview は、Anthropic が Project Glasswing の中核として開発した未公開モデルである。汎用的なコード生成能力を持つ LLM とは異なり、ソースコードの脆弱性を発見し、その悪用手法を構成し、さらに修正パッチまで生成するというサイバーセキュリティの攻防サイクル全体をカバーする点に特徴がある。Anthropic は「ほとんどの人間専門家を超えるレベル」と表現しており、CyberGym ベンチマークでは従来の Claude Opus 4.6 の 66.6% に対し Mythos は 83.1% を記録した。

何を見つけたか

Mythos が発見した脆弱性の具体例は、このモデルの能力の射程をよく示している。

OpenBSD のネットワークスタックに 27 年間潜んでいたリモートクラッシュ脆弱性。ファイアウォールや VPN ゲートウェイとして広く使われる OS であり、発見されていれば重要インフラへの攻撃経路になり得た。FFmpeg では、500 万回以上の自動ファジングテストをすり抜けていた 16 年もののバグを検出している。さらに Linux カーネルでは、複数の脆弱性を自律的に連鎖(チェイン)させ、一般ユーザ権限から root への特権昇格を達成した。人間のペネトレーションテスターが数日かけるような攻撃経路の構築を、モデルが自律的にやってのけたわけだ。

これらはすべて各プロジェクトに責任ある開示(Responsible Disclosure)がなされ、パッチ済みである。

Project Glasswing のコンソーシアム

Mythos を防御目的で広く活用するために立ち上げられたのが Project Glasswing である。AWS、Apple、Google、Microsoft、NVIDIA、CrowdStrike、Palo Alto Networks、Linux Foundation など主要テック企業・セキュリティベンダーが参加し、OSS と自社システムの防御的スキャンを進めている。Anthropic は最大 1 億ドル相当のモデル利用クレジットと、OSS セキュリティ団体への 400 万ドルの寄付をコミットした。

DevSecOps やシフトレフトの文脈では、開発工程の上流で脆弱性を潰すことが理想とされてきた。Mythos のようなモデルは、その「上流での検出」を人間のレビュアーよりも網羅的に、かつ既存のファジングツールが見逃すクラスの脆弱性に対しても実行できる可能性を示している。

防御と攻撃の非対称性

同等の AI 能力が攻撃側に渡れば、サプライチェーン攻撃や未知のゼロデイ攻撃のリスクは飛躍的に高まる。Glasswing の根底にあるのは「同じ能力を防御側が先に使い切る」という思想であり、OWASP が整理するような既知の脆弱性カテゴリだけでなく、まだ分類すらされていない攻撃面をモデルが先回りして潰すことを目指している。AIレッドチーミングが「人間チームによる攻撃シミュレーション」だとすれば、Mythos は「AI による常時・大規模・自律的な攻撃シミュレーション」に近い。

Anthropicは「今行動すれば防御優位な AI 時代を作れる」と述べているが、裏を返せば、行動しなければ攻撃優位になるという警告でもある。