Claude Mythosとは、Anthropicが開発したサイバーセキュリティ特化のフロンティアモデルであり、大規模コードベースの脆弱性発見・エクスプロイト生成・修正パッチ作成を一貫して自律的に実行できる。
Claude Mythos Preview は、Anthropic が Project Glasswing の中核として開発した未公開モデルである。汎用的なコード生成能力を持つ LLM とは異なり、ソースコードの脆弱性を発見し、その悪用手法を構成し、さらに修正パッチまで生成するというサイバーセキュリティの攻防サイクル全体をカバーする点に特徴がある。Anthropic は「ほとんどの人間専門家を超えるレベル」と表現しており、CyberGym ベンチマークでは従来の Claude Opus 4.6 の 66.6% に対し Mythos は 83.1% を記録した。
Mythos が発見した脆弱性の具体例は、このモデルの能力の射程をよく示している。
OpenBSD のネットワークスタックに 27 年間潜んでいたリモートクラッシュ脆弱性。ファイアウォールや VPN ゲートウェイとして広く使われる OS であり、発見されていれば重要インフラへの攻撃経路になり得た。FFmpeg では、500 万回以上の自動ファジングテストをすり抜けていた 16 年もののバグを検出している。さらに Linux カーネルでは、複数の脆弱性を自律的に連鎖(チェイン)させ、一般ユーザ権限から root への特権昇格を達成した。人間のペネトレーションテスターが数日かけるような攻撃経路の構築を、モデルが自律的にやってのけたわけだ。
これらはすべて各プロジェクトに責任ある開示(Responsible Disclosure)がなされ、パッチ済みである。
Mythos を防御目的で広く活用するために立ち上げられたのが Project Glasswing である。AWS、Apple、Google、Microsoft、NVIDIA、CrowdStrike、Palo Alto Networks、Linux Foundation など主要テック企業・セキュリティベンダーが参加し、OSS と自社システムの防御的スキャンを進めている。Anthropic は最大 1 億ドル相当のモデル利用クレジットと、OSS セキュリティ団体への 400 万ドルの寄付をコミットした。
DevSecOps やシフトレフトの文脈では、開発工程の上流で脆弱性を潰すことが理想とされてきた。Mythos のようなモデルは、その「上流での検出」を人間のレビュアーよりも網羅的に、かつ既存のファジングツールが見逃すクラスの脆弱性に対しても実行できる可能性を示している。
同等の AI 能力が攻撃側に渡れば、サプライチェーン攻撃や未知のゼロデイ攻撃のリスクは飛躍的に高まる。Glasswing の根底にあるのは「同じ能力を防御側が先に使い切る」という思想であり、OWASP が整理するような既知の脆弱性カテゴリだけでなく、まだ分類すらされていない攻撃面をモデルが先回りして潰すことを目指している。AIレッドチーミングが「人間チームによる攻撃シミュレーション」だとすれば、Mythos は「AI による常時・大規模・自律的な攻撃シミュレーション」に近い。
Anthropicは「今行動すれば防御優位な AI 時代を作れる」と述べているが、裏を返せば、行動しなければ攻撃優位になるという警告でもある。


A2A(Agent-to-Agent Protocol)とは、異なる AI エージェント同士が能力の発見・タスクの委譲・状態の同期を行うための通信プロトコルであり、Google が 2025 年 4 月に公開した。

AES-256 とは、米国国立標準技術研究所(NIST)が標準化した共通鍵暗号方式 AES(Advanced Encryption Standard)のうち、鍵長 256 ビットを使用する最高強度の暗号アルゴリズムである。

Agent Skills とは、AI エージェントに特定のタスクや専門知識を実行させるために定義された再利用可能な命令セットであり、エージェントの能力を拡張するモジュール単位として機能する。



Claude Code チーム導入ガイド — CLAUDE.md・Skills・Hooks で開発ワークフローを標準化する方法
Agentic AI とは、人間の逐一の指示なしに目標を解釈し、計画の立案・実行・検証を自律的に繰り返す AI システムの総称である。