ペネトレーションテストとは、攻撃者の視点でシステムやネットワークに対して擬似的な侵入を試み、悪用可能な脆弱性の有無と実際の影響度を評価するセキュリティテスト手法である。
ペネトレーションテスト(通称ペンテスト)は、セキュリティの専門家が実際の攻撃者と同じ手法を使ってシステムへの侵入を試みるテストだ。ファジングが入力境界面を機械的に叩く自動化手法であるのに対し、ペンテストは人間の判断力を軸に「この組織を攻撃するなら、どの経路から入るか」を包括的に探索する。ネットワーク構成、認証フロー、権限昇格の可能性、ソーシャルエンジニアリングまで、技術とビジネスロジックの両面を横断的に評価できる点が強みだ。
ペンテストはテスターに与えられる事前情報の量によって分類される。
ブラックボックスでは、テスターは対象組織の内部情報を一切持たない状態で外部から侵入を試みる。実際の外部攻撃者に最も近いシナリオだ。ホワイトボックスでは、ソースコードやネットワーク図、認証情報などが事前に共有され、網羅的な検証が可能になる。グレーボックスはその中間で、一般ユーザの認証情報は持つが内部アーキテクチャの詳細は知らない、といった条件設定が多い。
実務では、外部からの侵入耐性を見るならブラックボックス、DevSecOps パイプラインの中で定期的にコードレベルの診断を回すならホワイトボックスという使い分けが一般的だ。
AIレッドチーミングは AI システム固有のリスク(プロンプトインジェクション、学習データ汚染、出力のバイアス等)を検証する手法であり、従来のペンテストとは評価対象が異なる。ただし両者の境界は曖昧になりつつある。LLM を組み込んだ Web アプリケーションでは、従来型の SQL インジェクションと、LLM 経由のプロンプトインジェクションが同一システム上に共存するため、ペンテスターにも AI セキュリティの知識が求められるようになった。
Claude Mythos が Linux カーネルで複数の脆弱性を自律的に連鎖させ、一般ユーザから root への特権昇格を達成した事例は、従来ペンテスターが数日かけて行う作業を AI が数時間で再現できることを示した。CyberGym のスコア(Mythos 83.1%)は、この能力を定量的に裏付けている。
ペンテストの完全な自動化はまだ先だが、AI による初期スキャンで攻撃面を高速に洗い出し、人間のペンテスターが判断力の必要な部分に集中するという分業モデルは、既に実用段階に入りつつある。バグバウンティプログラムの研究者も、AI ツールを攻撃面の探索に活用し始めている。


A2A(Agent-to-Agent Protocol)とは、異なる AI エージェント同士が能力の発見・タスクの委譲・状態の同期を行うための通信プロトコルであり、Google が 2025 年 4 月に公開した。

AES-256 とは、米国国立標準技術研究所(NIST)が標準化した共通鍵暗号方式 AES(Advanced Encryption Standard)のうち、鍵長 256 ビットを使用する最高強度の暗号アルゴリズムである。

Agent Skills とは、AI エージェントに特定のタスクや専門知識を実行させるために定義された再利用可能な命令セットであり、エージェントの能力を拡張するモジュール単位として機能する。



AIエージェントを本番運用に乗せるには?パイロットから量産化への実践ステップ
Agentic AI とは、人間の逐一の指示なしに目標を解釈し、計画の立案・実行・検証を自律的に繰り返す AI システムの総称である。