クラウドではなくデバイス上でAI推論を実行するアーキテクチャ。低レイテンシ、プライバシー保護、オフライン動作を実現する。
エッジ AI(Edge AI)とは、クラウドサーバーにデータを送信せず、端末(エッジデバイス)上で直接 AI の推論を実行するアーキテクチャである。スマートフォン、監視カメラ、産業用センサー、車載コンピュータなどが代表的な実行環境にあたる。
クラウド AI はネットワーク越しに高性能 GPU を利用するため精度は高いが、通信遅延・通信コスト・プライバシーリスクという三つの課題を抱える。エッジ AI はデータが端末から出ないため、医療画像や製造ラインの映像のようにデータの外部送信が難しい領域で優位性が生まれる。
SLM(Small Language Model)の性能向上が、エッジ AI の実用性を一変させた。数十億パラメータのモデルを量子化すればスマートフォンでも動作し、大規模モデルの 8〜9 割の精度を実現できるケースが増えている。
すべてをエッジに移す必要はない。リアルタイム性が求められる推論(異常検知、音声認識)はエッジで処理し、学習やバッチ分析はクラウドで行うハイブリッド構成が現実的だ。ネットワーク品質が不安定なラオスや東南アジアの現場では、オフラインでも動作するエッジ AI の価値はとりわけ大きい。



AI コーディングエージェント実践ガイド — Claude Code vs Codex で開発チームはどう変わるか
特定の業務役割を担い、人間の従業員と同様に継続的にタスクを遂行する自律型AIエージェントのこと。単発の指示応答ではなく、職務として責任範囲を持つ点が従来のAIアシスタントと異なる。