クラウドではなくデバイス上でAI推論を実行するアーキテクチャ。低レイテンシ、プライバシー保護、オフライン動作を実現する。
## エッジ AI とは エッジ AI(Edge AI)とは、クラウドサーバーにデータを送信せず、端末(エッジデバイス)上で直接 AI の推論を実行するアーキテクチャである。スマートフォン、監視カメラ、産業用センサー、車載コンピュータなどが代表的な実行環境にあたる。### クラウド AI との違い クラウド AI はネットワーク越しに高性能 GPU を利用するため精度は高いが、通信遅延・通信コスト・プライバシーリスクという三つの課題を抱える。
エッジ AI はデータが端末から出ないため、医療画像や製造ラインの映像のようにデータの外部送信が難しい領域で優位性が生まれる。### SLM の台頭が追い風に SLM(Small Language Model)の性能向上が、エッジ AI の実用性を一変させた。数十億パラメータのモデルを量子化すればスマートフォンでも動作し、大規模モデルの 8〜9 割の精度を実現できるケースが増えている。
### 導入判断のポイント すべてをエッジに移す必要はない。リアルタイム性が求められる推論(異常検知、音声認識)はエッジで処理し、学習やバッチ分析はクラウドで行うハイブリッド構成が現実的だ。ネットワーク品質が不安定なラオスや東南アジアの現場では、オフラインでも動作するエッジ AI の価値はとりわけ大きい。

