AI基礎・モデル | AI・DX・セキュリティ用語集

「AI基礎・モデル」カテゴリの用語集。AI・DX・セキュリティに関する専門用語を、経営層・IT担当者向けに図解つきで解説します。

知識蒸留（Knowledge Distillation）

大規模な教師モデルの知識を小規模な生徒モデルに転移させ、軽量かつ高精度なモデルを作成する手法。

Dense Model（密結合モデル）とは、推論時にモデルの全パラメータを使って計算を行うニューラルネットワークアーキテクチャのことである。MoE（Mixture of Experts）がエキスパート

小型のドラフトモデルが複数トークンを先行提案し、大型モデルが並列検証する推論高速化技術。

トークン（Token）とは、LLM がテキストを処理する際の最小単位である。単語そのものではなく、単語の一部や記号、空白なども含まれ、モデルの語彙（ボキャブラリー）に基づいてテキストを分割した結果の断

テキストを頻出パターンで統合しサブワード単位に分割するアルゴリズム。LLM の入出力コストと処理速度に直結し、低リソース言語では専用語彙が不足するためバイトレベル分解が発生する。

ファインチューニング（Fine-Tuning）とは、事前学習済みの機械学習モデルに追加の学習データを与え、特定のタスクやドメインに適応させるプロセスを指す。

ベースモデル（Foundation Model）とは、大規模なデータセットで事前学習（プリトレーニング）された汎用 AI モデルのことである。特定のタスクに特化しておらず、ファインチューニングやプロン

マルチモーダルAIとは、テキスト・画像・音声・動画など複数の異なるデータ形式を統合的に処理・理解・生成できるAIシステムのこと。

マルチリンガルNLPとは、タイ語・日本語・英語など複数言語のテキストを横断的に解析・生成できる自然言語処理技術で、多言語チャットボットや翻訳システムの基盤となる。

モデルのパラメータ精度を16bitから4bit等に下げてサイズを圧縮し、限られた計算資源での推論を可能にする最適化手法。

ローカルLLMとは、クラウドAPIを介さず、自社のサーバーやPC上で大規模言語モデルを直接実行する運用形態のことである。

LoRA（Low-Rank Adaptation）とは、大規模言語モデルの重み行列に低ランクの差分行列を挿入し、その差分だけを学習させることでモデル全体の 0.1〜1% 程度のパラメータ追加でファイン

25件 / 2/3