Dense Model（密結合モデル）（でんすもでる）とは？

Dense Model（密結合モデル）

でんすもでる

更新日:2026年3月20日作成日:2026年3月20日

Dense Model（密結合モデル）とは、推論時にモデルの全パラメータを使って計算を行うニューラルネットワークアーキテクチャのことである。MoE（Mixture of Experts）がエキスパートの一部だけを活性化させるのに対し、Dense Model は入力に関わらず常にすべての重みが演算に関与する。

なぜ「Dense」と呼ぶのか

もともとニューラルネットワークの世界では、全結合層（fully connected layer）を dense layer と呼ぶ慣習がある。Dense Model という呼称は、モデル全体がこの「隙間のない結合」で構成されている——つまり推論のたびに全パラメータが動く——という構造的特徴を端的に表している。

対義語として登場したのが MoE（Mixture of Experts）アーキテクチャだ。MoE ではルーティング機構が入力トークンごとに少数のエキスパートだけを選び出し、残りは休眠させる。結果として、パラメータ総数が同じでも推論時の計算量（FLOPs）は大幅に少なくなる。Mixtral 8x7B が「パラメータ 46.7B だが活性パラメータは 12.9B」と説明されるのは、この仕組みによる。

Dense Model の強みと限界

Dense Model の最大の利点は設計のシンプルさにある。ルーティングの不均衡やエキスパート間の負荷偏り（load balancing）を気にする必要がなく、学習の安定性が高い。Llama 3 シリーズや Claude のような主要モデルが Dense アーキテクチャを採用し続けているのは、この安定性が大規模学習で大きな意味を持つからだ。

一方で、パラメータ数がそのまま推論コストに直結する点は避けられない。70B パラメータの Dense Model は推論のたびに 70B の重みすべてを読み出し演算する。同等の品質を MoE で達成できるなら、推論コストは数分の一で済む場合もある。