オープンウェイトモデル

おーぷんうぇいともでる

オープンウェイトモデル

オープンウェイトモデルとは、学習済みのモデルの重み(パラメータ)が公開されており、ダウンロードして自由に推論やFine-tuningに利用できる言語モデルのことである。

「オープンソース」との違い

混同されやすいが、オープンウェイトとオープンソースは同じではない。ソフトウェアのオープンソースは、ソースコード・学習データ・学習手順のすべてが公開され、誰でも再現・改変できることを意味する。オープンウェイトは「学習済みの重みファイルが公開されている」という、より限定的な概念だ。

MetaのLlama 3はモデルの重みを公開しているが、学習に使ったデータセットの詳細は非公開であり、商用利用にも月間ユーザー数に応じた条件がある。Mistralも同様に重みは公開しつつ、ライセンスはモデルによってApache 2.0と独自ライセンスが混在する。厳密にはオープンソースではなく「オープンウェイト」と呼ぶのが正確だ。

なぜ重みの公開が重要なのか

重みが手元にあるということは、推論を完全に自社管理下で実行できるということだ。これが意味するのは以下の3点。

カスタマイズの自由: 自社データでFine-tuningし、特定ドメインに特化したモデルを作れる。API経由では不可能な深いカスタマイズが可能になる。PEFTやLoRAを使えば、消費者向けGPU 1枚でもFine-tuningが現実的だ。

データ主権の確保: 推論時に外部にデータを送信しないため、機密情報を扱う業務にも適用できる。金融・医療・法務など規制の厳しい業界での採用が進んでいるのはこのためだ。

ベンダーロックインの回避: 特定のAPI提供者に依存しない。料金改定やサービス終了のリスクから自社のAIインフラを切り離せる。

主要なオープンウェイトモデル(2026年時点)

Meta の Llama 4 シリーズは Scout(17B active / 109B total)から Behemoth(288B active / 2T total)まで幅広いサイズ展開で、Mixture of Experts アーキテクチャを採用している。Google の Gemma 3 は1B〜27Bの軽量路線。Mistral は Mistral Large 2 で商用グレードの性能を提供しつつ、軽量版も並行してリリースしている。中国勢では DeepSeek-V3 や Qwen 2.5 が多言語性能で存在感を示している。

選定時に確認すべきはモデル性能だけではない。ライセンス条件(商用利用の可否、ユーザー数制限)、対応言語、必要なハードウェアスペックを事前に精査する必要がある。