オープンソースLLMの2026年5月最新地図 — DeepSeek V4からMistral Medium 3.5まで主要モデルの選び方

オープンソースLLMの2026年5月最新地図 — DeepSeek V4からMistral Medium 3.5まで主要モデルの選び方

はじめに

オープンソースLLMの選択肢は、2026年に入って一段と濃密になりました。直近30日だけでもLlama 4、Qwen 3.5、DeepSeek V4、Gemma 4、Mistral Medium 3.5の5つのフロンティアクラスが新規に出ています。VPC内・オンプレ・自社GPUで動かす前提が現実味を増す一方、モデルごとにライセンスや必要GPUが大きく異なるため、技術選定の難易度は上がっています。本記事では、2026年5月時点での主要モデルを整理し、自社運用を検討する際の判断軸を提示します。

2026年春に出揃った主要モデル

直近のリリースで実用候補に挙がるモデルは6系統です。設計思想と適用領域が分かれているため、用途別に整理します。

  • DeepSeek V4(Pro/Flash): Pro版は1.6Tパラメータ(うち49B有効)のMoE構成で、SWE-Bench Verified 80.6%とコーディング系で最高水準。Flash版は284B/13B有効で単一H100でも動作。MITライセンスで制約なく商用利用可能
  • Llama 4(Scout/Maverick): Scoutは109B/17B有効、コンテキスト長1,000万トークンが最大の特徴。マルチモーダルネイティブ。Llama Community Licenseは月間アクティブユーザー7億超えで再交渉が必要
  • Qwen 3.5: 235B/22B有効のMoE。Apache 2.0(主要モデル)で商用利用が明快。中国語・多言語性能が強み
  • Mistral Medium 3.5(2026年4月29日公開): 128Bの密モデル、256Kコンテキスト、80言語対応。EU圏のデータレジデンシー要件に応えやすい欧州産モデル。GitHub/Linear/Jira統合エージェント機能が特徴
  • Gemma 4: 27B以下の小型MoE、14GB前後でノートPCや単一GPU稼働。エアギャップ環境やオンデバイス推論向け
  • Phi-4: Microsoft製の小型モデル、MITライセンス。エッジ推論や軽量タスクに適する

モデル比較表

代表的な観点で並べると、選択軸が見えやすくなります。

モデル 有効/総パラメータ コンテキスト ライセンス 必要GPU目安 主な強み
DeepSeek V4 Pro 49B/1.6T 100万 MIT 8×H200 コーディング最高水準
DeepSeek V4 Flash 13B/284B 100万 MIT 単一H100 軽量で同系統の精度を維持
Llama 4 Scout 17B/109B 1,000万 Llama Community 単一H100 超長文・マルチモーダル
Qwen 3.5 22B/235B 128K Apache 2.0 2〜4×H100 多言語・商用ライセンス明快
Mistral Medium 3.5 128B(密) 256K Modified MIT 2×H100 EUデータ拠点・エージェント連携
Gemma 4 27B以下 128K Gemma Terms ノートPC〜単一GPU エアギャップ・オンデバイス

ライセンスと商用利用の整理

OSSという呼称ながら、ライセンス条件は4種類に分かれます。導入前に必ず確認したい論点です。

  • MIT/Apache 2.0(完全に商用フリー): DeepSeek V4、Phi-4はMIT。Qwen 3.5主要モデル、Gemma 4、Mistral Large 3はApache 2.0で、改変・再配布・社内利用に制約がほぼない
  • Llama Community License(条件付き): Llama 4は月間アクティブユーザー7億未満なら無償商用可。中小企業はほぼ抵触しないが、グループ会社合算でカウントするため大企業傘下では要確認
  • Gemma Terms(条件付き): 利用ポリシー違反時の停止権を留保。一般的な業務利用では問題が出にくいが、医療・金融など規制業種ではポリシー条項を法務確認するのが安全
  • Modified MIT(Mistral Medium 3.5): 標準MITに一部商用条項を追加。EU内データ拠点での運用には親和性が高い

自社運用の判断軸 — 中小企業の視点

OSSモデルを「使うべきか」「どれを選ぶか」の判断は、用途・GPU予算・ライセンス要件の3点で大方決まります。

  • 用途がコーディング中心か: コード生成・テスト生成・リファクタが中核なら、SWE-Benchで優位なDeepSeek V4 Pro/Flashが第1候補。クラウドAPIで使う選択肢もあるが、社内コードを外に出したくないならFlash版で自社運用が現実的
  • 超長文書類を扱うか: 契約書束、長尺の技術仕様、コードベース全体をコンテキストに入れたい場合は、Llama 4 Scoutの1,000万トークンが他にない武器になる
  • 多言語(特に中国語・東南アジア言語)が必要か: Qwen 3.5は多言語性能の評価が高く、Apache 2.0なので商用展開のハードルも低い
  • EU圏の業務データを扱うか: Mistral Medium 3.5はEU内データ拠点での運用に対応しており、GDPR遵守の観点で説明しやすい
  • ノートPC・エッジ・エアギャップ環境か: Gemma 4やPhi-4が射程に入る。インターネット非接続の現場端末でAI支援を出したい用途に最適

中小企業が今すぐ取れるアクション

導入を一気に進めなくても、段階的に評価する道筋があります。

  • ステップ1: クラウドAPI経由でモデル評価: Together AI・Fireworks・OpenRouterなどがDeepSeek V4やLlama 4をAPIで提供しており、自社運用の前にコストと精度を実データで検証できる
  • ステップ2: 単一GPUインスタンスで小規模PoC: AWS・GCP・Azureで単一H100インスタンスをスポット起動し、Flashサイズや小型モデルを実際に動かす。月数万円から検証可能
  • ステップ3: オンプレ/VPC本番運用へ移行: ROIと精度が確認できたら、自社GPU調達またはマネージドGPUクラウドで本番化。ライセンスと運用ガバナンスはこの段階で法務・情シスを巻き込む

まとめ

オープンソースLLMの選択肢は、2026年5月時点で「どれかが圧倒的に優れている」状況ではなく、「用途とライセンスで使い分ける」段階に入りました。コーディングならDeepSeek V4、超長文ならLlama 4 Scout、多言語ならQwen 3.5、EU業務ならMistral Medium 3.5、エッジならGemma 4という具合に、軸を決めれば候補は自然に絞れます。まずはAPI経由で1〜2モデルを試し、自社の実データで精度とコストを比較することから始めるのがおすすめです。

オープンソースLLMの選定は、もはや「OSSかクラウドAPIか」の二択ではなく「どのOSSをどの用途で使うか」のポートフォリオ設計に変わりつつあります。複数モデルを段階導入できる組織が、2026年後半以降のAI活用で優位に立つことになります。

White Paper

2026年度版: AI・DX補助金徹底活用ガイド

AI導入の投資判断、対象業務の整理、補助金活用時の確認ポイントをまとめたPDF資料を用意しています。

相談する資料請求