オープンソースLLMの2026年5月最新地図 — DeepSeek V4からMistral Medium 3.5まで主要モデルの選び方

AIモデル情報・分析2026.05.07

はじめに

オープンソースLLMの選択肢は、2026年に入って一段と濃密になりました。直近30日だけでもLlama 4、Qwen 3.5、DeepSeek V4、Gemma 4、Mistral Medium 3.5の5つのフロンティアクラスが新規に出ています。VPC内・オンプレ・自社GPUで動かす前提が現実味を増す一方、モデルごとにライセンスや必要GPUが大きく異なるため、技術選定の難易度は上がっています。本記事では、2026年5月時点での主要モデルを整理し、自社運用を検討する際の判断軸を提示します。

2026年春に出揃った主要モデル

直近のリリースで実用候補に挙がるモデルは6系統です。設計思想と適用領域が分かれているため、用途別に整理します。

DeepSeek V4(Pro/Flash): Pro版は1.6Tパラメータ(うち49B有効)のMoE構成で、SWE-Bench Verified 80.6%とコーディング系で最高水準。Flash版は284B/13B有効で単一H100でも動作。MITライセンスで制約なく商用利用可能
Llama 4(Scout/Maverick): Scoutは109B/17B有効、コンテキスト長1,000万トークンが最大の特徴。マルチモーダルネイティブ。Llama Community Licenseは月間アクティブユーザー7億超えで再交渉が必要
Qwen 3.5: 235B/22B有効のMoE。Apache 2.0(主要モデル)で商用利用が明快。中国語・多言語性能が強み
Mistral Medium 3.5(2026年4月29日公開): 128Bの密モデル、256Kコンテキスト、80言語対応。EU圏のデータレジデンシー要件に応えやすい欧州産モデル。GitHub/Linear/Jira統合エージェント機能が特徴
Gemma 4: 27B以下の小型MoE、14GB前後でノートPCや単一GPU稼働。エアギャップ環境やオンデバイス推論向け
Phi-4: Microsoft製の小型モデル、MITライセンス。エッジ推論や軽量タスクに適する

モデル比較表

代表的な観点で並べると、選択軸が見えやすくなります。

モデル	有効/総パラメータ	コンテキスト	ライセンス	必要GPU目安	主な強み
DeepSeek V4 Pro	49B/1.6T	100万	MIT	8×H200	コーディング最高水準
DeepSeek V4 Flash	13B/284B	100万	MIT	単一H100	軽量で同系統の精度を維持
Llama 4 Scout	17B/109B	1,000万	Llama Community	単一H100	超長文・マルチモーダル
Qwen 3.5	22B/235B	128K	Apache 2.0	2〜4×H100	多言語・商用ライセンス明快
Mistral Medium 3.5	128B(密)	256K	Modified MIT	2×H100	EUデータ拠点・エージェント連携
Gemma 4	27B以下	128K	Gemma Terms	ノートPC〜単一GPU	エアギャップ・オンデバイス

ライセンスと商用利用の整理

OSSという呼称ながら、ライセンス条件は4種類に分かれます。導入前に必ず確認したい論点です。

MIT/Apache 2.0(完全に商用フリー): DeepSeek V4、Phi-4はMIT。Qwen 3.5主要モデル、Gemma 4、Mistral Large 3はApache 2.0で、改変・再配布・社内利用に制約がほぼない
Llama Community License(条件付き): Llama 4は月間アクティブユーザー7億未満なら無償商用可。中小企業はほぼ抵触しないが、グループ会社合算でカウントするため大企業傘下では要確認
Gemma Terms(条件付き): 利用ポリシー違反時の停止権を留保。一般的な業務利用では問題が出にくいが、医療・金融など規制業種ではポリシー条項を法務確認するのが安全
Modified MIT(Mistral Medium 3.5): 標準MITに一部商用条項を追加。EU内データ拠点での運用には親和性が高い

自社運用の判断軸 — 中小企業の視点

OSSモデルを「使うべきか」「どれを選ぶか」の判断は、用途・GPU予算・ライセンス要件の3点で大方決まります。

用途がコーディング中心か: コード生成・テスト生成・リファクタが中核なら、SWE-Benchで優位なDeepSeek V4 Pro/Flashが第1候補。クラウドAPIで使う選択肢もあるが、社内コードを外に出したくないならFlash版で自社運用が現実的
超長文書類を扱うか: 契約書束、長尺の技術仕様、コードベース全体をコンテキストに入れたい場合は、Llama 4 Scoutの1,000万トークンが他にない武器になる
多言語(特に中国語・東南アジア言語)が必要か: Qwen 3.5は多言語性能の評価が高く、Apache 2.0なので商用展開のハードルも低い
EU圏の業務データを扱うか: Mistral Medium 3.5はEU内データ拠点での運用に対応しており、GDPR遵守の観点で説明しやすい
ノートPC・エッジ・エアギャップ環境か: Gemma 4やPhi-4が射程に入る。インターネット非接続の現場端末でAI支援を出したい用途に最適

中小企業が今すぐ取れるアクション

導入を一気に進めなくても、段階的に評価する道筋があります。

ステップ1: クラウドAPI経由でモデル評価: Together AI・Fireworks・OpenRouterなどがDeepSeek V4やLlama 4をAPIで提供しており、自社運用の前にコストと精度を実データで検証できる
ステップ2: 単一GPUインスタンスで小規模PoC: AWS・GCP・Azureで単一H100インスタンスをスポット起動し、Flashサイズや小型モデルを実際に動かす。月数万円から検証可能
ステップ3: オンプレ/VPC本番運用へ移行: ROIと精度が確認できたら、自社GPU調達またはマネージドGPUクラウドで本番化。ライセンスと運用ガバナンスはこの段階で法務・情シスを巻き込む

まとめ

オープンソースLLMの選択肢は、2026年5月時点で「どれかが圧倒的に優れている」状況ではなく、「用途とライセンスで使い分ける」段階に入りました。コーディングならDeepSeek V4、超長文ならLlama 4 Scout、多言語ならQwen 3.5、EU業務ならMistral Medium 3.5、エッジならGemma 4という具合に、軸を決めれば候補は自然に絞れます。まずはAPI経由で1〜2モデルを試し、自社の実データで精度とコストを比較することから始めるのがおすすめです。

オープンソースLLMの選定は、もはや「OSSかクラウドAPIか」の二択ではなく「どのOSSをどの用途で使うか」のポートフォリオ設計に変わりつつあります。複数モデルを段階導入できる組織が、2026年後半以降のAI活用で優位に立つことになります。

サービス

カテゴリー

オープンソースLLMの2026年5月最新地図 — DeepSeek V4からMistral Medium 3.5まで主要モデルの選び方

はじめに

2026年春に出揃った主要モデル

モデル比較表

ライセンスと商用利用の整理

自社運用の判断軸 — 中小企業の視点

中小企業が今すぐ取れるアクション

まとめ

関連記事

内製AIに切り替えるときの業務再設計｜データ準備と段階移行で見落とす3つの観点【2026年版】

SLM（小規模言語モデル）の選び方｜LLMとの違い・主要モデル比較と企業導入の注意点

LLM評価・モニタリングの実践：本番運用で品質を保つ指標とツールの選び方【2026年版】

LLMコスト最適化の実践：プロンプト管理・キャッシュ・モデルルーティングの判断軸【2026年版】

内製AIに切り替えるときの業務再設計｜データ準備と段階移行で見落とす3つの観点【2026年版】

SLM（小規模言語モデル）の選び方｜LLMとの違い・主要モデル比較と企業導入の注意点

LLM評価・モニタリングの実践：本番運用で品質を保つ指標とツールの選び方【2026年版】

LLMコスト最適化の実践：プロンプト管理・キャッシュ・モデルルーティングの判断軸【2026年版】

メモリポイズニング攻撃でAIエージェントの記憶はどう汚染されるか｜防御策を論文から検証

最新記事

内製AIに切り替えるときの業務再設計｜データ準備と段階移行で見落とす3つの観点【2026年版】

SLM（小規模言語モデル）の選び方｜LLMとの違い・主要モデル比較と企業導入の注意点

LLM評価・モニタリングの実践：本番運用で品質を保つ指標とツールの選び方【2026年版】

LLMコスト最適化の実践：プロンプト管理・キャッシュ・モデルルーティングの判断軸【2026年版】

メモリポイズニング攻撃でAIエージェントの記憶はどう汚染されるか｜防御策を論文から検証

2026年度版: AI・DX補助金徹底活用ガイド