LLM・マルチモーダルモデルまとめ(2025年6月版)

DX
この記事は約12分で読めます。

お久しぶりです、技術担当の @yeaah_masa です。

最近はエージェントAIや開発ツールでAIモデルを選択できる場面が増えてきましたが、進化が早すぎてどれが新しくてどの会社のやつかわからないってことありませんか?(私はそうでした…)

そこで今回は、大規模言語モデル(LLM)やマルチモーダルモデル(テキスト・画像・動画・音声・数値といった複数の種類のデータを一度に処理できるAIモデル)の最新動向についてまとめてみました!

この記事は2025/06/25時点の情報となります。生成AI情報は日々更新されるため、参照される場合は念のため最新情報をご確認ください。

要点まとめ(先に結論)

用途別の推奨モデル群を表にまとめました。
AIモデルを選択する際にぜひ参考にしてみてください!

用途/優先度OpenAIAnthropicGoogleその他
最高精度&エージェントOpenAI o3-pro / GPT-4.1Claude 4 OpusGemini 2.5 Pro
バランス重視GPT4oClaude 4 SonnetGemini 2.5 Flash-Lite
コーディング重視OpenAI o3-pro / GPT-4.1Claude 4 OpusGemini 2.5 ProDeepSeek Coder
超長文処理(1M tokens)OpenAI o3 / GPT-4.1Gemini 2.5 系DeepSeek-V2
OSS/トークン効率優先OpenAI o3-mini(※一部モデルはOSS実験中)🚫 非OSS🚫 非OSSdeepseek, grok, Mistral/Mixtral, LLaMA 3

主要プレイヤー

AIモデル開発の代表的な企業を整理しました。
日々状況が変わっていますが、現時点ではリストの上から3社が激戦を繰り広げていると思われます。
今回はこの3社のモデルについて後述していきます。

モデル名企業名創立年本社主な特徴・強み
GPT系🇺🇸 OpenAI2015年米国 カリフォルニア州・GPTシリーズの開発元(GPT-3, 4, 4oなど)
・ChatGPTで商業AIを牽引
・Microsoftと戦略提携(Azure連携)
Claude(クロード)🇺🇸 Anthropic2021年米国 カリフォルニア州・Claudeシリーズ(Claude 2, 3, 4)開発
・安全性・憲法AI(Constitutional AI)に注力
・Google、Amazonから出資を受ける
Gemini🇺🇸 Google (Alphabet)1998年(AI部門は2017年〜)米国 カリフォルニア州・Gemini(旧Bard)開発
・検索・YouTube等と深い統合
・DeepMindも傘下(AlphaFold等)
LLaMA(ラマ)🇺🇸 Meta2004年米国 カリフォルニア州・LLaMAシリーズ開発(LLaMA 2/3)
・OSSに注力、研究者向けの貢献大
・AIチャット「Meta AI」も展開中
Mistral🇫🇷 Mistral AI2023年フランス パリ・高性能・軽量OSSモデルに強み(Mistral 7B, Mixtral)
・ヨーロッパ発、LLaMA互換に特化
・商用+OSSのハイブリッド戦略
Command🇨🇦 Cohere2019年カナダ トロント・Retrieval-Augmented Generation(RAG)特化
・「Command-R+」など商用向け強化
・エンタープライズ向けLLMに注力
DeepSeek🇨🇳 DeepSeek2023年中国(深圳または北京)・コーディング特化(DeepSeek Coder)
・超長文コンテキスト(100万tokens)対応
・OSS公開も活発(DeepSeek-V2など)

GPT系(OpenAI)

ご存じの方も多い、AI旋風のトップランナー的なOpenAI社が開発しているGPT系です。
特にchatGPTは多くの人が仕事だけでなく日常的に使うレベルにまで達したと思います。

OpenAIのモデルは現在大きく2つに分かれています。それぞれみていきましょう。

  • GPT系列モデル(大規模言語モデル)
  • OpenAI o系モデル(推論特化モデル)

GPT系列モデル(大規模言語モデル)

以下がGPT系列モデルの系譜です。

GPT-3(2020)
   ↓
GPT-3.5(2022)
   ↓
GPT-4(2023/3)
   ├─ GPT-4 Turbo(2023/11)
   └─ GPT-4oシリーズ(2024/05)
        ├─ GPT-4o(2024/05)
        └─ GPT-4o mini(2024/07)
   └─ GPT-4.1シリーズ(2025/04)
        ├─ GPT-4.1(2025/04)
        └─ GPT-4.1 mini/nano(通称、非公開名)(2025/04)
   └─ GPT-4.5(2025/02)
   ↓
GPT-5(2025後半)
  • 一般的に使用されるモデルの最新はGPT-4.1。GPT-4o比で大きな性能向上となっている。
  • 最新はGPT-4.5だが研究プレビュー中、限定ユーザーのみ使用可。
  • GPT-5は2025年の夏〜秋頃に登場すると予想されている。

ちなみに、GPT-4oと後述のo3/o4系が非常にわかりにくいので混乱しがちですが、別系統と理解すれば大丈夫だと思います。

各モデルの説明はこちら
モデル名リリース説明
GPT-3.5シリーズ2022年11月GPT-3を改良したモデル群。ChatGPTはこのGPT-3.5系列のモデルを微調整したものであり、研究プレビューとして2022年11月に公開されました。
GPT-3.5 Turbo2023年03月ChatGPTで使用されていたモデル(gpt-3.5-turbo)がAPI経由で提供開始。1kトークンあたり$0.002と従来より大幅に低価格で、汎用的なチャット/テキスト生成に最適化されています。
GPT-42023年03月マルチモーダル(画像入力対応)の大型モデルとして発表され、従来のGPT-3.5を上回る高度な能力を示しました。
GPT-4 Turbo2023年11月GPT-4の次世代モデルプレビュー版。128Kトークンの長大な文脈に対応し、応答品質を維持しつつ入力トークン当たり3分の1の価格、出力は2分の1の価格に最適化されています。
GPT-4oシリーズ2024年05月マルチモーダル推論機能を強化したGPT-4系統の新モデル群。
GPT-4o2024年05月音声・画像・テキストのリアルタイム統合推論が可能な新たなフラッグシップモデル。GPT-4に対する大きな進歩で、無料ユーザも利用可能になりました(Spring Update)。
GPT-4o mini2024年07月小型でコスト効率の高いモデル。GPT-4oと同様にテキストとビジョンに対応しつつ、トークンあたりの価格をGPT-3.5 Turboより 60% 以上削減した低コストモデルとして公開されました。
GPT-4.52025年02月GPT系列における最大・最先端モデルの研究プレビュー版。大規模な事前学習データによる直感的知識の向上で創造性や応答の正確性が強化されており、ChatGPTのProユーザおよび開発者向けに提供されました。
GPT-4.1シリーズ2025年04月GPT-4の改良版となる新シリーズ。コーディング能力、指示遵守、長文コンテキストで大幅な改善がなされ、最大100万トークンのコンテキストウィンドウを備えています。知識データも2024年6月まで更新され、GPT-4oを全般で上回る性能を示しました。
GPT-4.12025年04月上記GPT-4.1シリーズの標準モデル。特にコード生成や長文読解でGPT-4o比で大きな性能向上が報告されています
GPT-4.1 mini2025年04月GPT-4.1シリーズの小型モデル。モデルサイズ削減による低レイテンシー・低コストながら、多くのベンチマークでGPT-4oに匹敵する知能を示します。
GPT-4.1 nano2025年04月GPT-4.1シリーズ中最小・最速のモデル。1百万トークンのコンテキストに対応しつつ、MMLUやGPQAといった評価でGPT-4o miniを上回るスコアを達成しています。

OpenAI o系モデル(推論特化モデル)

こちらが推論特化のo(オー)系モデルの系譜です。

OpenAI o1系(2024/12)
   ├─ OpenAI o1(2024/12)
   ├─ OpenAI o1-mini(2024/12)
   └─ OpenAI o3-mini(2025/01)
   ↓
OpenAI o3系(2025/04)
   ├─ OpenAI o3(2025/04)
   ├─ OpenAI o4-mini(2025/04)
   ├─ OpenAI o4-mini-high(2025/04)
   └─ OpenAI o3-pro(2025/06)
  • 一般的に使用される標準モデルの最新はOpenAI o3。o1から信頼性を向上させエージェント的な振る舞いが可能に。
  • o3-miniはo3より前にリリースされており、軽量版の最新はo4-miniとなる。
  • o3-pro が2025/6月にリリースされ、現時点で最も信頼性の高いモデルという位置づけ。
各モデルの説明はこちら
モデル名リリース説明
OpenAI o12024年12月ChatGPT Proで無制限利用可能となった最も高性能な推論モデル。当時の「最も賢い」モデルと位置付けられ、難解な問題に対してより長く「考える」ことで信頼性の高い回答を生成します。
OpenAI o1‑mini2024年12月ChatGPT Proに含まれる小型高速モデル。レイテンシーとコストを抑えつつ、OpenAI o1ベースの推論能力を提供します。
OpenAI o3‑mini2025年01月推論シリーズの新たな小型モデル。科学・数学・コーディング分野に強みを持ち、低コスト・低遅延でありながらOpenAI o1-miniを上回る性能を発揮します。Plus/Teamユーザ向けには1日150メッセージに緩和され、無料ユーザも「Reason」モードで試用可能となりました。
OpenAI o32025年04月oシリーズの主力モデル第2世代。より長く「考える」ことで高度な推論を行い、コード実行や検索など全てのツールを統合的に活用できる初のモデルです。難解な実問題での回答の信頼性がOpenAI o1比で20%向上し、複雑な課題に対するエージェント的な振る舞いが可能になりました。
OpenAI o4‑mini2025年04月同時発表された小型モデル。高速・低コストな推論に特化しつつ、数学コンテスト(AIME)やコード問題で前世代の小型モデルを凌ぐ性能を達成しています。

Claude(Anthropic)

次はAnthropic社のClaudeのモデル系譜です。

Claude 1(2023/03)
   ↓
Claude 2(2023/07)
   ↓
Claude 3(2024/03)
   ├─ Claude 3 Haiku(軽量・高速)
   ├─ Claude 3 Sonnet(標準)
   └─ Claude 3 Opus(高性能・精度重視)
       ↓
Claude 3.5(2024/06)
   └─ Claude 3.5 Sonnet(Claude 3 Opusを超える)
       ↓
Claude 4シリーズ(2025/05)
   ├─ Claude 4 Sonnet
   └─ Claude 4 Opus(高精度・エージェント対応)
  • 一般的に使用される標準モデルの最新はClaude 4 Opus。
  • Claudeは標準版をSonnet、高性能版をOpusと呼ぶのでわかりやすい。
  • Anthropic社は憲法AIの考え方が特徴的。
各モデルの説明はこちら
モデル名リリース説明
Claude 3 Haiku2024年3月・軽量・高速モデル
・低レイテンシ・コスト重視
・チャットボット・分類・要約など
Claude 3 Sonnet2024年3月・標準モデル(中間)
・高速+高精度のバランス
・ビジネス応答・分析・QA向き
Claude 3 Opus2024年3月・最上位モデル
・高度な推論・コーディング能力
・GPT-4並〜それ以上(MMLU等)
Claude 3.5 Sonnet2024年6月・3シリーズの改良版(Sonnet)
・Claude 3 Opusを上回る性能とAnthropicが公言
・マルチステップ推論・コード理解に優れる
Claude 4 Sonnet2025年5月・Claude 4世代の標準モデル
・Claude 3.5より安定・堅実
・AgentやTool Useとの親和性高
Claude 4 Opus2025年5月・Claude 4世代の最上位
・最新エージェント機能対応(Tool Use / Memory)
・現在最強クラス(Claude系で最高)

Gemini(Google)

最後にGoogle社のGeminiのモデル系譜です。

LaMDA(2021)※Bardの前身
   ↓
PaLM 2(2023)※Bardへ搭載
   ↓
Gemini 1(2023/12)
   ├─ Gemini 1 Nano(軽量)
   ├─ Gemini 1 Pro
   └─ Gemini 1 Ultra(未公開/社内)
       ↓
Gemini 1.5(2024/2)
   └─ Gemini 1.5 Pro(1Mトークン)
       ↓
Gemini 2.5(2025/3〜6 プレビュー含む)
   ├─ Gemini 2.5 Pro(精度・ツール)
   ├─ Gemini 2.5 Flash(高速処理)
   └─ Gemini 2.5 Flash Lite(要約・分類)
  • 一般的に使用される標準モデルの最新はGemini 2.5。
  • Gemini 2.5 Proは、OpenAI o3-proやClaude 4 Opusの直接競合。
  • Google製品(検索・Gmail・Android)と深く統合されているのが強み。

GeminiはGoogleサービスと統合して使えるため最も手軽に使えるといえます。
特にNotebookLMやGoogle AI Studioはまさに業務効率化の決定版といえるくらいのインパクトを与えています。

各モデルの説明はこちら
モデル名リリース説明
Gemini 1.5 Pro2024年5月・Gemini 1系の集大成・精度重視モデル
・高度な推論・RAG向き
・Vision、コード対応、Claude 3対抗
Gemini 2.5 Pro2025年3~6月・2.5世代の上位・マルチモーダル対応
・GPT-4o、Claude 4 Opusと同格クラス
・長文処理・推論・ツール連携にも強い
Gemini 2.5 Flash2025年05月・軽量高速モデル(Proの下位)
・応答速度が非常に速い
・ライトなチャット、分類・要約に最適
Gemini 2.5 Flash Lite2025年06月・Flashよりさらに軽量・最小限機能
・コスト重視・リアルタイムUI処理向き
・フォーム補完・要約・感情分類など
※2025年6月時点では限定公開

おわりに

以上、代表的な3社の最新モデルをピックアップしてみました。
ぜひ参考にして頂けると幸いです。

こうやってみると、2025年の4~6月は各社が新モデルを続々と投入しており、いまが一番アツい時期なんだと再認識しました。
また無料や低価格で使えるモデルは1年前くらいのものが多く、モデルを意識せずに使用していると取り残されていく危機感も感じましたね。意識的に最新モデルをベンチマークしていくことが重要だと思いました。

いったん私の中でも整理はついたので、今度はコストについてもまとめられたらいいな、と思っています。(そうしている間に次のモデルが続々出てきて状況が変わりそうですが・・・)

それではまた!


弊社ではDX推進支援サービスを展開しております。
業務プロセス整理やPoC設計のご支援など、生成AIを絡めたDXで気になる点あればお気軽にご相談ください。無料相談も承っておりますのでこの機会にぜひ!

タイトルとURLをコピーしました