お久しぶりです、技術担当の @yeaah_masa です。
最近はエージェントAIや開発ツールでAIモデルを選択できる場面が増えてきましたが、進化が早すぎてどれが新しくてどの会社のやつかわからないってことありませんか?(私はそうでした…)
そこで今回は、大規模言語モデル(LLM)やマルチモーダルモデル(テキスト・画像・動画・音声・数値といった複数の種類のデータを一度に処理できるAIモデル)の最新動向についてまとめてみました!
要点まとめ(先に結論)
用途別の推奨モデル群を表にまとめました。
AIモデルを選択する際にぜひ参考にしてみてください!
用途/優先度 | OpenAI | Anthropic | その他 | |
---|---|---|---|---|
最高精度&エージェント | OpenAI o3-pro / GPT-4.1 | Claude 4 Opus | Gemini 2.5 Pro | ー |
バランス重視 | GPT–4o | Claude 4 Sonnet | Gemini 2.5 Flash-Lite | ー |
コーディング重視 | OpenAI o3-pro / GPT-4.1 | Claude 4 Opus | Gemini 2.5 Pro | DeepSeek Coder |
超長文処理(1M tokens) | OpenAI o3 / GPT-4.1 | ー | Gemini 2.5 系 | DeepSeek-V2 |
OSS/トークン効率優先 | OpenAI o3-mini(※一部モデルはOSS実験中) | 🚫 非OSS | 🚫 非OSS | deepseek, grok, Mistral/Mixtral, LLaMA 3 |
主要プレイヤー
AIモデル開発の代表的な企業を整理しました。
日々状況が変わっていますが、現時点ではリストの上から3社が激戦を繰り広げていると思われます。
今回はこの3社のモデルについて後述していきます。
モデル名 | 企業名 | 創立年 | 本社 | 主な特徴・強み |
---|---|---|---|---|
GPT系 | 🇺🇸 OpenAI | 2015年 | 米国 カリフォルニア州 | ・GPTシリーズの開発元(GPT-3, 4, 4oなど) ・ChatGPTで商業AIを牽引 ・Microsoftと戦略提携(Azure連携) |
Claude(クロード) | 🇺🇸 Anthropic | 2021年 | 米国 カリフォルニア州 | ・Claudeシリーズ(Claude 2, 3, 4)開発 ・安全性・憲法AI(Constitutional AI)に注力 ・Google、Amazonから出資を受ける |
Gemini | 🇺🇸 Google (Alphabet) | 1998年(AI部門は2017年〜) | 米国 カリフォルニア州 | ・Gemini(旧Bard)開発 ・検索・YouTube等と深い統合 ・DeepMindも傘下(AlphaFold等) |
LLaMA(ラマ) | 🇺🇸 Meta | 2004年 | 米国 カリフォルニア州 | ・LLaMAシリーズ開発(LLaMA 2/3) ・OSSに注力、研究者向けの貢献大 ・AIチャット「Meta AI」も展開中 |
Mistral | 🇫🇷 Mistral AI | 2023年 | フランス パリ | ・高性能・軽量OSSモデルに強み(Mistral 7B, Mixtral) ・ヨーロッパ発、LLaMA互換に特化 ・商用+OSSのハイブリッド戦略 |
Command | 🇨🇦 Cohere | 2019年 | カナダ トロント | ・Retrieval-Augmented Generation(RAG)特化 ・「Command-R+」など商用向け強化 ・エンタープライズ向けLLMに注力 |
DeepSeek | 🇨🇳 DeepSeek | 2023年 | 中国(深圳または北京) | ・コーディング特化(DeepSeek Coder) ・超長文コンテキスト(100万tokens)対応 ・OSS公開も活発(DeepSeek-V2など) |
GPT系(OpenAI)
ご存じの方も多い、AI旋風のトップランナー的なOpenAI社が開発しているGPT系です。
特にchatGPTは多くの人が仕事だけでなく日常的に使うレベルにまで達したと思います。
OpenAIのモデルは現在大きく2つに分かれています。それぞれみていきましょう。
- GPT系列モデル(大規模言語モデル)
- OpenAI o系モデル(推論特化モデル)
GPT系列モデル(大規模言語モデル)
以下がGPT系列モデルの系譜です。
GPT-3(2020)
↓
GPT-3.5(2022)
↓
GPT-4(2023/3)
├─ GPT-4 Turbo(2023/11)
└─ GPT-4oシリーズ(2024/05)
├─ GPT-4o(2024/05)
└─ GPT-4o mini(2024/07)
└─ GPT-4.1シリーズ(2025/04)
├─ GPT-4.1(2025/04)
└─ GPT-4.1 mini/nano(通称、非公開名)(2025/04)
└─ GPT-4.5(2025/02)
↓
GPT-5(2025後半)
- 一般的に使用されるモデルの最新はGPT-4.1。GPT-4o比で大きな性能向上となっている。
- 最新はGPT-4.5だが研究プレビュー中、限定ユーザーのみ使用可。
- GPT-5は2025年の夏〜秋頃に登場すると予想されている。
ちなみに、GPT-4oと後述のo3/o4系が非常にわかりにくいので混乱しがちですが、別系統と理解すれば大丈夫だと思います。
各モデルの説明はこちら
モデル名 | リリース | 説明 |
---|---|---|
GPT-3.5シリーズ | 2022年11月 | GPT-3を改良したモデル群。ChatGPTはこのGPT-3.5系列のモデルを微調整したものであり、研究プレビューとして2022年11月に公開されました。 |
GPT-3.5 Turbo | 2023年03月 | ChatGPTで使用されていたモデル(gpt-3.5-turbo )がAPI経由で提供開始。1kトークンあたり$0.002と従来より大幅に低価格で、汎用的なチャット/テキスト生成に最適化されています。 |
GPT-4 | 2023年03月 | マルチモーダル(画像入力対応)の大型モデルとして発表され、従来のGPT-3.5を上回る高度な能力を示しました。 |
GPT-4 Turbo | 2023年11月 | GPT-4の次世代モデルプレビュー版。128Kトークンの長大な文脈に対応し、応答品質を維持しつつ入力トークン当たり3分の1の価格、出力は2分の1の価格に最適化されています。 |
GPT-4oシリーズ | 2024年05月 | マルチモーダル推論機能を強化したGPT-4系統の新モデル群。 |
GPT-4o | 2024年05月 | 音声・画像・テキストのリアルタイム統合推論が可能な新たなフラッグシップモデル。GPT-4に対する大きな進歩で、無料ユーザも利用可能になりました(Spring Update)。 |
GPT-4o mini | 2024年07月 | 小型でコスト効率の高いモデル。GPT-4oと同様にテキストとビジョンに対応しつつ、トークンあたりの価格をGPT-3.5 Turboより 60% 以上削減した低コストモデルとして公開されました。 |
GPT-4.5 | 2025年02月 | GPT系列における最大・最先端モデルの研究プレビュー版。大規模な事前学習データによる直感的知識の向上で創造性や応答の正確性が強化されており、ChatGPTのProユーザおよび開発者向けに提供されました。 |
GPT-4.1シリーズ | 2025年04月 | GPT-4の改良版となる新シリーズ。コーディング能力、指示遵守、長文コンテキストで大幅な改善がなされ、最大100万トークンのコンテキストウィンドウを備えています。知識データも2024年6月まで更新され、GPT-4oを全般で上回る性能を示しました。 |
GPT-4.1 | 2025年04月 | 上記GPT-4.1シリーズの標準モデル。特にコード生成や長文読解でGPT-4o比で大きな性能向上が報告されています |
GPT-4.1 mini | 2025年04月 | GPT-4.1シリーズの小型モデル。モデルサイズ削減による低レイテンシー・低コストながら、多くのベンチマークでGPT-4oに匹敵する知能を示します。 |
GPT-4.1 nano | 2025年04月 | GPT-4.1シリーズ中最小・最速のモデル。1百万トークンのコンテキストに対応しつつ、MMLUやGPQAといった評価でGPT-4o miniを上回るスコアを達成しています。 |
OpenAI o系モデル(推論特化モデル)
こちらが推論特化のo(オー)系モデルの系譜です。
OpenAI o1系(2024/12)
├─ OpenAI o1(2024/12)
├─ OpenAI o1-mini(2024/12)
└─ OpenAI o3-mini(2025/01)
↓
OpenAI o3系(2025/04)
├─ OpenAI o3(2025/04)
├─ OpenAI o4-mini(2025/04)
├─ OpenAI o4-mini-high(2025/04)
└─ OpenAI o3-pro(2025/06)
- 一般的に使用される標準モデルの最新はOpenAI o3。o1から信頼性を向上させエージェント的な振る舞いが可能に。
- o3-miniはo3より前にリリースされており、軽量版の最新はo4-miniとなる。
- o3-pro が2025/6月にリリースされ、現時点で最も信頼性の高いモデルという位置づけ。
各モデルの説明はこちら
モデル名 | リリース | 説明 |
---|---|---|
OpenAI o1 | 2024年12月 | ChatGPT Proで無制限利用可能となった最も高性能な推論モデル。当時の「最も賢い」モデルと位置付けられ、難解な問題に対してより長く「考える」ことで信頼性の高い回答を生成します。 |
OpenAI o1‑mini | 2024年12月 | ChatGPT Proに含まれる小型高速モデル。レイテンシーとコストを抑えつつ、OpenAI o1ベースの推論能力を提供します。 |
OpenAI o3‑mini | 2025年01月 | 推論シリーズの新たな小型モデル。科学・数学・コーディング分野に強みを持ち、低コスト・低遅延でありながらOpenAI o1-miniを上回る性能を発揮します。Plus/Teamユーザ向けには1日150メッセージに緩和され、無料ユーザも「Reason」モードで試用可能となりました。 |
OpenAI o3 | 2025年04月 | oシリーズの主力モデル第2世代。より長く「考える」ことで高度な推論を行い、コード実行や検索など全てのツールを統合的に活用できる初のモデルです。難解な実問題での回答の信頼性がOpenAI o1比で20%向上し、複雑な課題に対するエージェント的な振る舞いが可能になりました。 |
OpenAI o4‑mini | 2025年04月 | 同時発表された小型モデル。高速・低コストな推論に特化しつつ、数学コンテスト(AIME)やコード問題で前世代の小型モデルを凌ぐ性能を達成しています。 |
Claude(Anthropic)
次はAnthropic社のClaudeのモデル系譜です。
Claude 1(2023/03)
↓
Claude 2(2023/07)
↓
Claude 3(2024/03)
├─ Claude 3 Haiku(軽量・高速)
├─ Claude 3 Sonnet(標準)
└─ Claude 3 Opus(高性能・精度重視)
↓
Claude 3.5(2024/06)
└─ Claude 3.5 Sonnet(Claude 3 Opusを超える)
↓
Claude 4シリーズ(2025/05)
├─ Claude 4 Sonnet
└─ Claude 4 Opus(高精度・エージェント対応)
- 一般的に使用される標準モデルの最新はClaude 4 Opus。
- Claudeは標準版をSonnet、高性能版をOpusと呼ぶのでわかりやすい。
- Anthropic社は憲法AIの考え方が特徴的。
各モデルの説明はこちら
モデル名 | リリース | 説明 |
---|---|---|
Claude 3 Haiku | 2024年3月 | ・軽量・高速モデル ・低レイテンシ・コスト重視 ・チャットボット・分類・要約など |
Claude 3 Sonnet | 2024年3月 | ・標準モデル(中間) ・高速+高精度のバランス ・ビジネス応答・分析・QA向き |
Claude 3 Opus | 2024年3月 | ・最上位モデル ・高度な推論・コーディング能力 ・GPT-4並〜それ以上(MMLU等) |
Claude 3.5 Sonnet | 2024年6月 | ・3シリーズの改良版(Sonnet) ・Claude 3 Opusを上回る性能とAnthropicが公言 ・マルチステップ推論・コード理解に優れる |
Claude 4 Sonnet | 2025年5月 | ・Claude 4世代の標準モデル ・Claude 3.5より安定・堅実 ・AgentやTool Useとの親和性高 |
Claude 4 Opus | 2025年5月 | ・Claude 4世代の最上位 ・最新エージェント機能対応(Tool Use / Memory) ・現在最強クラス(Claude系で最高) |
Gemini(Google)
最後にGoogle社のGeminiのモデル系譜です。
LaMDA(2021)※Bardの前身
↓
PaLM 2(2023)※Bardへ搭載
↓
Gemini 1(2023/12)
├─ Gemini 1 Nano(軽量)
├─ Gemini 1 Pro
└─ Gemini 1 Ultra(未公開/社内)
↓
Gemini 1.5(2024/2)
└─ Gemini 1.5 Pro(1Mトークン)
↓
Gemini 2.5(2025/3〜6 プレビュー含む)
├─ Gemini 2.5 Pro(精度・ツール)
├─ Gemini 2.5 Flash(高速処理)
└─ Gemini 2.5 Flash Lite(要約・分類)
- 一般的に使用される標準モデルの最新はGemini 2.5。
- Gemini 2.5 Proは、OpenAI o3-proやClaude 4 Opusの直接競合。
- Google製品(検索・Gmail・Android)と深く統合されているのが強み。
GeminiはGoogleサービスと統合して使えるため最も手軽に使えるといえます。
特にNotebookLMやGoogle AI Studioはまさに業務効率化の決定版といえるくらいのインパクトを与えています。
各モデルの説明はこちら
モデル名 | リリース | 説明 |
---|---|---|
Gemini 1.5 Pro | 2024年5月 | ・Gemini 1系の集大成・精度重視モデル ・高度な推論・RAG向き ・Vision、コード対応、Claude 3対抗 |
Gemini 2.5 Pro | 2025年3~6月 | ・2.5世代の上位・マルチモーダル対応 ・GPT-4o、Claude 4 Opusと同格クラス ・長文処理・推論・ツール連携にも強い |
Gemini 2.5 Flash | 2025年05月 | ・軽量高速モデル(Proの下位) ・応答速度が非常に速い ・ライトなチャット、分類・要約に最適 |
Gemini 2.5 Flash Lite | 2025年06月 | ・Flashよりさらに軽量・最小限機能 ・コスト重視・リアルタイムUI処理向き ・フォーム補完・要約・感情分類など ※2025年6月時点では限定公開 |
おわりに
以上、代表的な3社の最新モデルをピックアップしてみました。
ぜひ参考にして頂けると幸いです。
こうやってみると、2025年の4~6月は各社が新モデルを続々と投入しており、いまが一番アツい時期なんだと再認識しました。
また無料や低価格で使えるモデルは1年前くらいのものが多く、モデルを意識せずに使用していると取り残されていく危機感も感じましたね。意識的に最新モデルをベンチマークしていくことが重要だと思いました。
いったん私の中でも整理はついたので、今度はコストについてもまとめられたらいいな、と思っています。(そうしている間に次のモデルが続々出てきて状況が変わりそうですが・・・)
それではまた!
弊社ではDX推進支援サービスを展開しております。
業務プロセス整理やPoC設計のご支援など、生成AIを絡めたDXで気になる点あればお気軽にご相談ください。無料相談も承っておりますのでこの機会にぜひ!