マルチモーダル期

GPT-4V / Claude 3 / Gemini 1.5 / GPT-4o など、画像・音声・動画を統合的に扱うモデルが標準化。

期間: 2023-09-25 〜 2024-09-12

記事 1 件

マルチモーダル期 OpenAI 2024-05-13

GPT-4o(omni)リリース

テキスト・画像・音声をネイティブに統合した GPT-4o が公開。音声応答が実時間に近づき、価格は GPT-4 Turbo の半額に。

ソース: GPT-4o