マルチモーダル統合(画像・動画・音声)

記事 1 件

マルチモーダル期 OpenAI 2024-05-13

GPT-4o(omni)リリース

テキスト・画像・音声をネイティブに統合した GPT-4o が公開。音声応答が実時間に近づき、価格は GPT-4 Turbo の半額に。

ソース: GPT-4o