DeepSeek-R1 公開(オープンウェイト推論モデル)
DeepSeek が o1 級の推論能力を持つ R1 をオープンウェイトで公開。学習コストが既存 GPT-4 級の数十分の1という主張で世界に衝撃。
ソース: DeepSeek
OpenAI o1 / o3、DeepSeek-R1、Qwen QwQ など extended thinking を内蔵した推論モデルが新ジャンルとして登場。
期間: 2024-09-12 〜 2025-03-01
DeepSeek が o1 級の推論能力を持つ R1 をオープンウェイトで公開。学習コストが既存 GPT-4 級の数十分の1という主張で世界に衝撃。
ソース: DeepSeek
推論時間を伸ばすことで難問の正答率を大幅に伸ばす o1-preview が公開。AIME で74%(GPT-4o は12%)。新ジャンルとしての推論モデルが定義された。
ソース: OpenAI o1