DeepSeek-R1 公開(オープンウェイト推論モデル)
DeepSeek が o1 級の推論能力を持つ R1 をオープンウェイトで公開。学習コストが既存 GPT-4 級の数十分の1という主張で世界に衝撃。
ソース: DeepSeek
DeepSeek が o1 級の推論能力を持つ R1 をオープンウェイトで公開。学習コストが既存 GPT-4 級の数十分の1という主張で世界に衝撃。
ソース: DeepSeek
Meta が Llama 3 (8B / 70B) をオープンウェイトで公開。トークナイザ・コンテキスト長・データ品質を刷新し、70B モデルが当時のクローズド主力モデルに匹敵する性能を示した。8B は単一 GPU でも動かせるサイズで普及。
ソース: LLaMA
Meta が Microsoft と提携して Llama 2 (7B/13B/70B) をオープンウェイトで公開。Azure 経由でもデプロイ可能で、商用利用も条件付きで許可。クローズドモデルとオープンモデルの二極化の象徴的リリース。
ソース: LLaMA
Stability AI が CompVis / LMU München / Runway と共同開発した Stable Diffusion をオープンウェイト + コード公開。誰でもローカル GPU で動かせる強力な text-to-image 拡散モデルとして爆発的普及を引き起こした。
ソース: Stable Diffusion