オープンウェイト / OSS モデル・データセット公開(research-paper との重複なら両方付ける)

記事 4 件

推論モデル期 DeepSeek 2025-01-20

DeepSeek-R1 公開(オープンウェイト推論モデル)

DeepSeek が o1 級の推論能力を持つ R1 をオープンウェイトで公開。学習コストが既存 GPT-4 級の数十分の1という主張で世界に衝撃。

ソース: DeepSeek

マルチモーダル期 Meta AI / Meta 2024-04-18

Meta Llama 3 (8B/70B) オープンウェイト公開

Meta が Llama 3 (8B / 70B) をオープンウェイトで公開。トークナイザ・コンテキスト長・データ品質を刷新し、70B モデルが当時のクローズド主力モデルに匹敵する性能を示した。8B は単一 GPU でも動かせるサイズで普及。

ソース: LLaMA

RLHF / アラインメント期 Meta AI / MetaMicrosoft 2023-07-18

Llama 2 公開 — Meta が大規模 LLM をオープンウェイトで提供

Meta が Microsoft と提携して Llama 2 (7B/13B/70B) をオープンウェイトで公開。Azure 経由でもデプロイ可能で、商用利用も条件付きで許可。クローズドモデルとオープンモデルの二極化の象徴的リリース。

ソース: LLaMA

RLHF / アラインメント期 Stability AI学術機関(大学・研究機関) 2022-08-22

Stable Diffusion 1.x 一般公開 — オープン画像生成モデル

Stability AI が CompVis / LMU München / Runway と共同開発した Stable Diffusion をオープンウェイト + コード公開。誰でもローカル GPU で動かせる強力な text-to-image 拡散モデルとして爆発的普及を引き起こした。

ソース: Stable Diffusion