学術機関(大学・研究機関)

記事 8 件

RLHF / アラインメント期 Stability AI学術機関(大学・研究機関) 2022-08-22

Stable Diffusion 1.x 一般公開 — オープン画像生成モデル

Stability AI が CompVis / LMU München / Runway と共同開発した Stable Diffusion をオープンウェイト + コード公開。誰でもローカル GPU で動かせる強力な text-to-image 拡散モデルとして爆発的普及を引き起こした。

ソース: Stable Diffusion

Transformer 期 OpenAI学術機関(大学・研究機関) 2020-01-23

Scaling Laws for Neural Language Models 公開(Kaplan ら)

Kaplan ら(OpenAI / Johns Hopkins)による Neural Language Model のスケーリング則。性能がパラメータ数・データ量・計算量に対しべき乗則で改善することを実証し、その後の大規模化(GPT-3 以降)の理論的根拠になった。

ソース: Neural scaling law

Transformer 期 Google DeepMind / Google学術機関(大学・研究機関) 2017-06-12

Attention Is All You Need 公開(Transformer 提唱)

Vaswani ら(Google Brain / Google Research)による Transformer アーキテクチャ提唱論文。Self-Attention のみで RNN/CNN を不要に。NeurIPS 2017 採択。

ソース: Transformer (deep learning architecture)

Transformer 以前 Microsoft学術機関(大学・研究機関) 2015-12-10

ResNet 論文公開 — 残差接続で超深層 NN を実現(He ら)

Microsoft Research Asia の He Kaiming らが Residual Network (ResNet) を提案。skip connection で 152 層の超深層 CNN を学習可能にし、ImageNet で人間超え精度を達成。以後の深層 NN 設計の標準に。

ソース: Residual neural network

Transformer 以前 Google DeepMind / Google学術機関(大学・研究機関) 2014-09-10

Seq2Seq 論文公開 — 機械翻訳に深層学習が本格適用

Sutskever・Vinyals・Le(Google)による Sequence to Sequence Learning。LSTM ベースのエンコーダ・デコーダ構造で機械翻訳の SOTA を更新し、後の Attention / Transformer への道筋を作った。

ソース: Seq2seq

Transformer 以前 学術機関(大学・研究機関) 2014-06-10

GAN(敵対的生成ネットワーク)論文公開(Goodfellow ら)

Goodfellow ら(モントリオール大)が Generative Adversarial Network (GAN) を提案。生成器と識別器を min-max で対立させる新枠組みで、その後の画像生成研究の礎になった。

ソース: Generative adversarial network

Transformer 以前 Google DeepMind / Google学術機関(大学・研究機関) 2013-09-17

word2vec 論文公開(Mikolov ら)

Mikolov らが Google で開発した word2vec が公開され、ニューラル単語埋め込みが現代 NLP の基礎になった。CBOW と Skip-gram の2モデルを提案。

ソース: Word2vec

Transformer 以前 学術機関(大学・研究機関) 2012-09-30

AlexNet が ImageNet で圧勝 — 深層学習復活の象徴

Krizhevsky・Sutskever・Hinton(トロント大)が GPU 学習した CNN 「AlexNet」が ImageNet ILSVRC 2012 でトップ 5 エラー率を 25.8% → 15.3% に劇的改善。深層学習の再ブレイクのきっかけ。

ソース: AlexNet