Meta は自社 AI 推論チップ Meta Training and Inference Accelerator (MTIA) をわずか 2 年で 4 世代展開してきた経緯と、その背景にある柔軟性戦略を公開した。数十億ユーザー向けに多様な AI モデルをサーブしながらコストを抑えるため、短いハードウェア更新サイクルでアーキテクチャを進化させ続けるアプローチを採用している。

ポイント

  • MTIA チップを 2 年で 4 世代展開
  • 数十億ユーザー向け AI を低コストで運用するハードウェア戦略
  • 急速に変化するモデル landscape に追従する短い更新サイクル

ソース

Meta AI Blog