Google DeepMind / Google
記事 14 件
エージェント期 Google DeepMind / Google 2026-05-10
Gemma 4 の MTP drafter — 推論速度を最大 3 倍にする技術
Google の Gemma 4 に搭載された MTP (Multi-Token Prediction) drafter の仕組みを解説。従来の speculative decoding に対する改良として、自己回帰モデル内で複数トークンを並列予測し、ドラフトモデルを別途用意する必要がない設計が特徴。報告では推論速度が最大 3 倍に向上。ローカル LLM 推論の高速化技術として注目される。
ソース: Zenn (llm)
エージェント期 Google DeepMind / Google 2026-05-10
Google の Gemma 4 を Intel Lunar Lake 内蔵 NPU で動作させる実践記事。OpenVINO 2026 と openvino-genai を組み合わせ、量子化・モデル変換・推論パイプラインを構築。クラウド API に頼らないローカル推論の選択肢として、エッジ AI / プライバシー重視ワークロードでIntel NPU + OpenVINO スタックの実用性が一段階上がっていることを示す事例。
ソース: Zenn (llm)
エージェント期 Google DeepMind / Google 2026-05-09
google-genai (python) v2.0.1 — response_format フィールド名を snake_case に修正
Google GenAI Python SDK v2.0.1(2026-05-09 リリース)はバグ修正パッチ。`response_format` のフィールド名を snake_case に統一する修正を含む。
ソース: Google GenAI Python SDK Releases
エージェント期 Google DeepMind / Google 2026-05-07
Google google-genai SDK v2.0.0 リリース — Interactions API に破壊的変更
Google の Gemini API 用 Python SDK `google-genai` がメジャーバージョン 2.0.0 へ。破壊的変更は Interactions(対話セッション API)のみに限定されており、`generate_content` の通常呼び出しには影響しないと公式に明記されている。詳細は Google の 「interactions breaking changes may 2026」ガイドが整理されている。Interactions の steps を扱うインターフェースが整理された点が中心。v1.75 で入った Multimodal File Search や v1.74 の FileCitation メタデータと合わせて、Gemini の対話・RAG 系 API が SDK 上で大きく再編されている時期にあたる。
ソース: Google GenAI Python SDK Releases
エージェント期 Google DeepMind / Google 2026-05-04
Google google-genai SDK v1.75.0 — Multimodal File Search 追加
Google `google-genai` Python SDK v1.75.0 は Multimodal File Search を新規追加した機能リリース。テキストだけでなく画像や音声を含むファイル群を対象に意味検索が行える。あわせて async mTLS パスでトークンが古いまま使われる不具合の修正も入っている。Gemini の RAG / マルチモーダル検索を SDK 経由で組み立てる主要パスが揃った形。
ソース: Google GenAI Python SDK Releases
エージェント期 Google DeepMind / Google 2026-05-04
google-genai (python) v1.73.0 リリース(v2 系移行前の最終マイナー)
Google GenAI Python SDK v1.73.0 が 2026-04-13 にリリースされた。v2.0 系移行前の最終的なマイナーリリースで、後続の v2.0.0 で破壊的変更を伴う major 移行が控えていることが明示されている。
ソース: Google GenAI Python SDK Releases
エージェント期 Google DeepMind / Google 2026-04-29
Google google-genai SDK v1.74.0 — Interactions の FileCitation メタデータ拡張、BatchJob 出力情報
Google `google-genai` Python SDK v1.74.0 は Interactions(対話セッション)の FileCitation に custom_metadata / media_id / page_number を追加した。ドキュメント引用時にページ番号や独自メタデータを保持できるため、RAG / 引用付き回答の品質が上がる。BatchJob には output_info が追加され、バッチ処理の出力先・形式を取得しやすくなった。
ソース: Google GenAI Python SDK Releases
マルチモーダル期 Google DeepMind / Google 2023-12-06
Google DeepMind が Gemini 1 (Ultra / Pro / Nano の 3 サイズ) を発表。テキスト・画像・音声・動画をネイティブに扱う初の主力マルチモーダルモデルと喧伝。MMLU で GPT-4 超えを主張したが、デモ動画の演出が物議も。
ソース: Gemini (language model)
RLHF / アラインメント期 Google DeepMind / Google 2022-04-05
Google が Pathways システム上で学習した 540B パラメータの Pathways Language Model (PaLM) を発表。多くの NLP ベンチマークで人間並み、Chain-of-Thought プロンプティングでの推論能力が注目された。
ソース: PaLM
Transformer 期 Google DeepMind / Google 2018-10-11
Devlin ら(Google AI Language)が BERT を発表。Masked Language Model + Next Sentence Prediction による双方向事前学習で GLUE / SQuAD などの NLU ベンチマークを軒並み更新。
ソース: BERT (language model)
Transformer 期 Google DeepMind / Google学術機関(大学・研究機関) 2017-06-12
Vaswani ら(Google Brain / Google Research)による Transformer アーキテクチャ提唱論文。Self-Attention のみで RNN/CNN を不要に。NeurIPS 2017 採択。
ソース: Transformer (deep learning architecture)
Transformer 以前 Google DeepMind / Google 2016-03-09
DeepMind の AlphaGo がトップ棋士 Lee Sedol を 4-1 で破る歴史的勝利(韓国・ソウル)。Monte Carlo Tree Search + 深層学習 + 強化学習の組み合わせで、難題と考えられていた囲碁を制覇し AI 一般の注目度を一気に高めた。
ソース: AlphaGo versus Lee Sedol
Transformer 以前 Google DeepMind / Google学術機関(大学・研究機関) 2014-09-10
Sutskever・Vinyals・Le(Google)による Sequence to Sequence Learning。LSTM ベースのエンコーダ・デコーダ構造で機械翻訳の SOTA を更新し、後の Attention / Transformer への道筋を作った。
ソース: Seq2seq
Transformer 以前 Google DeepMind / Google学術機関(大学・研究機関) 2013-09-17
Mikolov らが Google で開発した word2vec が公開され、ニューラル単語埋め込みが現代 NLP の基礎になった。CBOW と Skip-gram の2モデルを提案。
ソース: Word2vec