Running Codex safely at OpenAI
How OpenAI runs Codex securely with sandboxing, approvals, network policies, and agent-native telemetry to support safe and compliant coding agent adoption.
ソース: OpenAI Blog
2017年の Transformer 提唱から現在までの主要なリリース・出来事を、時期 × ベンダー × プロダクト × トピック × モダリティの5軸で分類しています。 日次/週次で更新。
How OpenAI runs Codex securely with sandboxing, approvals, network policies, and agent-native telemetry to support safe and compliant coding agent adoption.
ソース: OpenAI Blog
Google google-genai SDK v2.0.0 リリース — Interactions API に破壊的変更
Google の Gemini API 用 Python SDK `google-genai` がメジャーバージョン 2.0.0 へ。破壊的変更は Interactions(対話セッション API)のみに限定されており、`generate_content` の通常呼び出しには影響しないと公式に明記されている。詳細は Google の 「interactions breaking changes may 2026」ガイドが整理されている。Interactions の steps を扱うインターフェースが整理された点が中心。v1.75 で入った Multimodal File Search や v1.74 の FileCitation メタデータと合わせて、Gemini の対話・RAG 系 API が SDK 上で大きく再編されている時期にあたる。
OpenAI Python SDK v2.36.0 — Realtime v2 対応
OpenAI 公式 Python SDK v2.36.0 は Realtime API の第 2 世代(realtime 2)に対応した。従来 v1 で提供されていた音声・テキストの双方向ストリーミング API が刷新された世代にアップグレードされ、SDK 側もそのインターフェースを公開する。実時間で音声入出力を扱う Voice Agent 構築の主要パスとして、OpenAI 側の更新とSDK 側の追従が短期間で揃った形になる。
Mistral Python SDK v2.4.5 — Workflows ストリーミング API に破壊的変更
Mistral 公式 Python クライアント v2.4.5 は Workflows API のストリーミング系に破壊的変更が入った。`workflows.executions.stream()` および `workflows.events.get_stream_events()` の レスポンス構造が変更され、CustomTaskInProgressResponse などのユニオン型の取り扱いが整理された。v2.4 系では毎週のように Speakeasy 経由でストリーミング・対話・RAG 系 API の構造変更が続いており、本リリースはその継続。Workflows API を使っているクライアントは更新が必須。
OpenAI Python SDK v2.35.0 — Image API 第 2 世代対応
OpenAI 公式 Python SDK v2.35.0 は Image API の更新(image 2)に対応した。画像生成エンドポイントのインターフェースが刷新され、SDK もそれを反映している。前後の v2.34 / v2.36 と合わせて、Image / Admin API / Realtime と複数の API 系統が短期間で第 2 世代へ更新されている時期にあたる。
Anthropic SDK for Python v0.100.0 リリース — Managed Agents の multiagents / outcomes / webhooks 対応
Anthropic 公式 Python SDK の v0.100.0 が公開された。最大の追加は Managed Agents の multiagents / outcomes / webhooks / vault validation をAPI レベルでサポートしたこと。複数エージェントの協調実行と、その結果(outcomes)の受け取り、webhook 経由での非同期イベント通知、Vault による設定検証を一体で扱える。従来の単発リクエスト型から、長時間動作する agent 群の制御に重点を置いた構成になっている。わずか 2 日間で v0.98 → v0.99 → v0.100 と立て続けにバージョンが上がっており、Managed Agents 周りの API 面が急速に固まっている時期にあたる。
Anthropic SDK for Python v0.99.0 — Workspace 指定の OIDC フェデレーショントークン交換
Anthropic 公式 Python SDK v0.99.0 は、OIDC フェデレーションでトークン交換する際に 対象 workspace を指定できるようにした機能追加リリース。複数 workspace を扱う組織で、AWS / GCP 等の外部 ID プロバイダから取得した OIDC トークンを特定の Anthropic workspace に紐付けて交換できるため、ワークスペース粒度の権限境界が活かしやすくなる。前日リリースの v0.98 で導入された Workload Identity Federation の延長線上にあり、企業利用向けの認証経路が継続的に強化されている。
Google google-genai SDK v1.75.0 — Multimodal File Search 追加
Google `google-genai` Python SDK v1.75.0 は Multimodal File Search を新規追加した機能リリース。テキストだけでなく画像や音声を含むファイル群を対象に意味検索が行える。あわせて async mTLS パスでトークンが古いまま使われる不具合の修正も入っている。Gemini の RAG / マルチモーダル検索を SDK 経由で組み立てる主要パスが揃った形。
OpenAI Python SDK v2.34.0 — Admin API キーのエンドポイント単位設定、external_key_id 追加
OpenAI 公式 Python SDK v2.34.0 は管理者向け API が大きく拡張された。プロジェクトに external_key_id を付与できるようになり、外部 ID 管理システムとの 紐付けが容易になった。同時にユーザーには email / metadata パラメータが追加され、Admin API Keys をエンドポイント単位で発行できる仕組みも入った。細粒度の鍵スコープ管理が可能になり、エンタープライズ運用での権限分離が現実的に。
Anthropic SDK for Python v0.98.0 — Managed Agents API 改善・Workload Identity Federation・OAuth 対応
Anthropic 公式 Python SDK v0.98.0 は機能追加が複数まとまった重要リリース。Managed Agents 関連の API が改善され、Workload Identity Federation(AWS/GCP の IAM ロールからの 短期トークン交換)、対話型 OAuth ログイン、複数 auth profile の管理機構が一気に入った。これにより、開発者は API キーを直接埋め込まずに各クラウドの IAM ロールや個人 OAuth で認証できるようになる。Anthropic の認証経路がエンタープライズ向けに大きく拡張された節目のリリース。
Google google-genai SDK v1.74.0 — Interactions の FileCitation メタデータ拡張、BatchJob 出力情報
Google `google-genai` Python SDK v1.74.0 は Interactions(対話セッション)の FileCitation に custom_metadata / media_id / page_number を追加した。ドキュメント引用時にページ番号や独自メタデータを保持できるため、RAG / 引用付き回答の品質が上がる。BatchJob には output_info が追加され、バッチ処理の出力先・形式を取得しやすくなった。
OpenAI Python SDK v2.33.0 — API 一般更新と prompt_cache_retention の enum 値修正
OpenAI 公式 Python SDK v2.33.0 は通常の API 同期更新リリース。破壊的ではないが注目点として、prompt_cache_retention の enum 値が `in-memory` から `in_memory`(アンダースコア区切り)に修正された。それまで `in-memory` を文字列指定していたコードはエラーになるため、プロンプトキャッシュの保持戦略を明示的に指定している場合は更新が必要。
Mistral Python SDK v2.4.3 — RAG 取り込みパイプライン設定の登録 API を追加、OCR から request.id 削除
Mistral 公式 Python クライアント v2.4.3 は RAG 系に注目すべき追加がある。`mistral.beta.rag.ingestion_pipeline_configurations.register()` が新設され、RAG への文書取り込みパイプラインを設定として登録できるようになった。破壊的変更として `mistral.ocr.process()` から request.id が削除されており、OCR を呼び出しているクライアントは更新が必要。
DeepSeek が o1 級の推論能力を持つ R1 をオープンウェイトで公開。学習コストが既存 GPT-4 級の数十分の1という主張で世界に衝撃。
ソース: DeepSeek
Anthropic が Claude 3.5 Sonnet にデスクトップ操作能力を付加した Computer Use をベータ公開。エージェントが画面を見てクリック・入力する世界の幕開け。
推論時間を伸ばすことで難問の正答率を大幅に伸ばす o1-preview が公開。AIME で74%(GPT-4o は12%)。新ジャンルとしての推論モデルが定義された。
ソース: OpenAI o1
テキスト・画像・音声をネイティブに統合した GPT-4o が公開。音声応答が実時間に近づき、価格は GPT-4 Turbo の半額に。
ソース: GPT-4o
InstructGPT の RLHF をベースにしたチャットインターフェース ChatGPT が公開。1週間で100万ユーザー、2ヶ月で1億ユーザーを獲得し、生成AIの一般普及の起点に。
ソース: ChatGPT
175B パラメータの GPT-3 が API ベータとして公開。few-shot in-context learning の能力が実証され、API ベースの商用 LLM 利用が幕を開けた。
ソース: GPT-3
Vaswani ら(Google Brain / Google Research)による Transformer アーキテクチャ提唱論文。Self-Attention のみで RNN/CNN を不要に。NeurIPS 2017 採択。
Mikolov らが Google で開発した word2vec が公開され、ニューラル単語埋め込みが現代 NLP の基礎になった。CBOW と Skip-gram の2モデルを提案。
ソース: Word2vec