SDK・CLI・周辺ツールの更新(エージェントフレームワーク自体の話は agentic-system を優先)

記事 30 件

エージェント期 AnthropicAmazon / AWS 2026-05-11

v0.101.0

Anthropic Python SDK v0.101.0 — AWS Bedrock 上の Claude Platform 用クライアントを追加

Anthropic は anthropic-sdk-python v0.101.0 を 2026-05-11 にリリースした。新機能として AWS 上の Claude Platform 向けの専用クライアント(`AWS client for Claude Platform on AWS`)が追加され、Bedrock 経由ではない直接的な AWS 統合パスが整備された。バグ修正としてファイル種別エラーメッセージの f-string プレフィックス漏れを修正。

ソース: Anthropic SDK (Python) Releases

エージェント期 AnthropicAmazon / AWS 2026-05-11

Claude Code にAWSのコスト調査をさせたら数千万円分の改善ポイントが見つかった

Claude Code に AWS コスト調査をさせて数千万円の改善点を発見

ジーニー社が Claude Code に AWS コストの調査をさせた結果、数千万円規模の改善ポイントを発見したケーススタディ。Claude Code が CloudWatch・Cost Explorer・タグ付け状況を横断的に分析し、未使用 EBS volume、過剰プロビジョンされた RDS、リザーブドインスタンス未活用などを抽出。AI エージェントによるクラウドコスト最適化の具体事例として有用。

ソース: Zenn (ai)

エージェント期 その他 2026-05-10

LLM に日本の法令・法規を正しく引かせるために、日本の法規 MCP ファミリーを作った話

日本の法令・法規 MCP サーバーファミリーを作って LLM に正しく引用させる

日本の法令・法規を LLM に正しく引用させるための MCP サーバーファミリーを開発した報告。e-Gov 法令検索 API を MCP として包んで、Claude や ChatGPT 等が正確な条文と最新の改正状況を引いて回答できるようにする。LLM の hallucination 抑制 + 日本のリーガルテックでの実用化に向けた一歩。

ソース: Zenn (llm)

エージェント期 その他 2026-05-10

書籍のOCRにLLMを組み合わせることで精度を上げるだけでなく文書構造や図も表現した記録

書籍 OCR に LLM を組み合わせ、精度向上 + 文書構造・図表現も保持

書籍の OCR に LLM を組み合わせることで、単なる文字認識精度を上げるだけでなく、文書構造(章・節・段落)や図表の構造も保持する処理パイプラインを構築した記録。OCR 結果を LLM で後処理することで誤読を修正しつつ、見出し階層・図キャプション・表構造を Markdown / JSON で表現できる。古書のデジタル化や RAG 用ソース整備に有用。

ソース: Zenn (llm)

エージェント期 Google DeepMind / Google 2026-05-09

v2.0.1

google-genai (python) v2.0.1 — response_format フィールド名を snake_case に修正

Google GenAI Python SDK v2.0.1(2026-05-09 リリース)はバグ修正パッチ。`response_format` のフィールド名を snake_case に統一する修正を含む。

ソース: Google GenAI Python SDK Releases

エージェント期 Anthropic 2026-05-08

Using Claude Code: The Unreasonable Effectiveness of HTML

Claude Code: HTML の不合理な有効性 — Markdown より HTML を出力させるべき理由

Anthropic Claude Code チームの Thariq Shihipar の記事を Simon Willison が紹介。Claude に出力させる形式として Markdown よりも HTML の方が有効な場面が多いと主張。PR レビューを HTML artifact として生成させる例、構造化された差分表示、ハイパーリンク・インラインスタイルを使った視覚的な情報設計など、実装と表現を一体化させる出力としての HTML の優位性を示すプロンプト例が満載。

ソース: Simon Willison's Weblog

エージェント期 Google DeepMind / Google 2026-05-07

v2.0.0

Google google-genai SDK v2.0.0 リリース — Interactions API に破壊的変更

Google の Gemini API 用 Python SDK `google-genai` がメジャーバージョン 2.0.0 へ。破壊的変更は Interactions(対話セッション API)のみに限定されており、`generate_content` の通常呼び出しには影響しないと公式に明記されている。詳細は Google の 「interactions breaking changes may 2026」ガイドが整理されている。Interactions の steps を扱うインターフェースが整理された点が中心。v1.75 で入った Multimodal File Search や v1.74 の FileCitation メタデータと合わせて、Gemini の対話・RAG 系 API が SDK 上で大きく再編されている時期にあたる。

ソース: Google GenAI Python SDK Releases

エージェント期 OpenAI 2026-05-07

v2.36.0

OpenAI Python SDK v2.36.0 — Realtime v2 対応

OpenAI 公式 Python SDK v2.36.0 は Realtime API の第 2 世代(realtime 2)に対応した。従来 v1 で提供されていた音声・テキストの双方向ストリーミング API が刷新された世代にアップグレードされ、SDK 側もそのインターフェースを公開する。実時間で音声入出力を扱う Voice Agent 構築の主要パスとして、OpenAI 側の更新とSDK 側の追従が短期間で揃った形になる。

ソース: OpenAI Python SDK Releases

エージェント期 Mistral AI 2026-05-07

python - v2.4.5 - 2026-05-07 11:45:47

Mistral Python SDK v2.4.5 — Workflows ストリーミング API に破壊的変更

Mistral 公式 Python クライアント v2.4.5 は Workflows API のストリーミング系に破壊的変更が入った。`workflows.executions.stream()` および `workflows.events.get_stream_events()` の レスポンス構造が変更され、CustomTaskInProgressResponse などのユニオン型の取り扱いが整理された。v2.4 系では毎週のように Speakeasy 経由でストリーミング・対話・RAG 系 API の構造変更が続いており、本リリースはその継続。Workflows API を使っているクライアントは更新が必須。

ソース: Mistral AI Python Client Releases

エージェント期 OpenAI 2026-05-06

v2.35.1

openai-python v2.35.1 — 画像生成 size enum のリグレッション修正

OpenAI Python SDK v2.35.1(2026-05-06 リリース)はバグ修正のみのパッチ。直前バージョンで起きていた `image generation の size` enum のリグレッションを修正した。

ソース: OpenAI Python SDK Releases

エージェント期 OpenAI 2026-05-06

v2.35.0

OpenAI Python SDK v2.35.0 — Image API 第 2 世代対応

OpenAI 公式 Python SDK v2.35.0 は Image API の更新(image 2)に対応した。画像生成エンドポイントのインターフェースが刷新され、SDK もそれを反映している。前後の v2.34 / v2.36 と合わせて、Image / Admin API / Realtime と複数の API 系統が短期間で第 2 世代へ更新されている時期にあたる。

ソース: OpenAI Python SDK Releases

エージェント期 Anthropic 2026-05-06

v0.100.0

Anthropic SDK for Python v0.100.0 リリース — Managed Agents の multiagents / outcomes / webhooks 対応

Anthropic 公式 Python SDK の v0.100.0 が公開された。最大の追加は Managed Agents の multiagents / outcomes / webhooks / vault validation をAPI レベルでサポートしたこと。複数エージェントの協調実行と、その結果(outcomes)の受け取り、webhook 経由での非同期イベント通知、Vault による設定検証を一体で扱える。従来の単発リクエスト型から、長時間動作する agent 群の制御に重点を置いた構成になっている。わずか 2 日間で v0.98 → v0.99 → v0.100 と立て続けにバージョンが上がっており、Managed Agents 周りの API 面が急速に固まっている時期にあたる。

ソース: Anthropic SDK (Python) Releases

エージェント期 Anthropic 2026-05-05

v0.99.0

Anthropic SDK for Python v0.99.0 — Workspace 指定の OIDC フェデレーショントークン交換

Anthropic 公式 Python SDK v0.99.0 は、OIDC フェデレーションでトークン交換する際に 対象 workspace を指定できるようにした機能追加リリース。複数 workspace を扱う組織で、AWS / GCP 等の外部 ID プロバイダから取得した OIDC トークンを特定の Anthropic workspace に紐付けて交換できるため、ワークスペース粒度の権限境界が活かしやすくなる。前日リリースの v0.98 で導入された Workload Identity Federation の延長線上にあり、企業利用向けの認証経路が継続的に強化されている。

ソース: Anthropic SDK (Python) Releases

エージェント期 Google DeepMind / Google 2026-05-04

v1.75.0

Google google-genai SDK v1.75.0 — Multimodal File Search 追加

Google `google-genai` Python SDK v1.75.0 は Multimodal File Search を新規追加した機能リリース。テキストだけでなく画像や音声を含むファイル群を対象に意味検索が行える。あわせて async mTLS パスでトークンが古いまま使われる不具合の修正も入っている。Gemini の RAG / マルチモーダル検索を SDK 経由で組み立てる主要パスが揃った形。

ソース: Google GenAI Python SDK Releases

エージェント期 Google DeepMind / Google 2026-05-04

v1.73.0

google-genai (python) v1.73.0 リリース(v2 系移行前の最終マイナー)

Google GenAI Python SDK v1.73.0 が 2026-04-13 にリリースされた。v2.0 系移行前の最終的なマイナーリリースで、後続の v2.0.0 で破壊的変更を伴う major 移行が控えていることが明示されている。

ソース: Google GenAI Python SDK Releases

エージェント期 OpenAI 2026-05-04

v2.34.0

OpenAI Python SDK v2.34.0 — Admin API キーのエンドポイント単位設定、external_key_id 追加

OpenAI 公式 Python SDK v2.34.0 は管理者向け API が大きく拡張された。プロジェクトに external_key_id を付与できるようになり、外部 ID 管理システムとの 紐付けが容易になった。同時にユーザーには email / metadata パラメータが追加され、Admin API Keys をエンドポイント単位で発行できる仕組みも入った。細粒度の鍵スコープ管理が可能になり、エンタープライズ運用での権限分離が現実的に。

ソース: OpenAI Python SDK Releases

エージェント期 Anthropic 2026-05-04

v0.98.0

Anthropic SDK for Python v0.98.0 — Managed Agents API 改善・Workload Identity Federation・OAuth 対応

Anthropic 公式 Python SDK v0.98.0 は機能追加が複数まとまった重要リリース。Managed Agents 関連の API が改善され、Workload Identity Federation(AWS/GCP の IAM ロールからの 短期トークン交換)、対話型 OAuth ログイン、複数 auth profile の管理機構が一気に入った。これにより、開発者は API キーを直接埋め込まずに各クラウドの IAM ロールや個人 OAuth で認証できるようになる。Anthropic の認証経路がエンタープライズ向けに大きく拡張された節目のリリース。

ソース: Anthropic SDK (Python) Releases

エージェント期 Mistral AI 2026-04-30

python - v2.4.4 - 2026-04-30 12:05:40

mistralai (python) v2.4.4 — libraries の name フィールドが破壊的変更

Mistral AI の Python クライアント v2.4.4(2026-04-30 リリース)は Speakeasy CLI で生成された SDK アップデート。`mistral.beta.libraries.update()` および `mistral.beta.libraries.documents.update()` の `request.name` に破壊的変更が入った。

ソース: Mistral AI Python Client Releases

エージェント期 Google DeepMind / Google 2026-04-29

v1.74.0

Google google-genai SDK v1.74.0 — Interactions の FileCitation メタデータ拡張、BatchJob 出力情報

Google `google-genai` Python SDK v1.74.0 は Interactions(対話セッション)の FileCitation に custom_metadata / media_id / page_number を追加した。ドキュメント引用時にページ番号や独自メタデータを保持できるため、RAG / 引用付き回答の品質が上がる。BatchJob には output_info が追加され、バッチ処理の出力先・形式を取得しやすくなった。

ソース: Google GenAI Python SDK Releases

エージェント期 xAI 2026-04-29

Grok Speech to Text and Text to Speech APIs

Grok の STT / TTS API を公開

xAI は Grok の音声認識 (Speech-to-Text) と音声合成 (Text-to-Speech) を独立した API として公開した。Grok 全体ではなく、音声系のコンポーネントだけを単独で組み込みたい開発者向けの構成。OpenAI Whisper / TTS、ElevenLabs と直接競合するポジションに踏み込む。

ソース: xAI News

エージェント期 OpenAI 2026-04-28

v2.33.0

OpenAI Python SDK v2.33.0 — API 一般更新と prompt_cache_retention の enum 値修正

OpenAI 公式 Python SDK v2.33.0 は通常の API 同期更新リリース。破壊的ではないが注目点として、prompt_cache_retention の enum 値が `in-memory` から `in_memory`(アンダースコア区切り)に修正された。それまで `in-memory` を文字列指定していたコードはエラーになるため、プロンプトキャッシュの保持戦略を明示的に指定している場合は更新が必要。

ソース: OpenAI Python SDK Releases

マルチモーダル期 xAI 2026-04-28

Grok Imagine API

Grok Imagine API を一般公開

xAI は画像生成モデル Grok Imagine を API として一般公開した。テキストから画像を生成する基本機能に加え、編集・参照画像入力などをプログラマブルに扱える。DALL·E / Midjourney / Stable Diffusion 系と並ぶ画像生成 API 市場への本格参入。

ソース: xAI News

エージェント期 Mistral AI 2026-04-27

python - v2.4.3 - 2026-04-27 12:54:54

Mistral Python SDK v2.4.3 — RAG 取り込みパイプライン設定の登録 API を追加、OCR から request.id 削除

Mistral 公式 Python クライアント v2.4.3 は RAG 系に注目すべき追加がある。`mistral.beta.rag.ingestion_pipeline_configurations.register()` が新設され、RAG への文書取り込みパイプラインを設定として登録できるようになった。破壊的変更として `mistral.ocr.process()` から request.id が削除されており、OCR を呼び出しているクライアントは更新が必要。

ソース: Mistral AI Python Client Releases

エージェント期 Mistral AI 2026-04-23

python - v2.4.2 - 2026-04-23 15:10:04

mistralai (python) v2.4.2 — observability の chat_completion_events に union 型追加

Mistral AI Python クライアント v2.4.2(2026-04-23 リリース)は observability 関連 API の更新。`mistral.beta.observability.chat_completion_events.search()` の response に extra_fields の union 型が追加され、検索結果の拡張情報をより柔軟に扱えるようになった(破壊的変更)。

ソース: Mistral AI Python Client Releases

エージェント期 Mistral AI 2026-04-21

python - v2.4.1 - 2026-04-21 13:44:04

mistralai (python) v2.4.1 — conversations.restart_stream に think chunk 対応

Mistral AI Python クライアント v2.4.1(2026-04-21 リリース)は conversation 関連 API の更新。`mistral.beta.conversations.restart_stream()` の request に破壊的変更、output delta に ThinkChunk と signature が追加された。Mistral のモデルが extended thinking を返す際のストリーミング処理を扱える。

ソース: Mistral AI Python Client Releases

エージェント期 xAI 2026-04-18

Grok Collections API

Grok Collections API — ドキュメント集合体の管理

xAI は Grok Collections API を公開。複数ドキュメントを Collection としてグループ化し、メタデータ・タグ・参照スコープをまとめて管理できる。RAG / 知識ベース用途でドキュメントセットを Grok に与える際の API 表面を整理する。OpenAI Vector Stores・Claude Files API と類似の構造。

ソース: xAI News

エージェント期 Mistral AI 2026-04-16

python - v2.4.0 - 2026-04-16 12:02:46

mistralai (python) v2.4.0 — Speakeasy CLI 1.761 生成の新メジャー

Mistral AI Python クライアント v2.4.0(2026-04-16 リリース)は Speakeasy CLI 1.761.1 で生成された SDK の新マイナーバージョン。OpenAPI Doc 1.0.0 ベース。続く v2.4.1〜v2.4.4 で破壊的変更が含まれていく前の起点。

ソース: Mistral AI Python Client Releases

エージェント期 xAI 2026-04-14

Grok Voice Agent API

Grok Voice Agent API を公開

xAI は会話型音声エージェント構築のための Grok Voice Agent API を公開した。音声入力受信 → 処理 → 音声出力までを一体で扱う API で、電話応答 / カスタマーサポート / 音声アシスタント等の用途を想定。OpenAI Realtime API・Cartesia・Vapi 等と直接競合するレイヤー。

ソース: xAI News

推論モデル期 Anthropic 2024-10-22

Claude Computer Use (ベータ)公開

Anthropic が Claude 3.5 Sonnet にデスクトップ操作能力を付加した Computer Use をベータ公開。エージェントが画面を見てクリック・入力する世界の幕開け。

ソース: Claude (language model)

マルチモーダル期 OpenAI 2023-11-06

OpenAI DevDay — GPT-4 Turbo / Custom GPTs / Assistants API 発表

OpenAI 初の開発者カンファレンスで GPT-4 Turbo (128K context / 価格半減)、Custom GPTs (GPT Store)、Assistants API (Code Interpreter / Retrieval / Function calling 統合) を一挙発表。LLM プラットフォーム化が決定的に進んだ瞬間。

ソース: OpenAI DevDay