エージェント・自律システム・tool use・computer use(SDK 単体の更新は tooling-sdk、推論能力の飛躍は reasoning-breakthrough)
記事 11 件
エージェント期 その他 2026-05-11
LLM エージェントのメモリ機構サーベイ — ストレージから経験へ
LLM エージェントのメモリ機構の進化を体系的にサーベイした論文。単なる『ストレージ』としてのメモリから、行動履歴を抽象化して『経験 (experience)』として活用するメカニズムへの移行を整理。short-term / long-term / episodic / semantic 等の階層、retrieval 戦略、自己反省・要約による圧縮、外部 store との統合などを網羅。Anthropic / OpenAI / Google の各エージェント実装の理論的整理に有用。
ソース: arXiv cs.AI
エージェント期 その他 2026-05-11
コンピュータ使用エージェントのセキュリティ — Architecture-Lifecycle 統合フレームワーク
コンピュータを操作するエージェント(computer-use agent)の信頼性向上を狙ったArchitecture-Lifecycle 統合フレームワーク。設計・運用・廃止までのライフサイクルを通して、権限管理・実行隔離・ログ・人間監督の各レイヤを統合的に扱う。Claude Computer Use・Anthropic Operator・OpenAI Operator の本番展開で問題になるセキュリティ設計に対する学術的フレームワーク提案。
ソース: arXiv cs.CL
エージェント期 その他 2026-05-11
Figma 上の AI エージェントがデザインを作成・編集可能に — 意図しない UI 生成を防ぐ仕組み
Figma が AI エージェント機能を導入し、デザインを作成・編集できるようにした。意図しない UI が生成されることを防ぐため、デザインシステム・コンポーネントライブラリの制約をエージェントに渡す仕組みを採用。デザインツールにエージェントを組み込む際の実装パターンとして参考になる。
ソース: ITmedia AI+
エージェント期 Mistral AI 2026-05-08
Mistral Medium 3.5 発表 — Vibe にリモートコーディングエージェントを統合
Mistral は新モデル「Mistral Medium 3.5」を発表し、同社のコーディング環境 Vibe でリモートコーディングエージェントを利用できるようにした。Medium 3.5 を駆動エンジンとし、Vibe からクラウド側でエージェントがリポジトリへの長時間タスク(マルチファイル変更・テスト・PR 作成)を実行する。Anthropic Claude Code・OpenAI Codex に対抗するエージェント型 IDE 戦略の一環。
ソース: Mistral News
エージェント期 xAI 2026-05-07
Grok Connectors — Web / iOS / Android で外部サービス連携
xAI は Grok に Connectors 機能を追加し、Web・iOS・Android で外部サービスとネイティブに連携できるようにした。Google Drive・Gmail・GitHub などのサービスをGrok から直接参照・操作でき、エージェント的なワークフロー実行を強化する。ChatGPT Connectors・Claude の MCP / connectors に対抗する展開。
ソース: xAI News
エージェント期 Anthropic 2026-05-06
Anthropic SDK for Python v0.100.0 リリース — Managed Agents の multiagents / outcomes / webhooks 対応
Anthropic 公式 Python SDK の v0.100.0 が公開された。最大の追加は Managed Agents の multiagents / outcomes / webhooks / vault validation をAPI レベルでサポートしたこと。複数エージェントの協調実行と、その結果(outcomes)の受け取り、webhook 経由での非同期イベント通知、Vault による設定検証を一体で扱える。従来の単発リクエスト型から、長時間動作する agent 群の制御に重点を置いた構成になっている。わずか 2 日間で v0.98 → v0.99 → v0.100 と立て続けにバージョンが上がっており、Managed Agents 周りの API 面が急速に固まっている時期にあたる。
ソース: Anthropic SDK (Python) Releases
エージェント期 Anthropic 2026-05-05
Anthropic、金融サービス向けエージェントを発表
Anthropic が金融サービス業界向けの専用エージェント群を発表。Claude を基盤に、リサーチ・コンプライアンス・ポートフォリオ分析・顧客対応など金融業務に特化したワークフローを提供する。規制要件・データセキュリティ・監査可能性を組み込んだエンタープライズ向け垂直統合の一例。
ソース: Anthropic News
エージェント期 Anthropic 2026-05-04
Anthropic SDK for Python v0.98.0 — Managed Agents API 改善・Workload Identity Federation・OAuth 対応
Anthropic 公式 Python SDK v0.98.0 は機能追加が複数まとまった重要リリース。Managed Agents 関連の API が改善され、Workload Identity Federation(AWS/GCP の IAM ロールからの 短期トークン交換)、対話型 OAuth ログイン、複数 auth profile の管理機構が一気に入った。これにより、開発者は API キーを直接埋め込まずに各クラウドの IAM ロールや個人 OAuth で認証できるようになる。Anthropic の認証経路がエンタープライズ向けに大きく拡張された節目のリリース。
ソース: Anthropic SDK (Python) Releases
エージェント期 xAI 2026-04-14
Grok Voice Agent API を公開
xAI は会話型音声エージェント構築のための Grok Voice Agent API を公開した。音声入力受信 → 処理 → 音声出力までを一体で扱う API で、電話応答 / カスタマーサポート / 音声アシスタント等の用途を想定。OpenAI Realtime API・Cartesia・Vapi 等と直接競合するレイヤー。
ソース: xAI News
エージェント期 xAI 2026-04-10
Grok 4.1 Fast と Agent Tools API — 推論速度と汎用エージェント能力を強化
xAI は Grok 4.1 ベースの高速版 Grok 4.1 Fast を公開し、同時に Agent Tools API を公開した。Fast は推論速度を優先しつつ Grok 4.1 の主要能力を維持。Agent Tools API はWeb 検索・コードインタープリタ・ファイル読み書き等の標準ツールを一体で提供し、汎用エージェントを組み立てる際の摩擦を減らす設計。
ソース: xAI News
推論モデル期 Anthropic 2024-10-22
Anthropic が Claude 3.5 Sonnet にデスクトップ操作能力を付加した Computer Use をベータ公開。エージェントが画面を見てクリック・入力する世界の幕開け。
ソース: Claude (language model)