エージェント・自律システム・tool use・computer use(SDK 単体の更新は tooling-sdk、推論能力の飛躍は reasoning-breakthrough)

記事 11 件

エージェント期 その他 2026-05-11

From Storage to Experience: A Survey on the Evolution of LLM Agent Memory Mechanisms

LLM エージェントのメモリ機構サーベイ — ストレージから経験へ

LLM エージェントのメモリ機構の進化を体系的にサーベイした論文。単なる『ストレージ』としてのメモリから、行動履歴を抽象化して『経験 (experience)』として活用するメカニズムへの移行を整理。short-term / long-term / episodic / semantic 等の階層、retrieval 戦略、自己反省・要約による圧縮、外部 store との統合などを網羅。Anthropic / OpenAI / Google の各エージェント実装の理論的整理に有用。

ソース: arXiv cs.AI

エージェント期 その他 2026-05-11

Securing Computer-Use Agents: A Unified Architecture-Lifecycle Framework for Deployment-Grounded Reliability

コンピュータ使用エージェントのセキュリティ — Architecture-Lifecycle 統合フレームワーク

コンピュータを操作するエージェント(computer-use agent)の信頼性向上を狙ったArchitecture-Lifecycle 統合フレームワーク。設計・運用・廃止までのライフサイクルを通して、権限管理・実行隔離・ログ・人間監督の各レイヤを統合的に扱う。Claude Computer Use・Anthropic Operator・OpenAI Operator の本番展開で問題になるセキュリティ設計に対する学術的フレームワーク提案。

ソース: arXiv cs.CL

エージェント期 その他 2026-05-11

AIエージェントが「Figma」でデザインを作成・編集可能に “意図しないUI生成”を防ぐ仕組みとは

Figma 上の AI エージェントがデザインを作成・編集可能に — 意図しない UI 生成を防ぐ仕組み

Figma が AI エージェント機能を導入し、デザインを作成・編集できるようにした。意図しない UI が生成されることを防ぐため、デザインシステム・コンポーネントライブラリの制約をエージェントに渡す仕組みを採用。デザインツールにエージェントを組み込む際の実装パターンとして参考になる。

ソース: ITmedia AI+

エージェント期 Mistral AI 2026-05-08

Remote agents in Vibe. Powered by Mistral Medium 3.5. Product Introducing Mistral Medium 3.5, remote coding agents in Vibe, plus new Work mode in Le Chat for complex tasks. Apr 29, 2026 Mistral AI

Mistral Medium 3.5 発表 — Vibe にリモートコーディングエージェントを統合

Mistral は新モデル「Mistral Medium 3.5」を発表し、同社のコーディング環境 Vibe でリモートコーディングエージェントを利用できるようにした。Medium 3.5 を駆動エンジンとし、Vibe からクラウド側でエージェントがリポジトリへの長時間タスク(マルチファイル変更・テスト・PR 作成)を実行する。Anthropic Claude Code・OpenAI Codex に対抗するエージェント型 IDE 戦略の一環。

ソース: Mistral News

エージェント期 xAI 2026-05-07

Connectors in web, iOS, and Android

Grok Connectors — Web / iOS / Android で外部サービス連携

xAI は Grok に Connectors 機能を追加し、Web・iOS・Android で外部サービスとネイティブに連携できるようにした。Google Drive・Gmail・GitHub などのサービスをGrok から直接参照・操作でき、エージェント的なワークフロー実行を強化する。ChatGPT Connectors・Claude の MCP / connectors に対抗する展開。

ソース: xAI News

エージェント期 Anthropic 2026-05-06

v0.100.0

Anthropic SDK for Python v0.100.0 リリース — Managed Agents の multiagents / outcomes / webhooks 対応

Anthropic 公式 Python SDK の v0.100.0 が公開された。最大の追加は Managed Agents の multiagents / outcomes / webhooks / vault validation をAPI レベルでサポートしたこと。複数エージェントの協調実行と、その結果(outcomes)の受け取り、webhook 経由での非同期イベント通知、Vault による設定検証を一体で扱える。従来の単発リクエスト型から、長時間動作する agent 群の制御に重点を置いた構成になっている。わずか 2 日間で v0.98 → v0.99 → v0.100 と立て続けにバージョンが上がっており、Managed Agents 周りの API 面が急速に固まっている時期にあたる。

ソース: Anthropic SDK (Python) Releases

エージェント期 Anthropic 2026-05-05

May 5, 2026 Announcements Agents for financial services

Anthropic、金融サービス向けエージェントを発表

Anthropic が金融サービス業界向けの専用エージェント群を発表。Claude を基盤に、リサーチ・コンプライアンス・ポートフォリオ分析・顧客対応など金融業務に特化したワークフローを提供する。規制要件・データセキュリティ・監査可能性を組み込んだエンタープライズ向け垂直統合の一例。

ソース: Anthropic News

エージェント期 Anthropic 2026-05-04

v0.98.0

Anthropic SDK for Python v0.98.0 — Managed Agents API 改善・Workload Identity Federation・OAuth 対応

Anthropic 公式 Python SDK v0.98.0 は機能追加が複数まとまった重要リリース。Managed Agents 関連の API が改善され、Workload Identity Federation(AWS/GCP の IAM ロールからの 短期トークン交換)、対話型 OAuth ログイン、複数 auth profile の管理機構が一気に入った。これにより、開発者は API キーを直接埋め込まずに各クラウドの IAM ロールや個人 OAuth で認証できるようになる。Anthropic の認証経路がエンタープライズ向けに大きく拡張された節目のリリース。

ソース: Anthropic SDK (Python) Releases

エージェント期 xAI 2026-04-14

Grok Voice Agent API

Grok Voice Agent API を公開

xAI は会話型音声エージェント構築のための Grok Voice Agent API を公開した。音声入力受信 → 処理 → 音声出力までを一体で扱う API で、電話応答 / カスタマーサポート / 音声アシスタント等の用途を想定。OpenAI Realtime API・Cartesia・Vapi 等と直接競合するレイヤー。

ソース: xAI News

エージェント期 xAI 2026-04-10

Grok 4.1 Fast and Agent Tools API

Grok 4.1 Fast と Agent Tools API — 推論速度と汎用エージェント能力を強化

xAI は Grok 4.1 ベースの高速版 Grok 4.1 Fast を公開し、同時に Agent Tools API を公開した。Fast は推論速度を優先しつつ Grok 4.1 の主要能力を維持。Agent Tools API はWeb 検索・コードインタープリタ・ファイル読み書き等の標準ツールを一体で提供し、汎用エージェントを組み立てる際の摩擦を減らす設計。

ソース: xAI News

推論モデル期 Anthropic 2024-10-22

Claude Computer Use (ベータ)公開

Anthropic が Claude 3.5 Sonnet にデスクトップ操作能力を付加した Computer Use をベータ公開。エージェントが画面を見てクリック・入力する世界の幕開け。

ソース: Claude (language model)