2017年の Transformer 提唱から現在までの主要なリリース・出来事を、時期 × ベンダー × プロダクト × トピック × モダリティの5軸で分類しています。
日次/週次で更新。
最新記事 (30 件)
エージェント期 OpenAI 2026-05-11
OpenAI Campus Network — 世界の学生クラブを繋ぐイニシアチブ
OpenAI は世界中の大学・高校の学生 AI クラブを繋ぐ Campus Network イニシアチブを発表した。参加した学生クラブは OpenAI のツールへのアクセス、イベント開催支援、ネットワーキング機会を受けられ、AI に関心のあるキャンパスコミュニティを育成する。AI 教育エコシステムの裾野を広げる取り組み。
ソース: OpenAI Blog
エージェント期 OpenAI 2026-05-11
OpenAI、エンタープライズが AI をスケールする方法を解説
OpenAI が企業向けに AI 導入のスケーリング方法をまとめたガイドを公開した。初期実験段階から、信頼性・ガバナンス・ワークフロー設計・品質管理に基づいた複利的なインパクト創出までのステップを整理。エンタープライズ AI 採用の成熟度モデルを示す内容となっている。
ソース: OpenAI Blog
エージェント期 その他 2026-05-11
LLMO 効果測定の最小実装 — SOV / SOM だけでは足りない 3 つの新指標
LLM 経由のサイト流入を最適化する LLMO(Large Language Model Optimization)の効果測定手法をまとめた記事。従来の SOV (Share of Voice) / SOM (Share of Mentions) だけでは LLMO 効果を捉えきれないと指摘し、①引用回数の質的評価、②引用範囲(文脈)、③ファクト解像度の 3 軸からなる新指標を提案。実装の最小コード例も含む実践的な記事。
ソース: Zenn (ai)
エージェント期 AnthropicAmazon / AWS 2026-05-11
Claude Code に AWS コスト調査をさせて数千万円の改善点を発見
ジーニー社が Claude Code に AWS コストの調査をさせた結果、数千万円規模の改善ポイントを発見したケーススタディ。Claude Code が CloudWatch・Cost Explorer・タグ付け状況を横断的に分析し、未使用 EBS volume、過剰プロビジョンされた RDS、リザーブドインスタンス未活用などを抽出。AI エージェントによるクラウドコスト最適化の具体事例として有用。
ソース: Zenn (ai)
エージェント期 その他 2026-05-11
33 モデル横断調査 — フロンティア LLM のドメイン別メタ認知能力アトラス
33 種類のフロンティア LLM を対象に、ドメイン別のメタ認知能力(自分の知識・無知の自覚)を包括的に評価した大規模スタディ。モデルが『自分が間違える可能性を正しく見積もれるか』を計測し、ドメイン・スケール・推論モード別の傾向を提示する。ハルシネーション抑制やエージェント実行時の自己検証戦略を設計する基礎データとして有用。
ソース: arXiv cs.CL
推論モデル期 その他 2026-05-11
Behavior Cue Reasoning — 監督可能な推論で安全性と効率を両立
推論を『観察可能 (monitorable)』にする手法 Behavior Cue Reasoning を提案。推論ステップに振る舞いの cue (兆候・動機) を添えることで、人間や検査システムが推論プロセスを監督しやすくなる。同時に、不要な冗長思考を抑えるため効率も向上。alignment / safety と推論効率を同時に改善する手法として実用性が高い findings。
ソース: arXiv cs.AI
エージェント期 その他 2026-05-11
Entropy-Gated Continuous Bitstream Diffusion — 自己回帰モデルとのギャップを縮める拡散モデル
言語モデリングにおける自己回帰モデルとのギャップを縮める Entropy-Gated Continuous Bitstream Diffusionという新アーキテクチャを提案。連続ビットストリーム空間で拡散プロセスを動かしつつ、エントロピーで生成タイミングをゲートする設計により、長らく自己回帰モデルが優勢だった言語生成領域で拡散モデルが競争力を取り戻す可能性を示す。
ソース: arXiv cs.CL
推論モデル期 その他 2026-05-11
LLM の推論トレースから探索木を抽出 — 計画が近視眼的であることを示す
LLM の chain-of-thought 推論トレースから内部の探索木 (search tree) を抽出する手法を提案し、それを用いて『LLM の計画は近視眼的 (myopic)』であることを実証した論文。短期報酬を最大化する手は得意でも、長期的に得な探索を選ぶことが少ない。reasoning モデル・agent の長期計画の限界を可視化する findings。
ソース: arXiv cs.AI
エージェント期 その他 2026-05-11
LLM エージェントのメモリ機構サーベイ — ストレージから経験へ
LLM エージェントのメモリ機構の進化を体系的にサーベイした論文。単なる『ストレージ』としてのメモリから、行動履歴を抽象化して『経験 (experience)』として活用するメカニズムへの移行を整理。short-term / long-term / episodic / semantic 等の階層、retrieval 戦略、自己反省・要約による圧縮、外部 store との統合などを網羅。Anthropic / OpenAI / Google の各エージェント実装の理論的整理に有用。
ソース: arXiv cs.AI
推論モデル期 その他 2026-05-11
推論を増やすほどバイアスも増える — 推論モデルの長さ駆動型位置バイアス
推論モデル(reasoning models, e.g., o1 / Claude reasoning)における『長さ駆動型位置バイアス (length-driven position bias)』を発見した論文。推論ステップが長くなるほど、最初・最後の選択肢を選びやすくなる系統的バイアスが強まることを示す。『より考えさせれば良い答えが得られる』という素朴な期待への警鐘で、reasoning 系モデルの evaluation 設計に影響する重要な findings。
ソース: arXiv cs.AI
エージェント期 その他 2026-05-11
コンピュータ使用エージェントのセキュリティ — Architecture-Lifecycle 統合フレームワーク
コンピュータを操作するエージェント(computer-use agent)の信頼性向上を狙ったArchitecture-Lifecycle 統合フレームワーク。設計・運用・廃止までのライフサイクルを通して、権限管理・実行隔離・ログ・人間監督の各レイヤを統合的に扱う。Claude Computer Use・Anthropic Operator・OpenAI Operator の本番展開で問題になるセキュリティ設計に対する学術的フレームワーク提案。
ソース: arXiv cs.CL
エージェント期 その他 2026-05-11
Figma 上の AI エージェントがデザインを作成・編集可能に — 意図しない UI 生成を防ぐ仕組み
Figma が AI エージェント機能を導入し、デザインを作成・編集できるようにした。意図しない UI が生成されることを防ぐため、デザインシステム・コンポーネントライブラリの制約をエージェントに渡す仕組みを採用。デザインツールにエージェントを組み込む際の実装パターンとして参考になる。
ソース: ITmedia AI+
エージェント期 その他 2026-05-11
ChatGPT 以後に公開された Web サイトの 35% が AI 生成 — 米スタンフォード大調査
米スタンフォード大学らの調査で、ChatGPT 公開後にローンチされた Web サイトの約 35% に AI 生成テキストが含まれていることが明らかになった。『不自然に明るい』文章スタイル等から AI 生成を検出。AI 生成コンテンツが Web を急速に侵食している実態を示すデータで、今後の検索・SEO・コンテンツ評価の在り方に影響する。
ソース: ITmedia AI+
エージェント期 その他 2026-05-11
国産スタートアップ『人機一体』、JR も使う人型重機を市販へ
日本のスタートアップ『人機一体』が、JR でも利用される産業用人型ロボット(人型重機)を市販化する。「一反もめんのようだ」と話題の独特な形状を持ち、人間の動きをトレースしてロボットを遠隔操作する半自律システム。AI 直結というよりはロボティクス + テレオペレーションだが、産業 AI 応用の周辺領域として注目される。
ソース: ITmedia AI+
エージェント期 その他 2026-05-11
TGR-D、AI-CAE 技術を導入 — RICOS とレーシングカー空力解析を検証
Toyota GAZOO Racing-D (TGR-D) は AI ベースの CAE (Computer-Aided Engineering) 技術を導入し、RICOS との連携でレーシングカーの空力解析を高速化・高精度化する実証を進めている。従来の数値シミュレーションに ML を組み合わせることで反復計算サイクルを短縮し、車両セッティング決定の意思決定を加速する取り組み。
ソース: ITmedia AI+
マルチモーダル期 OpenAI 2026-05-10
GPT Images 2.0 + Seedance 2.0 でストーリーボードからのアニメ生成
npaka 氏が GPT Images 2.0 でストーリーボード(4×4 グリッド・16:9 のアニメ風コマ割り)を生成し、Dreamina の Seedance 2.0 でストーリーボードを実際に動くアニメ映像に変換する実験。Nano Banana + Grok Imagine 版との比較も行い、それぞれの強みと弱みを1 発出し vs. 3 生成ベストピック方式で評価。マルチモーダル AI を組み合わせた制作パイプラインの実例として有用。
ソース: note: npaka
エージェント期 その他 2026-05-10
AI 生成の『ゴミ報告』が殺到 — 脆弱性発見の懸賞金制度に異変
脆弱性発見 bug bounty 制度に AI 生成の低品質報告が殺到し、対応する側のセキュリティチームが疲弊している実態を伝える記事。LLM を使った自動報告生成が容易になった結果、実体のない『AI が作った』脆弱性レポートの数が爆発的に増え、運営側が真の脆弱性報告を選別するコストが急増。AI が引き起こしている人間労働への副作用の典型例。
ソース: ITmedia AI+
エージェント期 Anthropic 2026-05-10
NEC × Anthropic 協業、社長対談で語る『日の丸 AI』戦略 — 想像以上の反響
NEC × Anthropic 協業についての社長対談記事。NEC が Claude / Claude Code を社内全エンジニアにアップスキルさせる方針、想像以上の取引先反響、日本企業の AI 内製化を支える『日の丸 AI』戦略の中での位置付け等を一問一答形式で公開。Anthropic 公式 announcement の続報。
ソース: ITmedia AI+
エージェント期 その他 2026-05-10
日本の法令・法規 MCP サーバーファミリーを作って LLM に正しく引用させる
日本の法令・法規を LLM に正しく引用させるための MCP サーバーファミリーを開発した報告。e-Gov 法令検索 API を MCP として包んで、Claude や ChatGPT 等が正確な条文と最新の改正状況を引いて回答できるようにする。LLM の hallucination 抑制 + 日本のリーガルテックでの実用化に向けた一歩。
ソース: Zenn (llm)
エージェント期 その他 2026-05-10
書籍 OCR に LLM を組み合わせ、精度向上 + 文書構造・図表現も保持
書籍の OCR に LLM を組み合わせることで、単なる文字認識精度を上げるだけでなく、文書構造(章・節・段落)や図表の構造も保持する処理パイプラインを構築した記録。OCR 結果を LLM で後処理することで誤読を修正しつつ、見出し階層・図キャプション・表構造を Markdown / JSON で表現できる。古書のデジタル化や RAG 用ソース整備に有用。
ソース: Zenn (llm)
エージェント期 Google DeepMind / Google 2026-05-10
Gemma 4 の MTP drafter — 推論速度を最大 3 倍にする技術
Google の Gemma 4 に搭載された MTP (Multi-Token Prediction) drafter の仕組みを解説。従来の speculative decoding に対する改良として、自己回帰モデル内で複数トークンを並列予測し、ドラフトモデルを別途用意する必要がない設計が特徴。報告では推論速度が最大 3 倍に向上。ローカル LLM 推論の高速化技術として注目される。
ソース: Zenn (llm)
エージェント期 Google DeepMind / Google 2026-05-10
Google の Gemma 4 を Intel Lunar Lake 内蔵 NPU で動作させる実践記事。OpenVINO 2026 と openvino-genai を組み合わせ、量子化・モデル変換・推論パイプラインを構築。クラウド API に頼らないローカル推論の選択肢として、エッジ AI / プライバシー重視ワークロードでIntel NPU + OpenVINO スタックの実用性が一段階上がっていることを示す事例。
ソース: Zenn (llm)
エージェント期 その他 2026-05-10
AI 面接官の普及と困惑 — 求職者への影響と改善要望
就職面接の場で AI 面接官(応募者の音声・動画・回答を AI が解析・評価する)が普及している実態と、求職者からの困惑・改善要望をまとめた調査記事。効率化のメリットはあるが、判定の透明性、感情の機微への対応、公平性への懸念が指摘されている。エンタープライズ AI の社会的影響を映す事例。
ソース: ITmedia AI+
エージェント期 xAIAnthropic 2026-05-09
xAI と Anthropic、新たなコンピュート提携を発表
xAI は Anthropic との新たなコンピュート提携を発表した。両社間でコンピュートリソースの相互融通を行う具体的な枠組みで、競合関係にある AI 企業同士が GPU 容量を共有する珍しい構図。業界全体での GPU 不足の中、戦略的な相互依存関係の構築として注目される。
ソース: xAI News
エージェント期 Anthropic 2026-05-08
Claude Code: HTML の不合理な有効性 — Markdown より HTML を出力させるべき理由
Anthropic Claude Code チームの Thariq Shihipar の記事を Simon Willison が紹介。Claude に出力させる形式として Markdown よりも HTML の方が有効な場面が多いと主張。PR レビューを HTML artifact として生成させる例、構造化された差分表示、ハイパーリンク・インラインスタイルを使った視覚的な情報設計など、実装と表現を一体化させる出力としての HTML の優位性を示すプロンプト例が満載。
ソース: Simon Willison's Weblog
エージェント期 その他 2026-05-08
How OpenAI runs Codex securely with sandboxing, approvals, network policies, and agent-native telemetry to support safe and compliant coding agent adoption.
ソース: OpenAI Blog
エージェント期 その他 2026-05-08
国立国会図書館、「AI 動向」に関する調査資料を無料公開
国立国会図書館が AI 動向に関する調査資料を無料で一般公開した。AI 技術の研究動向、社会的影響、政策動向、各国の規制等を体系的にまとめた資料で、AI に関する公的なナレッジソースとして有用。日本国内における AI に関する公共資料整備の事例として注目される。
ソース: ITmedia AI+
エージェント期 Mistral AI 2026-05-08
Mistral Medium 3.5 発表 — Vibe にリモートコーディングエージェントを統合
Mistral は新モデル「Mistral Medium 3.5」を発表し、同社のコーディング環境 Vibe でリモートコーディングエージェントを利用できるようにした。Medium 3.5 を駆動エンジンとし、Vibe からクラウド側でエージェントがリポジトリへの長時間タスク(マルチファイル変更・テスト・PR 作成)を実行する。Anthropic Claude Code・OpenAI Codex に対抗するエージェント型 IDE 戦略の一環。
ソース: Mistral News
エージェント期 Google DeepMind / Google 2026-05-07
Google google-genai SDK v2.0.0 リリース — Interactions API に破壊的変更
Google の Gemini API 用 Python SDK `google-genai` がメジャーバージョン 2.0.0 へ。破壊的変更は Interactions(対話セッション API)のみに限定されており、`generate_content` の通常呼び出しには影響しないと公式に明記されている。詳細は Google の 「interactions breaking changes may 2026」ガイドが整理されている。Interactions の steps を扱うインターフェースが整理された点が中心。v1.75 で入った Multimodal File Search や v1.74 の FileCitation メタデータと合わせて、Gemini の対話・RAG 系 API が SDK 上で大きく再編されている時期にあたる。
ソース: Google GenAI Python SDK Releases
エージェント期 OpenAI 2026-05-07
OpenAI Python SDK v2.36.0 — Realtime v2 対応
OpenAI 公式 Python SDK v2.36.0 は Realtime API の第 2 世代(realtime 2)に対応した。従来 v1 で提供されていた音声・テキストの双方向ストリーミング API が刷新された世代にアップグレードされ、SDK 側もそのインターフェースを公開する。実時間で音声入出力を扱う Voice Agent 構築の主要パスとして、OpenAI 側の更新とSDK 側の追従が短期間で揃った形になる。
ソース: OpenAI Python SDK Releases