scientific-discovery

記事 10 件

エージェント期 その他 2026-05-11

Domain-level metacognitive monitoring in frontier LLMs: A 33-model atlas

33 モデル横断調査 — フロンティア LLM のドメイン別メタ認知能力アトラス

33 種類のフロンティア LLM を対象に、ドメイン別のメタ認知能力(自分の知識・無知の自覚)を包括的に評価した大規模スタディ。モデルが『自分が間違える可能性を正しく見積もれるか』を計測し、ドメイン・スケール・推論モード別の傾向を提示する。ハルシネーション抑制やエージェント実行時の自己検証戦略を設計する基礎データとして有用。

ソース: arXiv cs.CL

エージェント期 その他 2026-05-11

Towards Closing the Autoregressive Gap in Language Modeling via Entropy-Gated Continuous Bitstream Diffusion

Entropy-Gated Continuous Bitstream Diffusion — 自己回帰モデルとのギャップを縮める拡散モデル

言語モデリングにおける自己回帰モデルとのギャップを縮める Entropy-Gated Continuous Bitstream Diffusionという新アーキテクチャを提案。連続ビットストリーム空間で拡散プロセスを動かしつつ、エントロピーで生成タイミングをゲートする設計により、長らく自己回帰モデルが優勢だった言語生成領域で拡散モデルが競争力を取り戻す可能性を示す。

ソース: arXiv cs.CL

推論モデル期 その他 2026-05-11

Extracting Search Trees from LLM Reasoning Traces Reveals Myopic Planning

LLM の推論トレースから探索木を抽出 — 計画が近視眼的であることを示す

LLM の chain-of-thought 推論トレースから内部の探索木 (search tree) を抽出する手法を提案し、それを用いて『LLM の計画は近視眼的 (myopic)』であることを実証した論文。短期報酬を最大化する手は得意でも、長期的に得な探索を選ぶことが少ない。reasoning モデル・agent の長期計画の限界を可視化する findings。

ソース: arXiv cs.AI

エージェント期 その他 2026-05-11

From Storage to Experience: A Survey on the Evolution of LLM Agent Memory Mechanisms

LLM エージェントのメモリ機構サーベイ — ストレージから経験へ

LLM エージェントのメモリ機構の進化を体系的にサーベイした論文。単なる『ストレージ』としてのメモリから、行動履歴を抽象化して『経験 (experience)』として活用するメカニズムへの移行を整理。short-term / long-term / episodic / semantic 等の階層、retrieval 戦略、自己反省・要約による圧縮、外部 store との統合などを網羅。Anthropic / OpenAI / Google の各エージェント実装の理論的整理に有用。

ソース: arXiv cs.AI

推論モデル期 その他 2026-05-11

More Thinking, More Bias: Length-Driven Position Bias in Reasoning Models

推論を増やすほどバイアスも増える — 推論モデルの長さ駆動型位置バイアス

推論モデル(reasoning models, e.g., o1 / Claude reasoning)における『長さ駆動型位置バイアス (length-driven position bias)』を発見した論文。推論ステップが長くなるほど、最初・最後の選択肢を選びやすくなる系統的バイアスが強まることを示す。『より考えさせれば良い答えが得られる』という素朴な期待への警鐘で、reasoning 系モデルの evaluation 設計に影響する重要な findings。

ソース: arXiv cs.AI

エージェント期 その他 2026-05-11

“ChatGPT以後”に公開のWebサイト、35%がAI生成に? 米スタンフォード大などが調査 広まる「不自然に明るい文章」

ChatGPT 以後に公開された Web サイトの 35% が AI 生成 — 米スタンフォード大調査

米スタンフォード大学らの調査で、ChatGPT 公開後にローンチされた Web サイトの約 35% に AI 生成テキストが含まれていることが明らかになった。『不自然に明るい』文章スタイル等から AI 生成を検出。AI 生成コンテンツが Web を急速に侵食している実態を示すデータで、今後の検索・SEO・コンテンツ評価の在り方に影響する。

ソース: ITmedia AI+

エージェント期 Meta AI / Meta 2026-03-26

Learn More

TRIBE v2 — 人間脳の応答を予測する基盤モデル、解像度 70 倍向上

Meta は人間脳の神経活動を予測する基盤モデル「TRIBE v2」を発表した。視覚 / 聴覚刺激への脳応答を予測するデジタルツインとして機能し、同種モデルと比較して 70 倍の解像度向上を実現する。神経科学者・臨床研究者は被験者を必要とせずに仮説検証できるようになる。モデル・コード・論文・対話デモを公開。

ソース: Meta AI Blog

マルチモーダル期 Meta AI / Meta 2026-03-10

Learn More

Meta と World Resources Institute、DINO ベースの森林樹冠高マップ v2 を公開

Meta は World Resources Institute と提携し、DINO 系基盤モデルを用いた森林樹冠高マップ v2 (CHMv2) を公開した。オープンソースのモデルとワールドスケールのマップを提供し、世界中の森林の高さ・密度・ギャップを詳細に可視化することで、生物多様性保全や土地利用判断を支援する。

ソース: Meta AI Blog

マルチモーダル期 Meta AI / Meta 2025-12-18

Learn More

USRA、Segment Anything で洪水緊急対応を支援

Universities Space Research Association (USRA) と Meta が連携し、Segment Anything Model (SAM) を活用して洪水緊急対応・水資源管理システムを支援。米地質調査所 (USGS) の水観測システムにおいて、衛星画像から水域を自動セグメント化し、洪水・干ばつ予測やダム・貯水池管理の意思決定を支援する。

ソース: Meta AI Blog

マルチモーダル期 Meta AI / Meta 2025-02-20

Learn More

Orakl Oncology、DINOv2 でがん治療研究を加速

フランスの Gustave Roussy Institute スピンオフ Orakl Oncology が、DINOv2 を活用してがん治療研究を加速。患者由来オルガノイド(実験用がん細胞塊)の顕微鏡画像解析に DINOv2 を組み込み、薬剤候補のスクリーニング効率を向上させる。臨床試験前段階の治療法発見プロセスを大幅に短縮する応用例。

ソース: Meta AI Blog