ーTech for Human Evolutionー

EnCompass登場。大規模言語モデルのエラーをバックトラックで解決

AI（人工知能）ニュース

autonews　Headline News

[公開]

2026年2月6日17:36

[更新]2026年2月6日

MITのComputer Science and Artificial Intelligence LaboratoryとAsari AIの研究者たちが開発したAIエージェント向けのフレームワーク「EnCompass」が、2026年2月5日にMIT Newsサイトに掲載された。研究成果は12月にConference on Neural Information Processing Systemsで発表されたものである。

EnCompassは、大規模言語モデルがミスをした際に自動的にバックトラックし、プログラムランタイムのクローンを作成して複数の試行を並列実行する。研究チームは、Javaからpythonへのコードリポジトリ翻訳エージェントにEnCompassを適用し、手作業での実装と比較して348行、約82パーセントのコード削減を実現した。

また、エージェント全体で検索実装のコーディング労力を最大80パーセント削減し、5つの異なるリポジトリで15から40パーセントの精度向上を達成した。

研究の筆頭著者はMIT EECS博士課程学生のジェニング・リーで、共著者にはMIT EECS教授のアルマンド・ソーラー・レザマ、カリフォルニア工科大学教授のイソン・ユエ、Asari AI創設者兼CEOのステファン・ジェンが名を連ねる。

From: Helping AI agents search to get the best results out of large language models | MIT News

【編集部解説】

大規模言語モデルが持つ本質的な不確実性は、2026年の現在でも完全には解消されていません。LLMは確率的にテキストを生成するため、同じ入力に対しても異なる出力を返す可能性があり、時には誤った結果を生成します。この特性は、LLMを活用したAIエージェントの開発において大きな課題となっていました。

EnCompassが解決するのは、まさにこの「試行錯誤のコスト」です。従来、開発者はLLMがミスをした際のバックトラック処理を手作業でコーディングする必要があり、元のエージェントプログラムと同じくらいの労力がかかっていました。EnCompassはこのプロセスを自動化し、プログラマーは「どこで選択肢が分岐するか」を注釈するだけで、フレームワークが複数の経路を並列に探索し、最良の結果を見つけ出します。

開発効率への影響は劇的といえるでしょう。JavaからPythonへのコード翻訳エージェントでは、手作業と比較して348行、約82パーセントのコード削減を実現しました。さらに検索予算16倍の設定で、5つの異なるリポジトリにおいて15から40パーセントの精度向上を達成しています。

技術的に注目すべきは、「プログラムロジックと検索戦略の分離」という設計思想です。EnCompassは、PAN（probabilistic angelic nondeterminism）と呼ばれるプログラミングモデルを実装しており、開発者はエージェントのワークフロー定義と、探索方法の選定を独立して扱えます。モンテカルロ木探索やビーム探索など、異なる戦略を簡単に試すことが可能になりました。

ただし、現時点では制限もあります。EnCompassは、プログラムが高レベルのワークフローステップを指定するエージェントを対象としており、完全にLLMが制御するエージェント（LLM自体がすべてを決定するタイプ）には適用できません。この種のエージェントには、推論時の検索を別の方法で実装する必要があるでしょう。

将来的には、大規模コードライブラリの管理、科学実験の設計と実行、ロケットなどのハードウェア設計図の作成といった、より複雑で大規模なタスクへの応用が期待されています。研究チームは現在、より汎用的な検索フレームワークへの拡張や、ハードウェア設計のブレインストーミングなど人間との協働タスクでの評価を進めています。

LLMの能力が日常業務に組み込まれていく中で、その不確実性とどう向き合うかは重要な課題です。EnCompassのようなツールは、AIエージェントの信頼性を高め、開発者の生産性を向上させる基盤技術として、今後のAI実装において重要な役割を果たすことになると考えられます。

【用語解説】

LLM（大規模言語モデル）
大量のテキストデータを学習した深層学習モデル。自然言語の理解と生成が可能で、翻訳、要約、対話など多様なタスクに対応する。

PAN（probabilistic angelic nondeterminism）
確率的天使的非決定性。プログラムの実行経路に複数の選択肢がある場合、最良の結果をもたらす経路を選択するプログラミングモデル。

モンテカルロ木探索
ランダムサンプリングを用いて探索空間を効率的に探索する手法。探索と活用のバランスを取りながら最適解を見つける。

ビーム探索
各ステップで最も有望な候補のみを保持して探索を進める手法。計算コストを抑えながら効率的に解を探索できる。

【参考リンク】

MIT Computer Science and Artificial Intelligence Laboratory（外部）
MITのコンピューターサイエンスとAI研究の中心機関。最先端の研究開発を行っている。

Asari AI（外部）
EnCompassを共同開発したAI企業。ステファン・ジェンが創設者兼CEO。

Conference on Neural Information Processing Systems (NeurIPS)（外部）
機械学習とAI分野における世界最大級の国際学会。EnCompassの研究成果が発表された。

【参考記事】

Helping AI agents search to get the best results out of large language models | MIT CSAIL（外部）
MIT CSAILによる公式発表。EnCompassの技術的詳細と実装について解説。

EnCompass: Enhancing Agent Programming with Search Over Program Execution Paths（外部）
arXivで公開された論文。PANプログラミングモデルの理論的基盤を詳述。

New framework helps AI systems recover from mistakes and find optimal solutions（外部）
TechXploreによる解説記事。EnCompassの実用的な応用例を紹介。

EnCompass: Enhancing Agent Programming with Search Over Program Execution Paths | OpenReview（外部）
NeurIPS 2025での査読プロセスと議論を閲覧できる学術プラットフォーム。

【編集部後記】

みなさんは、AIツールが期待通りの結果を返してくれなかったとき、どのように対処されていますか。プロンプトを調整したり、何度も試行錯誤したりする時間は、想像以上に積み重なっているのではないでしょうか。

EnCompassのような「失敗から学び、自動的に最適解を探す」仕組みは、今後のAI開発においてどのような可能性を開くと思われますか。開発者でない方も、日常で使うAIツールがより賢く、より確実になっていく未来を想像してみてください。

AI（人工知能）ニュース

autonews　Headline News

TaTsu

『デジタルの窓口』代表。名前の通り、テクノロジーに関するあらゆる相談の”最初の窓口”になることが私の役割です。未来技術がもたらす「期待」と、情報セキュリティという「不安」の両方に寄り添い、誰もが安心して新しい一歩を踏み出せるような道しるべを発信します。ブロックチェーンやスペーステクノロジーといったワクワクする未来の話から、サイバー攻撃から身を守る実践的な知識まで、幅広くカバー。ハイブリッド異業種交流会『クロストーク』のファウンダーとしての顔も持つ。未来を語り合う場を創っていきたいです。

記事一覧