MiMo Code|XiaomiのAIコーディングエージェントが「計算・記憶・進化」で長程タスクに挑む

AIに長い作業を任せると、途中で「もう終わった」と勘違いしたり、最初の指示を忘れてしまったり――そんな経験はないでしょうか。Xiaomiが、この「長く働き続けられないAI」という課題に正面から挑むコーディングエージェント「MiMo Code」を公開しました。賢さではなく「持続力」を競う、新しい開発競争のかたちが見えてきます。


Xiaomi は2026年6 月 10 日、 MiMo チームが OpenCode をベースに公開したターミナル型コーディングエージェント「MiMo Code」を発表した。MIT ライセンスで提供され、数十から数百ステップに及ぶ長程(ロングホライズン)タスク向けに「計算・記憶・進化」という三つの軸で設計されている。

計算面では、各ラウンドで N 個(デフォルト5)の候補を並列生成して選別する Max Mode を備え、SWE-Bench Pro では単一サンプリング比10〜20%の向上と引き換えに約4〜5倍のトークンを消費する。記憶面では、checkpoint を予算の20%・45%・70%で発火させ、Session・Project・Global・History の4層記憶を維持する。進化面では、Dream を7日ごと、Distill を30日ごとに実行する。

評価は、MiMo Code + MiMo-V2.5-Pro が三つのベンチマークで Claude Code + Claude Sonnet 4.6 を上回り、576名・474リポジトリ・1,213ペアの二重盲検 AB テストで、200ステップ超のタスクにおける勝率は65%以上となった。

From: 文献リンクMiMo Code:将编程 Agent 扩展到长程任务

mimo xiaomi公式プレスリリースより引用

【編集部解説】

スマートフォンや家電のメーカーという印象が強い Xiaomi が、ソフトウェア開発の最前線でも存在感を示し始めています。今回の MiMo Code は、同社が4月に公開した基盤モデル MiMo-V2.5-Pro の延長線上にある一手です。モデル単体の賢さを競う段階から、モデルを「どう動かし続けるか」を競う段階へと、開発競争の重心が移りつつあることを象徴しています。

ここで鍵になるのが「ハーネス(harness)」という考え方です。ハーネスとは、言語モデルを乗せて走らせる土台、いわば運行管理システムにあたります。モデルそのものは記憶を持たず、呼び出されるたびに白紙から始まります。その白紙のモデルに、何を覚えさせ、いつ思い出させ、どこで区切るかを差配するのがハーネスの役割です。MiMo Code が「計算・記憶・進化」という三層で設計を語るのは、この差配の技術を体系立てて見せるためだと読み取れます。

とりわけ注目したいのが「記憶」の設計思想です。一般的な長時間タスクでは、対話履歴が膨らんでウィンドウが満杯になってから慌てて圧縮します。MiMo Code はこれを逆転させ、まだ余裕のある段階(予算の20%・45%・70%)で先回りして記録を取ります。「lost in the middle」、つまり入力が長くなるほど中盤の情報への注意が落ちるという既知の弱点を、設計で回避しようという発想です。締め切り直前にまとめて議事録を書くより、会議中にこまめにメモを残すほうが正確だ、という直感に近いものがあります。

もう一つ押さえておきたいのが、本文に登場する Dynamic Workflow の出自です。これは Anthropic が Claude Code 向けに2026年5月28日に公開した機能で、当初は研究プレビューでしたが、その後一般提供(generally available)へと移行しています。自然言語の指示から JavaScript のオーケストレーション・スクリプトを生成し、数十から数百のサブエージェントを並列に走らせる仕組みです。MiMo Code はそのコアセマンティクスとの互換を明言したうえで独自拡張を加えており、フロンティアの設計思想が公開後ただちに他社のオープンソース実装へ取り込まれていく、現在のエコシステムの速度を物語っています。

実用面では、この技術によって「人間が数日から数週間かけて分担していた規模の作業」を、一つのセッションが引き受けられるようになります。プロジェクト全体の言語移行や大規模なリファクタリングなど、これまで自動化が届かなかった領域が射程に入ってきます。Xiaomi がオープンソースのハーネスに、期間限定とはいえ無料のフロンティア級モデルを組み合わせた点も見逃せません。ライセンス費用と利用コストの双方が当面ゼロになるため、企業にとっては低リスクで試せる評価候補になります。

ただし、明るい面だけを見るのは公平ではありません。第一に、ベンチマークの優位性は Xiaomi 自身による自己申告であり、第三者による再現検証はこれからです。記事内の「200ステップ超で勝率65%以上」という数字も、576名・474リポジトリ・1,213ペアという規模ながら社内クラウドテストの結果である点は冷静に捉える必要があります。第二に、無料で使える代わりにコードの文脈が Xiaomi のサーバーを経由する設計は、データの所在や知的財産の管理に厳格な組織にとっては採用の障壁になり得ます。

規制や統制の観点からは、別の論点が浮かびます。一つのセッションが数百のサブエージェントへ分岐すると、生成される変更の量が、人間がレビューできる速度を上回ります。コードを「書くこと」より「正しいと確認すること」が難所に変わるわけです。検証・ガバナンス・証跡の記録を後回しにすれば、確認しきれない変更が負債のように積み上がる懸念があります。MiMo Code が「監査可能性」を理由にベクトルデータベースではなくファイル形式の記憶を選んだのは、この課題への一つの答えとも読めます。

長期的に見れば、今回のリリースは「自律的に働き続けるエージェント」へ向けた地ならしの一つです。Distill が作業パターンを再利用可能な手順へ固定化し、Dream が記憶を整理するという仕組みは、ツールが使うほど賢くなる未来を示唆します。問われているのは「人間が何を手放し、何を握り続けるか」という線引きです。判断や検証という最後の責任をどこに残すのか。その設計思想こそが、これからのソフトウェア開発の質を左右していくでしょう。

【用語解説】

コーディングエージェント
人間の指示を受けて、コードの読み書き・コマンド実行・デバッグなどを自律的に進める AI のこと。ターミナル上で動作するものを「ターミナル型」と呼ぶ。

長程(ロングホライズン)タスク
数十から数百ステップにわたって継続する、長い作業のこと。一回で完結する短いタスクと異なり、状態の連続性と記憶の維持が課題になる。

Dream/Distill
記憶を自動整理する仕組み。Dream は7日ごとに記憶の統合・重複排除・圧縮を行い、Distill は30日ごとに繰り返し現れる作業パターンを再利用可能な手順へ固定化する。

SWE-Bench Pro
ソフトウェアエンジニアリングの実問題を解く能力を測るベンチマークの一つ。本記事では Max Mode の効果測定に用いられている。

MiMo-V2.5-Pro
Xiaomi MiMo チームが2026年4月に公開した、長程タスク向けの基盤モデル。MiMo Code の評価で組み合わせて用いられている。最大100万トークンのコンテキストに対応する。Xiaomi の公式仕様によれば、約1兆200億パラメータ(アクティブ420億)の Mixture-of-Experts(MoE) 構成とされる。

Claude Code / Claude Sonnet 4.6
Anthropic が提供するコーディングエージェント(Claude Code)と、その基盤モデルの一つ(Claude Sonnet 4.6)。本記事では MiMo Code の比較対象となっている。

【参考リンク】

MiMo Code(公式サイト)(外部)
Xiaomi が公開したターミナル型コーディングエージェント MiMo Code の公式紹介ページ。

MiMo Code(GitHub リポジトリ)(外部)
MiMo Code のソースコードを公開するリポジトリ。MIT ライセンスで提供されている。

OpenCode(公式サイト)(外部)
MiMo Code のベースとなった、オープンソースのターミナル型 AI コーディングエージェント。

MiMo-V2.5-Pro(公式紹介ページ)(外部)
MiMo Code の評価で用いられた基盤モデル MiMo-V2.5-Pro の公式紹介ページ。

Anthropic Claude Code – Dynamic Workflows(外部)
本記事に登場する Dynamic Workflow の出自を解説する Anthropic 公式ドキュメント。

【参考記事】

Xiaomi’s new open source MiMo Code beats Claude Code at 200+ step tasks(VentureBeat)(外部)
200ステップ超で勝率65%以上という主張と、自己申告やデータ所在の留保を併せて報じている。

Introducing dynamic workflows in Claude Code(Anthropic 公式ブログ)(外部)
Dynamic Workflow の出自を示す公式発表。現在は一般提供へ移行と更新されている。

Claude Code Adds Dynamic Workflows for Parallel Agent Coordination(InfoQ)(外部)
Dynamic Workflow の概要と研究プレビュー公開を伝えた技術メディアの記事。

Claude Code’s Dynamic Workflows Take on the Tasks That Were Too Big to Automate(DevOps.com)(外部)
大規模並列がもたらす検証・ガバナンスの課題と「検証負債」を論じている。

Xiaomi Releases MiMo-V2.5-Pro and MiMo-V2.5(MarkTechPost)(外部)
基盤モデル MiMo-V2.5-Pro の公開と、長程タスクでの自律構築の具体例を報じている。

【関連記事】

Xiaomi「MiMo-V2-Pro」発表—パラメーター数1兆超、Claude Opus 4.6に迫る性能を5分の1のコストで
MiMo Code が評価で用いる基盤モデルの前世代。1兆パラメータやコスト効率の背景を解説。

Xiaomi「MiMo-Embodied」オープンソース化、自動運転とロボティクスを統合した世界初のAI基盤モデル
MiMoチームと羅福麗氏の動向を扱った記事。Xiaomiのオープンソース戦略の文脈が分かる。

Grok Build 0.1をxAIが公開|Claude Code・Codexに挑む自律コーディングの実力
本記事の比較対象でもある自律コーディングエージェント競争の現在地を伝える記事。

【編集部後記】

AI が「賢いかどうか」だけでなく、「長く働き続けられるか」を競う時代に入ってきたのかもしれません。記憶を先回りして残す、完了を別の目で確かめる――こうした地道な工夫は、私たちが日々の仕事で無意識にやっていることにも、どこか似ている気がします。

みなさんなら、AI にどこまで作業を任せ、どの判断は手元に残しておきたいと感じるでしょうか。もし MiMo Code を試す機会があれば、その手応えをぜひ聞かせてください。一緒に未来の輪郭をたどっていけたら嬉しいです。

Googleで優先するソースとして追加するボタン
投稿者アバター
omote
デザイン、ライティング、Web制作を行っています。AI分野と、ワクワクするような進化を遂げるロボティクス分野について関心を持っています。AIについては私自身子を持つ親として、技術や芸術、または精神面におけるAIと人との共存について、読者の皆さんと共に学び、考えていけたらと思っています。