AIが「コードを手伝う」時代から、「コードを任せる」時代へ。xAIが、自律的にプログラムを書くコーディングAI「grok-build-0.1」をAPIで公開しました。計画を立て、書いて、テストし、自分で直す——そんな働き方を、毎秒100トークン超の速さと、入力100万トークンあたり1ドルという価格で実現しようとしています。Claude CodeやCodex CLIがしのぎを削るこの分野に、xAIはどんな一手を打ったのか。報道で錯綜する数字も整理しながら、その実像を読み解きます。
xAIは2026年5月29日、コーディングモデルgrok-build-0.1をxAI APIのパブリックベータとして公開した。grok-build-0.1は、Web開発、デバッグ、MCP対応を含むエージェント型コーディング向けに訓練されたモデルであり、Grok Build CLIを動かすモデルと同一である。
処理速度は毎秒100トークンを超え、価格は入力が100万トークンあたり1ドル、出力が100万トークンあたり2ドルである。プロンプトキャッシュ利用時は、キャッシュ部分の入力が100万トークンあたり0.20ドルとなる。コンテキストウィンドウは256Kトークンで、テキストと画像の入力に対応し、出力はテキストである。
旧モデルgrok-code-fast-1は2026年5月15日(PT)にリタイア扱いとなり、コーディング系のリクエストは後継のgrok-build-0.1への移行が推奨されている。
From:
Grok Build 0.1 on API|xAI
【編集部解説】
今回の発表を「また一つ新しいAIモデルが出た」と読み流してしまうのは、少しもったいないと感じています。私がここに注目する理由は、これが単体のモデル公開ではなく、「エージェント型コーディング」という新しい開発スタイルの主導権争いが、いよいよ本戦に入った合図だからです。
そもそも「エージェント型」とは何か。従来のAIコーディング支援が「質問に答える」「次の一行を補完する」助手だったのに対し、grok-build-0.1が想定するのは、計画を立て、コードを書き、ターミナルを動かし、エラーを自分で直す——その一連のループを自律的に回す存在です。手取り足取りの世話を必要とせず、働き続ける協働者、というイメージが近いでしょう。
その思想がもっとも表れているのが、CLI製品「Grok Build」の作りです。Plan Mode(プランモード)は、複雑なタスクで推奨される入口として、ファイルに触れる前に段階的な計画を提示します。承認するまですべての編集がブロックされる設計です。さらにサブエージェントを並列で走らせ、それぞれを独立したGitワークツリー上で動かせる(レビュー記事では最大8つとされます)。各サブエージェントが独自のGitワークツリーで動く隔離アーキテクチャは、この分野で最も独自性のある設計判断だと評するレビューもあります。賢いモデルそのものより、それをどう御すかという「ハーネス(操縦装置)」に勝負どころが移ってきた、という見方ができます。
何ができるようになるのか。たとえば「認証システムをOAuthに作り替えて」と頼めば、編集予定のファイル・依存関係・テスト手順までを束ねた計画が先に出てきて、人間が安く・早く介入できる。実行が「探索」ではなく「決定論的な作業」に変わるわけです。個人開発者やスタートアップが、人手をかけずに多工程の改修を回せる余地は確実に広がります。
一方で、ここは冷静に補正しておきたい点があります。価格を巡る報道がかなり錯綜しているのです。API料金は公式に入力100万トークンあたり1ドル、出力100万トークンあたり2ドルと明記されており、これは「安い」部類に入ります。問題はCLIの利用条件のほうで、対象プランや月額に報道の幅があります。公式のGrok Build CLIページはSuperGrokおよびX Premium+の加入者を対象と説明していますが、当初や一部報道では月およそ299ドルのSuperGrok Heavyが必要で競合の約15倍にあたるとする試算(Can Demir)も流れました。現行の公式説明とは食い違うため、ここは参考意見として読むのが安全です。いずれにせよ、「APIモデルは安い」と「製品の利用条件は見方次第」は、分けて語る必要があります。
数字でもう一点。コンテキストウィンドウを「2M」と掲げる記事も見かけますが、公式・主要ドキュメントの表記は256Kトークンです。なお公式は、200Kを超えるリクエストには別建ての料金が発生するとしています。ベンチマークもSWE-Bench Verifiedで70.8%という数値が二次記事で引用されていますが、SWE-bench公式リーダーボードでgrok-build-0.1の公開結果としては確認できませんでした。この数値は独立した公開ベンチマークとして十分に裏付けられているわけではない点に留意が必要です。速度とコストでは光るが、精度では競合上位モデルになお差がある、と理解するのが公平でしょう。
「正体は何か」という根の深い論点もあります。公式はgrok-build-0.1がGrok Build CLIを動かすものと同一と述べる一方、「Grok 4.3モデル(内部的にgrok-build-0.1と呼称)」とする解説や、UI内部に別の二モデルを露出させるとする説明もあり、報道間で食い違っています。実際、旧モデルへのリクエストは後継へとルーティングされる移行期にあり、外から見える「実体」が揺れているのは無理もありません。ここは断定を避けたい部分です。
リスクの側面も率直に見ておきましょう。自律的にコードへ手を入れるエージェントは、Plan Modeで歯止めをかけても誤判断をゼロにはできません。長時間・多ツールの実行になれば、トークン消費とツール課金が思わぬ規模に膨らむ可能性があり、放任ではなく見張りながら使う姿勢が要ります。生成コードの責任の所在、サプライチェーンの安全性、そしてベータ段階のモデルへ業務を委ねることの是非——どれも今後の規制論やセキュリティ実務が向き合うテーマです。
長期の視点で言えば、この一手はxAIにとって「チャットボットから自律実行へ」という重心移動の表明だと受け取っています。Grokの能力が会話型AIを越えて自律的なタスク実行へ広がる速さを示す動きであり、開発という人類の営みを、人間がどこまで託し、どこで手綱を握るのか。その線引きを私たち自身が考え始める時期に来た——そう感じさせる発表でした。
【用語解説】
エージェント型コーディング(agentic coding)
AIが計画・記述・実行・修正のループを自律的に回す開発スタイルだ。質問に答える、一行を補完するといった従来の支援とは異なり、多工程の作業をまとめて任せる発想に立つ。
CLI(コマンドラインインターフェース)
キーボードからの文字コマンドで操作する、ターミナル上の操作環境を指す。Grok BuildはこのCLI形式を中心に据えている。
Plan Mode(プランモード)
ファイルを編集する前に、AIが編集予定・依存関係・テスト手順などの実行計画を提示する仕組みだ。複雑なタスクの入口として推奨され、人間が承認するまで編集はブロックされる。
サブエージェント/並列実行
一つの指示を複数のAIプロセスに分担させ、同時並行で処理する方式を指す。調査・実装・レビューを別個のエージェントが受け持つことで、複雑な作業の所要時間を圧縮する狙いがある。
Gitワークツリー
一つのGitリポジトリから複数の作業ディレクトリを切り出す機能だ。各サブエージェントを互いに干渉しない隔離環境で動かす土台となる。
コンテキストウィンドウ
AIが一度に扱える入力量の上限を、トークン数で表したものだ。値が大きいほど、より広い範囲のコードや文脈を一度に把握できる。
トークン
AIが文章やコードを処理する際の最小単位で、料金計算の基準にもなる。入力トークンと出力トークンで単価が分かれるのが一般的である。
プロンプトキャッシュ
同じ入力の一部を再利用する際、計算結果を使い回してコストと待ち時間を抑える仕組みだ。キャッシュが効いた部分は単価が下がる。
MCP(Model Context Protocol)
AIモデルを外部のツールやデータ源と接続するための共通規約だ。これに対応することで、エージェントが多様な道具を扱いやすくなる。
SWE-Bench Verified
実在のソフトウェア課題を解かせ、コーディング能力を測るベンチマークの一つだ。人手で検証された500件のサブセットで構成され、スコアの算出環境によって数値が変わりうる点には注意が要る。
OAuth
利用者のパスワードを直接渡さずに、外部サービスへ権限を委譲する認可の仕組みだ。本文では「作り替えの対象となる典型的な機能」の例として挙げた。
リタイア(モデルの提供終了)
提供元が、あるモデルの提供を終える措置だ。以後のリクエストは後継モデルへ振り向けられ、利用者は移行を促される。
【参考リンク】
xAI(公式サイト)(外部)
grok-build-0.1を開発・提供するxAIの公式サイト。Grokシリーズの製品情報や最新の発表をまとめて確認できる。
Grok Build 0.1(xAI開発者ドキュメント)(外部)
grok-build-0.1のモデル仕様や価格を示す公式ドキュメント。256Kや入出力対応などの正確な情報を確認できる。
Grok Build Beta(xAI公式製品ページ)(外部)
Grok Build CLIの公式製品ページ。Plan Modeや対象プラン、MCP対応など製品機能の正確な仕様を確認できる。
May 15, 2026 Model Retirement(xAI公式ドキュメント)(外部)
旧モデルのリタイアと後継への移行方針を示す公式の移行案内。grok-code-fast-1の扱いを確認できる。
Claude Code(Anthropic公式サイト)(外部)
本文で比較対象に挙げた、Anthropicのターミナル型エージェント型コーディングツールの公式製品ページ。
Model Context Protocol(公式サイト)(外部)
AIと外部ツールを接続する共通規約MCPの公式サイト。仕様や対応実装、導入方法の情報を提供している。
【参考記事】
Grok Build: What xAI Actually Shipped (And What’s Overstated)(外部)
一次情報と突き合わせ報道の誇張を検証。個人向けにHeavyが要り競合の約15倍とするが、現行公式説明とは異なる。
The Quiet Arrival of Grok Build 0.1 in a Wild Week for the xAI Empire(外部)
Kiloによるベータ解説。料金を入力1ドル・出力2ドルとし、200Kを超えると追加料金が生じる点に触れる。
Grok Build Review: xAI’s Terminal Coding Agent(ChatForest)(外部)
検証寄りのレビュー。SWE-Bench70.8%、最大8つの並列サブエージェント、隔離ワークツリー設計を整理する。
Grok Build CLI: Plan Mode, Subagents, and Headless CI(Mervin Praison)(外部)
ドキュメント準拠の解説。既定の許可挙動はaskで、公開SWE-bench結果は未公表とPlan Modeの位置づけを補正する。
Introducing Grok Build(xAI公式発表)(外部)
CLI製品の公式告知。複雑なタスクはプランモードで開始し、承認するまで実行しない正確な仕様を示す一次情報。
How to Use Grok in OpenCode(Memeburn)(外部)
セットアップ解説。Grok Buildが内部的にGrok4.3と呼ばれる点に触れ、モデルの実体を巡る食い違いを示す。
【関連記事】
xAI「Grok Build」がSuperGrok・X Premium Plus加入者に開放 Claude Code・Codex CLIに続く選択肢へ
同じGrok BuildのCLI対象者拡大を扱った記事。今回のAPI公開と合わせ読むと普及の全体像がつかめる。
xAIがコーディングエージェント「Grok Build」公開|イーロン・マスクが選んだ「囲い込まない」設計とは
Grok Build初公開時の記事。8並列や256Kが当初は公式未公表だった経緯を確認できる。
オープンソースAIエージェント「Hermes Agent」に接続可能に — xAIが狙う開発者層
xAIがエージェント開発者層をどう取り込もうとしているかを示す関連記事。
【編集部後記】
正直に言うと、エージェントが自分のコードを並列で書き換えていく様子を想像すると、わくわくする気持ちと、少しの落ち着かなさが同居します。便利さの裏側には、いつも「どこまで任せるか」という問いが控えているからです。
新しい道具ほど、最初の一歩は小さく、手元を確かめながら——。そんな付き合い方を、私自身も読者のみなさんと一緒に探っていけたらと思っています。試してみて気づいたことがあれば、ぜひ聞かせてください。












