image-blasterとは? World LabsとClaudeで画像を3D世界に変える新スキルセット

「子ども時代の部屋を、もう一度歩いてみたい」——そんな願いに、技術が思いがけない速さで近づいてきました。2026年5月中旬、技術系コミュニティを賑わせているのが「image-blaster」というツールです。1枚の画像を入力すると、ClaudeがWorld LabsやFALといった複数のAIを指揮し、わずか5分ほどで探索可能な3D環境を組み上げます。複数のAIを「使う」のではなく「束ねる」——その新しい発想を、本記事で掘り下げます。


image-blasterは、Claudeのスキル、World Labs、FALを用いて、1枚の画像から3D環境・効果音・3Dメッシュを生成するオープンソースのスキルセットである。開発者は、World Labsのデザインチームに所属するNeilson Koerner-Safrata(GitHubユーザー名neilsonnn)である。

このプロジェクトは2026年5月中旬にGitHubのトレンドやHacker Newsで取り上げられ、World Labsの公式コミュニティショーケースにも掲載された。本稿は同月時点のリポジトリ内容に基づく。

image-blasterは1枚の画像から完全にメッシュ化された3D環境までを5分未満で生成でき、デフォルトでは動的オブジェクトの3Dモデル(.glb、.obj)、静的な環境のガウシアンスプラット(.spz)、アンビエント音と物理効果音(.mp3)を生成する。

利用する生成モデルは、marble-1.1、nano-banana、gpt-image-2、hunyuan-3d、elevenlabs-sfxである。3Dモデル生成の面数のデフォルトは50000で、生成物はUnity、Unreal、Blender、Three.jsなどに組み込める。使用言語はTypeScriptとJavaScriptが中心である。

From: 文献リンクGitHub – neilsonnn/image-blaster: An image-to-world skillset for Claude.

image-blaster githubより引用

【編集部解説】

image-blasterというプロジェクトを最初に見たとき、私が注目したのは「ツールそのもの」よりも「つなぎ方」でした。これは単独の生成AIではありません。複数の専門モデルをClaudeが指揮し、1枚の画像を3D空間へと組み上げる「司令塔つきのパイプライン」です。

少し背景を補足します。鍵となるWorld Labsは、スタンフォード大学のAI研究者フェイフェイ・リー氏が共同創業した「空間知能(Spatial Intelligence)」のスタートアップです。同社の世界モデル製品「Marble」は2025年11月に一般提供が始まり、image-blasterはそのバージョンmarble-1.1を利用しています。さらに2026年1月には、外部アプリから呼び出せる「World API」も公開されました。image-blasterは、このWorld APIを含む複数の外部サービスを束ねて動かす仕組みになっています。

技術的に分かりにくい部分を整理しておきます。READMEにある「ガウシアンスプラット(.spz)」とは、空間を無数の半透明な粒(ガウシアン)の集合として表現する、比較的新しい3D描画手法です。従来のポリゴンメッシュと違い、写真のような質感の空間を軽快に表示できる点が特徴です。image-blasterは、動かせる「動的オブジェクト」はメッシュとして、動かない「背景」はスプラットとして書き出すという、用途に応じた使い分けを自動でこなします。

ここで興味深いのは役割分担です。空間生成はWorld Labs、3Dオブジェクト化はテンセントのHunyuan 3D、効果音はElevenLabs、画像の下処理は別の画像編集モデル——という具合に、それぞれ得意分野の異なるサービスが分業しています。image-blasterの本質は、この分業を人間が手作業でつながずに済むよう、Claudeが手順を実行してくれる「スキル」として束ねた点にあるといえるでしょう。

では、これで何ができるようになるのでしょうか。最も大きいのは、3D制作の「ゼロからイチ」にかかる時間の圧縮です。これまで背景アセットの用意は専門スキルと工数を要する工程でした。READMEは、子ども時代の部屋の写真、ロボットの訓練環境、映画のロケ地候補までを例に挙げています。叩き台が数分で手に入るなら、ゲーム、映像、建築ビジュアライゼーション、そしてロボットのシミュレーション環境づくりの初速は確実に変わってきます。

一方で、冷静に見ておきたい点もあります。第一に、品質です。先行する技術検証では、Marbleは写真ベースの入力に強い反面、イラスト調の入力では精度が落ちる傾向が報告されています。生成物はあくまで「出発点」であり、最終品質には人の手が必要だという前提は崩れていません

第二に、コストと依存性です。image-blasterはWorld LabsとFALのAPIキーを前提とし、画像生成・3D化・効果音のたびに外部サービスへの課金が発生します。複数の商用APIを連鎖させる構造は、便利さと引き換えに、料金体系や仕様変更の影響を受けやすいという側面を持ちます。

第三に、権利と倫理の問題です。実在する場所や他者の写真を入力すれば、その空間が「歩ける3Dデータ」として複製・配布されうることになります。著作権・肖像権・プライバシーをどう扱うか——既存の生成AIで議論されてきた論点が、今度は「空間」という単位で立ち現れてきます。学習データの透明性や、生成された3D環境の権利帰属について、ルール整備が追いついていないのが現状です。

長期的な視点に立てば、image-blasterのような試みは、3Dが「専門家だけのもの」から「テキストのように誰もが扱える素材」へと移っていく流れの一断面だと私は捉えています。World Labs自身も「テキストがソフトウェアの共通インターフェースになったように、3Dは空間の共通インターフェースになる」という見方を示しています。

そして見落とせないのが、この変化の受益者が人間だけではないという点です。リアルな仮想環境を量産できれば、ロボットや自律システムを安全に訓練する「練習場」を無尽蔵に用意できます。image-blasterのExamplesに「ロボット用の環境」が並んでいるのは、決して付け足しではありません。画像から世界を立ち上げる技術は、創作の道具であると同時に、来たるべき身体性を持ったAIを育てる土壌にもなりうる——だからこそ今、注視しておきたい一歩なのです。

【用語解説】

世界モデル(World Model)
画像やテキストなどの入力から、空間そのものの構造を内部的に表現・生成するAIモデルのこと。文章を生成する言語モデルに対し、こちらは「歩ける空間」を生み出す点が異なる。

空間知能(Spatial Intelligence)
平面的な言語・画像の理解にとどまらず、AIが3次元の空間を知覚・生成・操作する能力を指す概念。World Labsが掲げる中核的なテーマである。

ガウシアンスプラット(Gaussian Splatting)
空間を無数の半透明な粒(ガウシアン)の集合として表現する3D描画手法。従来のポリゴンメッシュより写真的な質感を軽快に再現できるとされ、.spzなどの形式で書き出される。

メッシュ(3Dメッシュ)
点・線・面(ポリゴン)の集合で立体物の形状を表したデータ。ゲームエンジンや3Dソフトで広く使われる標準的な3D表現である。.glbや.objがその代表的なファイル形式だ。

スキル(Claudeのスキル)
特定の作業手順や知識をまとめ、AIアシスタントClaudeに実行させるための定義のこと。image-blasterは、画像から3D環境を生成する一連の工程をこの形式で束ねている。

World API
World Labsが2026年1月に公開した、外部アプリから世界モデルMarbleを呼び出すためのプログラム向け接続口。image-blasterはこれを利用して3D環境を生成する。

身体性を持ったAI(Embodied AI)
ロボットなど、物理的な身体を通じて環境と相互作用するAIの総称。実環境の代わりに仮想空間で訓練できることから、3D環境の自動生成技術と関係が深い。

【参考リンク】

image-blaster(GitHubリポジトリ)(外部)
本記事の主役image-blasterの公式リポジトリ。ソースコードやREADME、導入手順、開発の経緯まで確認できる。

World Labs(公式サイト)(外部)
空間知能を掲げるスタートアップの公式サイト。世界モデルMarbleの概要や活用事例、技術ブログを確認できる。

Marble by World Labs(外部)
画像やテキストから3D空間を生成・編集・共有できるMarbleの利用ページ。無料・有料のプランや作例が確認できる。

fal.ai(公式サイト)(外部)
生成AIモデルをAPI経由で実行できるプラットフォーム。image-blasterはHunyuan 3Dの実行にこれを利用する。

Hunyuan 3D on fal.ai(外部)
テンセントの3D生成モデルHunyuan 3Dをfal.ai上で動かすページ。対応パラメータや出力形式が解説されている。

ElevenLabs(公式サイト)(外部)
音声・効果音生成で知られる企業の公式サイト。image-blasterはアンビエント音や物理効果音の生成に利用する。

Claude(Anthropic)(外部)
image-blasterの司令塔となるAIアシスタントClaudeの公式サイト。ターミナル版Claude Codeもここから導入できる。

【参考記事】

Fei-Fei Li’s World Labs speeds up the world model race with Marble(TechCrunch)(外部)
World Labsが初の商用製品Marbleを2025年11月に一般提供した経緯と、競合製品との違いを詳しく伝える記事。

Hunyuan 3D – AI 3D Model Generation(fal.ai)(外部)
image-blasterが使うHunyuan 3Dの仕様ページ。最大150万ポリゴンの3Dモデルを生成でき、出力形式も明記される。

Announcing the World API(World Labs)(外部)
2026年1月に公開されたWorld APIの発表記事。外部アプリから3D世界を生成でき、ロボット用途にも言及する。

Marble: A Multimodal World Model(World Labs)(外部)
Marbleの一般提供開始を告げる公式発表。多様な入力から3D世界を生成し、複数形式で書き出せる点を解説する。

World Labs lays out its vision for world models with new Marble model(TechTalks)(外部)
Marbleの技術背景を解説した記事。ガウシアンスプラットの仕組みやGenie 3との設計思想の違いを整理する。

【関連記事】

World Labs、初の商用3Dワールドモデル「Marble」を発表——テキストや画像から編集可能な3D環境を生成
image-blasterが空間生成に用いるMarbleそのものを解説した記事。本記事と最も関係が深い。

Anthropic、Claude AIに「Skills」機能追加|企業AIワークフローを高速化
image-blasterの土台となるClaudeのスキル機能を、段階的開示の仕組みから掘り下げた記事。

テンセント「HunyuanWorld-Voyager」発表、1枚の写真から3D世界を生成するAIモデル
image-blasterが3Dモデル生成に使うHunyuan系技術と、1枚の画像からの3D化という発想を共有する記事。

【編集部後記】

正直に打ち明けると、最初は「また新しい3Dツールか」という気持ちで読み始めました。けれど読み進めるうちに心を掴まれたのは、個々のモデルの性能ではなく、それらを一つの流れに編み上げる発想のほうでした。

優れたAIを「使う」時代から、複数のAIを「指揮する」時代へ——その移り変わりが、image-blasterという小さなプロジェクトに凝縮されているように感じます。みなさんは、手元の1枚をどんな世界に変えてみたいですか。よろしければ、その想像を聞かせてください。

Googleで優先するソースとして追加するボタン
投稿者アバター
TaTsu
『デジタルの窓口』代表。名前の通り、テクノロジーに関するあらゆる相談の”最初の窓口”になることが私の役割です。未来技術がもたらす「期待」と、情報セキュリティという「不安」の両方に寄り添い、誰もが安心して新しい一歩を踏み出せるような道しるべを発信します。 ブロックチェーンやスペーステクノロジーといったワクワクする未来の話から、サイバー攻撃から身を守る実践的な知識まで、幅広くカバー。ハイブリッド異業種交流会『クロストーク』のファウンダーとしての顔も持つ。未来を語り合う場を創っていきたいです。