OpenJarvis 登場、Ollama 対応のローカルファーストAI─スタンフォード発「Intelligence Per Watt」の挑戦

「あなたのAIアシスタント、その『頭脳』はどこにありますか?」――そう問われると、多くの人は答えに詰まるかもしれません。私たちが毎日メールやメモを打ち込んでいるAIは、その大半が私たちの言葉を遠くのクラウドへ送り、誰かのデータセンターで考えています。スタンフォード大学の研究チームが公開した「OpenJarvis」は、その当たり前をひっくり返そうとする試みです。AIを自分のパソコンの中で動かし、クラウドはあくまで任意。プライバシーも、速さも、コストも、自分の手元に取り戻す――そんな未来を、ローカルで動かせるツール「Ollama」とともに、いますぐ試せる形で届けてくれます。


2026年5月28日、Ollama のサポートを標準搭載した OpenJarvis のバージョン1.0が公開された。OpenJarvis は、自分のハードウェア上で動作するパーソナルAIエージェントを構築するためのオープンソースのフレームワークである。スタンフォード大学の Hazy Research ラボおよび Scaling Intelligence ラボが、効率的なローカルAIに関する研究「Intelligence Per Watt」の一環として開発した。

モデルはローカルで動作し、クラウドの利用は任意となる。エネルギー、コスト、レイテンシが精度とあわせて計測される。macOS、Windows、Linux に対応し、インストールスクリプトは既存の Ollama 環境を自動検出する。モーニングブリーフィング、ファイル横断リサーチ、ローカルのコーディングエージェントといったプリセットが付属する。

From: 文献リンクOpenJarvis: a local-first personal AI is now available to run with Ollama · Ollama Blog

【編集部解説】

今回の発表でまず押さえておきたいのは、OpenJarvisが「ぽっと出の新興プロダクト」ではないという点です。プロジェクト自体は2026年3月にスタンフォード大学のチームが公開しており、今回(5月28日)はそのv1.0がOllama対応を標準搭載したことを、Ollama公式ブログが改めて告知した形になります。開発元はスタンフォード大学のHazy ResearchとScaling Intelligence Lab(SAIL)で、著者にはコンピュータアーキテクチャの権威であるジョン・ヘネシー、Snorkelの研究開発を主導したことで知られるクリストファー・レ、元Google Brainのアザリア・ミルホセイニといった名前が並びます。学術的な裏付けを持った取り組みだと理解しておくと、ニュースの重みが変わってきます。

その背骨にあるのが「Intelligence Per Watt(ワットあたりの知性)」という研究です。スタンフォードの調査では、ローカルの言語モデルが単一ターンのチャットおよび推論クエリの88.7%をすでに処理でき、知能効率が2023年から2025年にかけて5.3倍向上したことが報告されています。「クラウドに送らなくても、手元の機械でほとんど用が足りる」という前提条件が、すでに整いつつあるわけです。

ここでOpenJarvisが問い直しているのは、設計思想そのものです。パーソナルAIの人気は爆発的に高まっているにもかかわらず、そのほとんどがいまだに知能の中核をクラウドAPI経由で処理しており、「自分の」AIが他人のサーバーに依存し続けている――そう同チームは指摘します。私たちの最もプライベートなデータが、誰かのクラウドを経由し、その遅延・コスト・利用規約に従わされている、という構図です。OpenJarvisはこれを反転させ、ローカルを既定値に、クラウドを例外にしようとしています。

技術的な新規性は、効率を「後付けの指標」ではなく「最初からの設計制約」に据えた点にあります。エネルギー、FLOPs、レイテンシ、ドルコストを精度と同列の制約として扱う評価の仕組みを備え、ノートパソコンをバッテリー駆動で使う現実に正面から向き合っています。消費電力は趣味の問題ではなく、手元で動かすうえでの死活問題だからです。

読者のみなさんにとっての実利は明快です。メールの仕分け、朝のブリーフィング、手元の論文やメモを横断する調べもの、コード生成といった作業を、データを外部へ送らずに完結できます。iMessage、Telegram、WhatsAppなど普段使うメッセージ基盤と連携しつつ、文書やメッセージ、設定はすべて自分の端末に留まる点が、クラウド型との決定的な違いになります。

ポジティブな側面は、プライバシー、低遅延、ランニングコストの圧縮という三拍子がそろうことです。一方で、限界も冷静に見ておきたいところです。先ほどの88.7%という数字は裏を返せば、約1割の高度なクエリでは依然としてクラウド級のモデルに分があることを示唆します。端末の処理能力に性能が縛られる以上、最先端の巨大モデルと真正面から張り合う用途には向きません。2026年3月に登場したばかりで、長年の運用知見を積んだCrewAIのような既存フレームワークと比べると、エコシステムの成熟度では見劣りする点も、現時点での正直なところでしょう。

規制や社会的な文脈で見ると、ローカルファーストはデータ保護規制との相性が良い設計です。個人データを端末外へ出さない構えは、各国のプライバシー法制が厳格化するなかで追い風になりえます。同時に、すべてが手元で完結するということは、不適切利用の監視がクラウド事業者の手を離れることも意味します。利便性と説明責任のバランスは、これから議論が深まる論点になるはずです。

長期的に見れば、1970〜80年代にコンピューティングがメインフレームからパソコンへ移ったのと同じ転換が、AIにも訪れるのか――開発チーム自身がその歴史的アナロジーを掲げています。PyTorchのように、ローカルAIの研究基盤であると同時に実運用の土台でもある存在を目指すという宣言は、野心的ですが筋が通っています。「知性をどこで動かすか」という問いが、これからの数年で静かに、しかし確実に書き換わっていく。その最初の一歩として、この発表を記録しておく価値は十分にあると考えます。

【用語解説】

ローカルファースト(Local-First)
データ処理を遠隔のサーバーではなく、利用者の手元の端末(パソコンやスマートフォン)で優先的に行う設計思想。プライバシー保護、低遅延、コスト削減につながる。

パーソナルAIエージェント
個人のメール、カレンダー、文書といった私的な文脈に基づいて動作し、利用者に代わってタスクをこなすAIプログラム。

Intelligence Per Watt(ワットあたりの知性)
消費電力1ワットあたりでどれだけの知的処理を行えるか、という効率の考え方。スタンフォードの同名研究では、ローカルモデルが単一ターンのクエリの88.7%を処理でき、効率が2023年から2025年にかけて5.3倍向上したと報告されている。

レイテンシ(遅延)
処理を要求してから結果が返ってくるまでの時間。クラウド経由だと通信が挟まるぶん遅延が生じやすく、ローカル処理はこれを抑えられる。

FLOPs
浮動小数点演算の回数を示す指標で、計算量の大きさを表す。AIの処理負荷を測るものさしのひとつである。

プリセット
あらかじめ設定が組み合わされた雛形。OpenJarvisでは「朝のブリーフィング」「ファイル横断リサーチ」など、すぐ使える構成が用意されている。

【参考リンク】

OpenJarvis(スタンフォードSAIL公式ブログ)(外部)
開発元による解説。5つのプリミティブや設計思想、研究の背景を詳述した一次情報である。

OpenJarvis(GitHubリポジトリ)(外部)
ソースコードとインストール手順を公開する公式リポジトリ。Apache 2.0ライセンスで提供される。

OpenJarvis 公式ドキュメント(外部)
CLIやSDKの使い方、対応する推論エンジンの一覧などを掲載した公式ドキュメントである。

Ollama 公式サイト(外部)
ローカルでLLMを動かすためのツール。OpenJarvisの推論エンジンとして標準対応している。

Scaling Intelligence Lab(スタンフォード)(外部)
OpenJarvisを開発した研究室。AIシステムの効率と拡張性について研究している。

Hazy Research(スタンフォード)(外部)
OpenJarvisを共同開発した研究グループ。「Intelligence Per Watt」研究の母体でもある。

【参考記事】

OpenJarvis: Personal AI, On Personal Devices(Scaling Intelligence Lab)(外部)
開発元による一次情報。88.7%・5.3倍という数値の出典であり、5つのプリミティブやPyTorchになぞらえた目標を詳述している。

OpenJarvis(GitHubリポジトリ説明)(外部)
88.7%・5.3倍の数値を提示し、約3分でセットアップできる手順や対応エンジン、プリセットを記載している。

Stanford Researchers Release OpenJarvis(MarkTechPost)(外部)
5つのプリミティブの観点からOpenJarvisを技術解説し、複数の入り口やオフライン動作を整理している。

Local-First AI Agents: OpenJarvis for On-Device Performance(NeuroTechNus)(外部)
88.7%・5.3倍の数値を引用し、ローカル処理がプライバシーや遅延の面で勝る理由を解説している。

OpenJarvis Review 2026(ComputerTech)(外部)
主要著者やCrewAIとの比較を扱ったレビュー。2026年3月の登場時期や対応バックエンドの広さを確認した。

【編集部後記】

正直に言うと、私が最初にこのニュースに惹かれたのは「Jarvis」という名前でした。映画に出てくる、主人公をそっと支える優秀なAIアシスタント――いよいよあんな存在が、自分のパソコンの中に住むのかもしれない。そんな小さなワクワクからでした。

でも調べていくうちに、この話の本質は華やかさではなく、もっと静かな問いにあると気づきました。「自分の一番プライベートな情報を、どこに預けるのか」という問いです。便利さと引き換えに、私たちは無意識のうちに多くを差し出してきたのかもしれません。

もちろん、ローカルファーストがすべてを解決する魔法ではありません。性能の限界も、使いこなす難しさもあります。それでも、選択肢が私たちの手元に戻ってくること自体に、私は希望を感じています。みなさんは、どう感じられたでしょうか。よければ、その声を聞かせてください。

Googleで優先するソースとして追加するボタン
投稿者アバター
TaTsu
『デジタルの窓口』代表。名前の通り、テクノロジーに関するあらゆる相談の”最初の窓口”になることが私の役割です。未来技術がもたらす「期待」と、情報セキュリティという「不安」の両方に寄り添い、誰もが安心して新しい一歩を踏み出せるような道しるべを発信します。 ブロックチェーンやスペーステクノロジーといったワクワクする未来の話から、サイバー攻撃から身を守る実践的な知識まで、幅広くカバー。ハイブリッド異業種交流会『クロストーク』のファウンダーとしての顔も持つ。未来を語り合う場を創っていきたいです。