AIエージェントに仕事を任せるとき、私たちはいつも同じ壁にぶつかります。強力なモデルはクラウドにあり、機密データをそこへ送ることへの抵抗感は根強い。かといってデバイス上のモデルだけでは、複雑な推論をこなすには力不足です。この構造的なトレードオフは、エージェントAIの業務活用を阻む見えない壁でした。
Perplexityは2026年6月2日、エージェントAIプラットフォーム「Perplexity Computer」に対し、ローカルモデルとクラウドモデルの間でタスクを自動分割する「ハイブリッド・エージェンティック推論(Hybrid Agentic Inference)」機能の追加を発表した。
この機能では、財務記録・健康情報・個人ファイルなどの機密データを含む処理はデバイス上のコンパクトモデルがローカルで実行し、より高い処理能力が求められる作業はクラウド上のフロンティアモデルに委ねる。どちらで処理するかの判断はシステムが自律的に行い、ユーザーが事前に選択する必要はない。同社はこの仕組みについて「プライベートデータをデバイス上に保持しつつ、トークン効率を最大化する」と説明している。
Perplexity Computerは、同社が提供するクラウドベースのエージェンティックAIシステム。本機能は2026年7月にリリース予定とされている。
From:
Perplexity Computer adding ability to split tasks between local and cloud models
📋 編集部注(2026年6月4日更新):発表内容に主観を置いた記事内容から「データの管理、プライバシー」を主観に据えた記事内容に変更しました。今回の発表において、エージェントが「情報をクラウドに送っても問題ないかどうか、自動で処理を行う」という新しい時代のデータ管理システムを搭載しています。
【編集部解説】
AIエージェントに仕事を任せるとき、私たちは無意識にある選択を迫られてきました。賢いモデルを使うか、データを守るか——その二択です。
強力なフロンティアモデルはクラウド上に存在します。財務記録や医療情報を含むタスクをこなしてもらうには、そのデータをサーバーに送る必要があります。一方、デバイス上で動くコンパクトなモデルはプライバシーを守れますが、複雑な推論には力不足です。この構造的なトレードオフが、エージェントAIの業務活用を阻む見えない壁になってきました。
Perplexityが発表したハイブリッド・エージェンティック推論は、その壁に対する一つの答えです。ローカルモデルが「この情報はデバイスに留めるべきか」を判断し、クラウドに送っていい処理だけをフロンティアモデルへ振り分けます。ユーザーが設定を変える必要はありません。タスクごとに、自律的に。
この発表を理解するには、Perplexityがこの半年で辿った製品の軌跡を押さえておく必要があります。
2026年2月25日、Perplexityは「Perplexity Computer」を公開しました。Claude、Gemini、GPT、Grokなど19種類のAIモデルを1つのシステムで束ね、複雑なタスクをクラウド上で自律的に実行するエージェントプラットフォームです。3月には「Personal Computer」を発表。Mac Miniなどのローカルデバイス上で動き、クラウド側のComputerにローカルファイルやアプリへのアクセスを橋渡しする仕組みです。
今回の発表が、その第三段階にあたります。クラウド側のオーケストレーションから始まり、ローカルデバイスへの橋渡しを経て、いよいよ「処理の判断そのもの」をローカルに持ち込む。Perplexityの公式ブログは、この方向性を「データセンターがあなたのマシンに移動する」と表現しています。この3段階の進化は、偶然の積み重ねではなく、プライバシーと性能の両立という一貫した設計思想の具体化として読めます。
ではなぜ、このタイミングなのでしょうか。背景には推論コストの爆発があります。
テキストの一問一答なら、トークンの消費は限られます。しかしエージェントAIは違います。検索し、ファイルを読み、ツールを呼び出し、結果を評価し、次の行動を決める。このサイクルが何十回も繰り返されます。Computex 2026でIntelが紹介したデータによれば、エージェントAIは単発の推論と比べて最大1,000倍ものトークンを消費する場合があるといいます。すべてをクラウドで賄えば、コストは際限なく膨らみます。ローカルで済む処理はローカルで——この分業の発想は、エージェントAIの経済的な持続可能性にとっても合理的な回答です。
この動きはPerplexityだけではありません。Appleは、15年にわたるカスタムシリコンの蓄積を背景にオンデバイスAIを競合優位として打ち出す方針を、WWDC 2026(6月8〜12日開催予定)に先立つ報道で示しています。デバイス上のNeural EngineとAppleシリコンのクラウドサーバーを組み合わせたPrivate Cloud Computeというハイブリッド構造で、「データはAppleにも見えない」という設計を掲げています。Gartnerの予測ではAI PCは2026年に全PC販売の55%を占め、IDCによればNPU搭載マシンは2028年までにPC設置台数の94%に達するとされています。ハードウェアの土台が整いつつある中で、「どこで処理するかの自動判断」はAIソフトウェアの次の主戦場になっていくでしょう。
もっとも、この設計が機能するかどうかは、まだわかりません。
「自動で判断する」仕組みには、固有のリスクが伴います。うまく動いているときには何も見えず、失敗したときだけ問題が顕在化する——これはあらゆる自動化に共通する構造です。ハイブリッド推論においては、ローカルモデルが「どのデータを手元に残すべきか」を誤って判断した場合、本来外に出るべきでない情報がクラウドへ流れる可能性があります。精度・誤判定の扱い・ユーザーによる上書き可能性といった詳細は、現時点では明らかにされていません。
信頼とは、透明性の積み重ねによって育まれます。「データを自分で管理しながら強力なAIを使う」という要求は、企業でも個人でも切実です。その要求に応える仕組みが本当に機能するなら、エージェントAIの普及を加速させる可能性があります。しかしその信頼をどう積み上げるかは、7月以降の実装とユーザーの反応にかかっています。
【用語解説】
ハイブリッド・エージェンティック推論(Hybrid Agentic Inference)
AIエージェントがタスクを実行する際、処理内容に応じてデバイス上のローカルモデルとクラウド上のフロンティアモデルを自動的に使い分ける仕組み。機密データを含む処理はローカルで完結させ、高い推論能力が必要な処理のみをクラウドに送ることで、プライバシー保護とAI性能の両立を図る。
フロンティアモデル
現時点で最も高い性能を持つ大規模AIモデルの総称。Claude、GPT、Gemini、Grokなどが該当する。高い推論能力を持つ一方、クラウド上での運用が前提となるため、データをサーバーに送る必要がある。
オンデバイスモデル/ローカルモデル
インターネット接続なしにデバイス上で動作するAIモデル。スマートフォンやPC内のNPU(ニューラルプロセッシングユニット)を活用して推論を実行する。フロンティアモデルより能力は限られるが、データが外部に出ないためプライバシーに優れる。
NPU(ニューラルプロセッシングユニット)
AIの推論処理に特化した半導体チップ。AppleのM・Aシリーズシリコンに搭載されるNeural Engineや、IntelのCore Ultraに内蔵されるNPUがその代表例。AI PCの普及を支えるハードウェア基盤となっている。
エージェントAI
ユーザーの指示を受けて、検索・ファイル操作・アプリ連携などを自律的に実行するAIシステム。単発の質問応答と異なり、複数ステップにわたるタスクを継続して処理する。処理ごとにトークンを消費するため、クラウド依存のシステムでは推論コストが急増しやすい。
【参考リンク】
Perplexity Computer 公式ページ(外部)
機能概要・サブスクリプション情報・対応プラットフォームを紹介する公式ページ。ProおよびMaxプラン加入者が利用可能。
「The Data Center Moves to Your Machine」— Perplexity 公式ブログ(外部)
ハイブリッド・エージェンティック推論の発表ブログ。コンセプトと技術設計を公式に解説。
「Introducing Perplexity Computer」— Perplexity 公式ブログ(外部)
2026年2月25日公開のPerplexity Computerローンチ発表。19モデルのオーケストレーションと製品思想を解説した原点となるブログ記事。
【参考記事】
Perplexity AI unveils hybrid local-cloud inference system at Computex 2026 — VentureBeat(外部)
Computex 2026でのデモ詳細を報告。製品アークの変遷(Computer → Personal Computer → Hybrid Inference)を包括的に解説。
Perplexity turns the AI PC into a cloud traffic controller — Startup Fortune(外部)
ハイブリッド推論の経済的背景を分析。エージェントAIの推論コスト問題の構造とローカル処理分担の意義を論じる。
Perplexity launches ‘Computer’ AI agent that coordinates 19 models — VentureBeat(外部)
Perplexity Computerのローンチを詳報。19モデルの仕組み、月額200ドルの料金体系、競合他社との差別化戦略を解説。
Apple to make on-device AI key WWDC focus — MacRumors(外部)
AppleがWWDC 2026でオンデバイスAIを競合優位として打ち出す方針を報告。ハイブリッド推論の業界トレンドとして文脈を共有。
On-Device AI Arrives: Edge Inference Chips Hit Consumer Hardware — AI2Work(外部)
Gartner/IDCによるAI PC普及予測と、クラウドvsローカルのレイテンシ比較を含むオンデバイスAI市場の構造解説。
【編集部後記】
「どこで処理されているか」を気にしなくていい——それは便利さの理想形かもしれません。しかし同時に、その判断の中身が自分には見えないことでもあります。自動化が進むほど、その判断の中身は見えにくくなる。
私たちは今、AIに「考える場所」を委ねようとしています。ローカルかクラウドかという選択を手放すとき、私たちは何を得て、何を手渡しているのでしょうか。7月のリリース後、この仕組みが実際にどう動くかを確かめながら、私たちも引き続き追っていきたいと思います。












