Siri × Gemini × NVIDIA｜Apple「プライバシーの約束」を守るための三社連合の実態

AppleとGoogleのAIパートナーシップをめぐる舞台裏が、少しずつ明らかになってきました。「AIはオンデバイスで」を掲げてきたAppleが、なぜGoogleのクラウドに頼らざるを得ないのでしょうか——そしてそこにNVIDIAが加わることで、プライバシーの約束はどのように守られようとしているのでしょうか。

2026年5月28日、The Informationが報じたところによると、AppleはGoogleの大規模言語モデル「Gemini」を用いてオンデバイス向けの小型モデルをトレーニングしている。この「蒸留（distillation）」と呼ばれる手法により、AppleデバイスがGeminiの能力を搭載しながらもローカルで動作できる軽量モデルの開発を目指している。

一方で、The Informationの報道によれば、Geminiの完全版モデルは数兆ものパラメーターを持ち、Appleが構築してきた自社インフラ「Private Cloud Compute」では処理しきれないことが判明した。この問題への解決策として、AppleはSiriへの一部のクエリをGoogle Cloud上のGeminiで処理する方針を採ったと報告されている。

さらに注目されるのが、NVIDIAとの関係だ。Appleはここ数週間のうちに、NVIDIAのGPUが備えるセキュリティ機能「Confidential Compute（機密コンピューティング）」の使用を承認したとされる。この機能は、GPUを含むTEE（信頼実行環境）内でデータ処理を行い、CPU-GPU間の転送などを暗号化することで、処理中のデータとAIモデルを第三者から保護するもので、Googleクラウド上での処理においてもAppleのプライバシー保護の約束を維持するための技術的な根拠となっている。

Appleはこれらのクラウド処理に対しても引き続き「Private Cloud Compute」のブランドを使用する見込みだという。また同社は、デバイス上でのAI実行に特化したスタートアップ「Liquid AI（マサチューセッツ州）」の買収も検討していると報じられている。

From: New details on Apple-Google AI deal revealed, including Nvidia chips: report

【編集部解説】

Appleが抱える「大きすぎるモデル」問題

今回の報道の核心は、Appleが2024年のWWDCで高らかに掲げた約束——「クラウドに送るクエリはすべて、Apple Siliconで動く自社インフラ（Private Cloud Compute）で処理する」——が、静かに書き換えられつつあるという事実です。

Private Cloud Compute（PCC）は2024年のWWDCでAppleが発表したクラウドAI処理の仕組みです。iOSとmacOSをベースに構築された専用OSと、カスタムApple Siliconを搭載したサーバーを組み合わせることで、クラウド処理においても「データはAppleも含め誰も見られない」というプライバシー保証を実現しようとするものでした。

問題は、The Informationが報じるところでは、Geminiの完全版モデルが「数兆ものパラメーター」を持つ巨大なモデルであり、このPCCインフラ上では動かしきれなかったという点です。PCCはカスタムApple Siliconで構築されていますが、そのメモリ帯域幅・処理スループット・スケールアウト設計は、NVIDIA H100のような汎用データセンター向けGPUクラスターとは設計思想が根本的に異なります。数兆パラメーター級のモデルを処理するために必要な絶対的なスループットとメモリ規模において、Apple自社インフラの現行構成では対応できなかった可能性があります。

NVIDIAが「橋渡し」する技術的矛盾

この問題への解決策として浮上したのが、Google CloudとNVIDIAのAIチップの組み合わせです。Appleは「ここ数週間のうちに」NVIDIAのGPUが持つ「Confidential Compute（機密コンピューティング）」と呼ばれるセキュリティ機能の使用を承認したとされています。

Confidential Computingとは、GPUを含むTEE（信頼実行環境）内でデータ処理を行い、CPU-GPU間の転送やコマンドなどを暗号化することで、処理中のデータとAIモデルを第三者から保護する技術です。NVIDIAのHopperアーキテクチャ（H100など）から搭載されており、クラウドプロバイダーの管理者でさえ、処理中のデータにアクセスできない状態を作り出します。

「処理がわずかに遅くなる」と元記事（The Information）は記していますが、実際の性能影響については研究ごとに知見が異なります。IEEEに掲載された研究ではCC有効時の最大93%のスループット低下を報告している一方、最適化により28.1%未満に抑制可能とする知見も同論文に示されています。また、LLM推論の典型的なクエリでは7%未満のオーバーヘッドにとどまるという別の研究もあります。ワークロードの種類によって影響の大きさが大きく異なる技術であるため、Appleのユースケースでの実際の影響は現時点では確認できません。

いずれにせよ、Appleがこの技術を採用したことは、「Googleのクラウドを使いつつも、プライバシーの約束を技術的に担保する」という矛盾を解消するための現実的な選択だったと言えるでしょう。Apple独自の「コンフィデンシャルコンピューティング」をNVIDIAのGPU上で実現する——これは形は変わっても、精神は引き継ごうとする試みです。

「Private Cloud Compute」という名前が示すもの

注目すべきは、Appleが今後も「Private Cloud Compute」というブランド名を使い続けると報じられている点です。Apple自身のサーバーだけで動かなくなるにもかかわらず、です。

ブランドを維持することへの動機は理解できます。PCCという名称は、今やAppleのプライバシーコミットメントそのものを指すブランドとして認知されています。名前を変えることは、「何かが変わった」というシグナルになり、ユーザーの不安を呼びかねません。しかしながら、処理基盤が根本から変わっているにもかかわらず同じ名称を使い続けることは、プライバシーポリシーの透明性という観点からは議論を呼ぶ可能性があります。Appleが今後どのような説明をWWDCで行うのかは、注目すべき点のひとつです。

蒸留とオンデバイス——もう一つの戦線

クラウド側の話と並行して進んでいるのが、オンデバイスAIの強化です。Appleは、Googleの大規模Geminiモデルを「教師モデル」として使い、Appleデバイス上でローカル実行できる小型モデルを訓練する「蒸留（Distillation）」という手法を採っています。

蒸留とは、巨大なモデルが持つ知識を、はるかに小さなモデルに「蒸留して移し取る」技術です。大きなモデルの出力を正解ラベルとして小型モデルを学習させることで、パラメーター数の割に高い性能を引き出せます。Googleのように巨大なモデルを自前で開発することはできないAppleが、それを「素材」として使い、自社デバイスで動かせる独自モデルを育てるという戦略は、合理的です。

この戦略の延長線上に、Liquid AI買収検討の報道もあります。Liquid AIは、MITのスピンオフとして2023年に設立された、オンデバイスAIに特化したスタートアップです。独自の「Liquid Foundation Models（LFMs）」と呼ばれるアーキテクチャを持ち、スマートフォンやノートPC、組み込みデバイスといったエッジ環境で、翻訳やデータ抽出など特定タスクにおいてGPT-4oクラスの性能を発揮する小型モデルを動かすことを目指しています。もし買収が実現すれば、オンデバイスAIの競争力を一気に強化する可能性があります。

Apple・Google・NVIDIAの「三社連合」が示す業界の構造変化

今回の報道が持つより大きな意味は、AI業界の構造に関わります。

かつてAppleは「すべて自前で」というハードウェアとソフトウェアの垂直統合を最大の強みとしてきました。しかし今回の構図を見ると——モデルはGoogleから、クラウドインフラはGoogle Cloud、プライバシー技術の核心部分はNVIDIA——と、複数の外部プレイヤーへの依存が明確に生じています。

これはAppleが「負けを認めた」のではなく、生成AIの規模が、単一企業が全スタックを自社で賄える限界を超えつつあることを示しているとも読めます。実際、Appleほどのリソースを持つ企業でさえ、Gemini全体をApple自社インフラで動かしきれないという現実は、大規模言語モデルのコンピューティング要求の桁外れな大きさを改めて示しています。

WWDCは6月8日（日本時間9日午前2時）から始まります。Appleがこの複雑な三社体制をユーザーにどう説明し、プライバシーへの信頼をどのように維持しようとするのか——その言葉と姿勢に注目したいと思います。

【用語解説】

蒸留（Distillation / Knowledge Distillation）
大規模な「教師モデル」が持つ知識を、小規模な「生徒モデル」に転移させる機械学習の技術。教師モデルの出力（正解ラベルだけでなく確率分布ごと）を使って生徒モデルを学習させることで、パラメーター数の割に高い性能を引き出せる。スマートフォンなど計算資源の限られたデバイスでAIを動かすための重要な手法。2015年にGeoffrey Hintonらが論文「Distilling the Knowledge in a Neural Network」で発表。

Confidential Compute（機密コンピューティング）
NVIDIAのGPU（H100以降のHopperアーキテクチャ）に搭載されたハードウェアレベルのセキュリティ機能。GPUを含むTEE（信頼実行環境）内でデータ処理を行い、CPU-GPU間の転送やコマンドバッファなどを暗号化することで、クラウドプロバイダーの管理者を含む第三者が処理中のデータにアクセスできない状態を作り出す。Trusted Execution Environment（TEE：信頼実行環境）の一実装。

Private Cloud Compute（PCC）
Appleが2024年のWWDCで発表したクラウドAI処理の仕組み。Apple Siliconを搭載したカスタムサーバーとiOS/macOSベースの専用OSを組み合わせ、クラウドで処理する場合でもユーザーデータを暗号化・無保持化することでプライバシーを担保する。ユーザーのデバイスはサーバーのソフトウェアが公開検証可能な状態でなければ通信を拒否する設計。

パラメーター（Parameter）
AIモデルの「知識」を格納する数値の集合。学習によって調整され、パラメーター数が多いほど一般的に表現力が高いが、推論に必要な計算量とメモリも増大する。The Informationの報道によれば、Geminiの完全版は「数兆」のパラメーターを持つとされ、現行のApple自社インフラでの処理が困難な規模。

Liquid AI
2023年設立のMITスピンオフ。マサチューセッツ州に拠点を置き、スマートフォンやノートPC、組み込みデバイスなどエッジ環境で動作する効率的なAIモデル「Liquid Foundation Models（LFMs）」の開発を専門とする。独自のアーキテクチャにより、大規模モデルと比較して少ないパラメーター数で高い性能を実現することを目指している。

【参考リンク】

Apple Intelligence and Privacy — Apple（日本語）（外部）
AppleがApple Intelligenceのプライバシー設計についてまとめた公式概要資料。オンデバイス処理とPrivate Cloud Computeの役割分担を説明。

Private Cloud Compute — Apple Security Research Blog（外部）
2024年WWDC時にAppleが公開したPCCの技術詳細。設計原則、プライバシー保証の仕組み、検証可能な透明性についての一次資料。

NVIDIA Confidential Computing — NVIDIA H100（外部）
NVIDIA HopperアーキテクチャにおけるConfidential Computingの公式説明。H100が世界初のCC対応アクセラレーターであることを解説。

Liquid AI 公式サイト（外部）
Appleが買収を検討していると報じられたMITスピンオフ。オンデバイスAIに特化した独自アーキテクチャのLFMを開発・提供。

Apple WWDC 2026 — Apple公式プレスリリース（外部）
WWDC 2026の公式スケジュール。6月8日（日本時間6月9日午前2時）のキーノートでApple Intelligenceの次世代機能が発表される予定。

Google Gemini モデルファミリー（外部）
AppleとのAIパートナーシップの核心をなすGoogleの大規模言語モデルファミリーの公式ページ。

【参考記事】

Apple to Renew Push for AI That Runs on Devices, Instead of the Cloud — The Information（外部）
本記事の一次ソース。Aaron Tilley記者によるWWDC前の包括的な報道。Apple × Google × NVIDIAの三社連携の技術的詳細を初報。（購読必要）

Report: Apple Plans to Make On-Device AI a Key WWDC Focus — MacRumors（外部）
The Informationのレポートを整理・補足した解説記事。PCCとGoogle Cloudの関係や、元のApple Intelligence発表との差異を丁寧にまとめている。

Apple confirms Gemini-powered Siri will use Private Cloud Compute — 9to5Mac（外部）
2026年1月のApple決算発表時にTim Cookが発言した事実を伝えた記事。今回の報道の背景となるAppleの公式姿勢を理解するための文脈資料。

Private Cloud Compute: A new frontier for AI privacy in the cloud — Apple Security Research（外部）
2024年にAppleが公開したPCCの技術詳細。編集部解説で参照したPCCの設計思想と当初の「Apple Siliconのみ」という約束の一次資料。

Performance Analysis and Optimization of Nvidia H100 Confidential Computing for AI Workloads — IEEE Xplore（外部）
H100のConfidential Computing有効時の性能影響を分析した学術論文。最大93%のスループット低下を報告しているが、最適化により28.1%未満に抑制可能とする研究。

【編集部後記】

「プライバシーを守る」という約束と、「最高のAIを届ける」という欲求——Appleが今回直面しているのは、この二つの間に生じた摩擦です。Apple Silicon上だけで処理する、という当初の設計が、Geminiという巨大なモデルの前に壁にぶつかりました。その解として、NVIDIAの暗号化技術を借りてGoogleのクラウドを使う。これは後退なのか、それとも現実的な進化なのでしょうか。私たちにはまだ判断がつきません。ただ、6月8日のキーノートでAppleがどんな言葉を選ぶのか、静かに注目しています。