Google 「Project Jarvis」:人間のようにブラウザを操作するAIアシスタント、2024年12月発表へ

 - innovaTopia - (イノベトピア)

Googleは「Project Jarvis(プロジェクト・ジャービス)」と呼ばれる新しいAIシステムを開発中で、2024年12月に発表を予定している。

このAIシステムの主な特徴は以下の通り:

  • Google Chrome専用のAIエージェントとして開発されている
  • 次世代版Gemini AIモデルを基盤技術として使用する
  • ウェブブラウザを自動操作し、以下のタスクを実行可能
    • オンラインショッピング
    • 航空券の予約
    • リサーチ作業
    • テキスト入力
    • ボタンのクリック

現在の開発状況:

  • 各アクション間に数秒の処理時間を要する
  • 12月の発表時には限定ユーザーによるテストから開始予定

競合状況:

  • Microsoft:Copilot Visionを開発中
  • Apple:Apple Intelligenceを開発中
  • Anthropic:Claude AIで類似機能をすでに提供開始
  • OpenAI:独自の自動化AIアシスタントを開発中

この情報は2024年10月26日にThe Informationが最初に報じ、その後The Vergeなど主要テックメディアが報道している。

編集部解説

Googleが開発中のProject Jarvisは、これまでのAIアシスタントとは一線を画す革新的な取り組みといえます。従来のAIは情報の提供や会話に特化していましたが、Jarvisはウェブブラウザを実際に操作するという点で大きく異なります。

特筆すべきは、このシステムがスクリーンショットを介してブラウザの状態を理解し、実際のユーザーのように操作を行うアプローチです。これは、既存のAPIやプラグインに依存せずにウェブサイトを操作できることを意味します。

現在の開発段階では各アクション間に数秒の遅延があるとされていますが、これはAIが「考える時間」を必要としているためです。この「思考」プロセスは、人間のような意思決定を模倣しているという点で興味深い特徴といえます。

しかし、このような自動化技術には重要な課題も存在します。特にセキュリティとプライバシーの観点から、クレジットカード情報やパスワードなどの機密データをAIシステムに委ねることへの懸念があります。

また、このような技術は労働市場にも大きな影響を与える可能性があります。特に、データ入力やウェブリサーチなどの定型業務を行う職種への影響が予想されます。

一方で、この技術は高齢者や障がいを持つ方々のデジタルアクセシビリティを大きく向上させる可能性も秘めています。複雑なウェブサイトの操作を簡単な指示で実行できるようになれば、デジタルデバイドの解消に貢献できるでしょう。

興味深いのは、GoogleがChromeブラウザに特化してこの開発を進めている点です。これは、ブラウザ市場でのGoogleの優位性をさらに強化する戦略とも考えられます。

今後は、Microsoft、Apple、Anthropicなど他社の類似技術との競争が活発化すると予想されます。この競争は、AIによるコンピュータ操作の標準化や、より使いやすいインターフェースの開発が促進されるでしょう。

参考情報

主要な用語解説

  • Jarvis(ジャービス):映画「アイアンマン」に登場するAIアシスタント。Googleが新プロジェクトの名称として採用。
  • マルチモーダルAI:テキスト、画像、音声、動画など、複数の形式のデータを同時に処理できるAI技術。
  • スクリーンショット解析:画面のキャプチャ画像からボタンや入力欄などの要素を認識し、操作する技術。

関連企業・サービス

  1. Google Gemini(外部)
    Googleの最新AI言語モデル。マルチモーダル処理が特徴。
  2. Microsoft Copilot Vision(外部)
    Microsoftのウェブブラウザ操作支援AI。
  3. Anthropic Claude(外部)
    コンピュータ操作が可能なAIアシスタント。

参考動画

GeminiのAIモデルについての説明動画

【関連記事】

ホーム » AI(人工知能) » AI(人工知能)ニュース » Google 「Project Jarvis」:人間のようにブラウザを操作するAIアシスタント、2024年12月発表へ