ーTech for Human Evolutionー

Google Gemini 2.5 Pro I/O Edition、AIコーディング市場で新王者に：Claude 3.7 Sonnetを性能で上回る

AI（人工知能）ニュース

Headline News

山本達也

[公開]

2025年5月7日9:12

[更新]2025年5月7日

Google Gemini 25 Pro IO EditionAIコーディング市場で新王者にClaude 37 Sonnetを性能で上回る - innovaTopia

Googleは2025年5月6日、AIコーディングモデル「Gemini 2.5 Pro I/O Edition」（正式名称：Gemini 2.5 Pro Preview 05-06）を発表した。このモデルは3月にリリースされたGemini 2.5 Proの更新版で、Google DeepMindのCEO、Demis Hassabisは「我々が今まで構築した中で最高のコーディングモデル」と評価している。

新モデルはWebDev Arena Leaderboardで1419.95のスコアを獲得し、AnthropicのClaude 3.7 Sonnet (20250219)のスコア1357.10を上回って1位に立った。これは以前のGemini 2.5 Pro（03-25）のスコア1278.96から約221ポイント向上している。

Gemini 2.5 Pro I/O Editionは、単一のプロンプトから完全なインタラクティブウェブアプリやシミュレーションを構築する能力を持ち、コード変換、コード編集、複雑なエージェントワークフローの開発などの機能が強化されている。また、VideoMMEベンチマークでは84.8%のスコアを記録し、ビデオ理解においても最先端のパフォーマンスを示している。

このモデルは現在、Google AI StudioやVertex AIを通じて開発者向けに、またGeminiアプリを通じて個人ユーザー向けに提供されている。価格は以前のGemini 2.5 Proと同じで、入力/出力100万トークンあたり$1.25/$10となっている。これはClaude 3.7 Sonnetの$3/$15と比較して低価格である。最大100万トークン（場合によっては200万トークンまで拡張可能）のコンテキストウィンドウを持っている。

Replitの社長Michele Catastaは「能力とレイテンシーのバランスが取れた最高のフロンティアモデル」と評価し、Cognitionの開発者はバックエンドルーティングシステムの複雑なリファクタリングを成功させた最初のモデルだと述べている。

このリリースは、5月20-21日に開催予定のGoogleの年次開発者会議「Google I/O」に先立って行われたものである。

from:Meet the new king of AI coding: Google’s Gemini 2.5 Pro I/O Edition dethrones Claude 3.7 Sonnet

【編集部解説】

GoogleがGemini 2.5 Pro I/O Editionを発表したことは、AIコーディング分野における重要な転換点と言えるでしょう。この新モデルは、5月20-21日に開催予定のGoogle I/O 2025で詳細が発表される予定ですが、ユーザーからの熱烈な反応を受けて前倒しでリリースされました。

WebDev Arena Leaderboardでのスコアを見ると、Gemini 2.5 Pro I/O Editionは1499.95点を獲得し、Claude 3.7 Sonnetの1377.10点を大きく上回っています。これは以前のGemini 2.5 Pro（03-25）から約221ポイントの飛躍であり、AIコーディングモデルの性能向上のペースが加速していることを示しています。

特筆すべきは、このモデルが単一のプロンプトから完全なインタラクティブウェブアプリを構築できる能力です。これは開発者にとって大きな意味を持ちます。従来、ウェブアプリケーション開発にはHTML、CSS、JavaScriptなどの複数の言語の知識と、それらを適切に組み合わせる技術が必要でした。しかし、Gemini 2.5 Pro I/O Editionによって、テキストプロンプトだけでアプリケーションを作成できるようになり、開発の敷居が大幅に下がる可能性があります。

また、このモデルはコード変換やコード編集、複雑なエージェントワークフローの開発においても強化されています。これは単にコードを生成するだけでなく、既存のコードを理解し改善する能力も向上していることを意味します。

価格面では、Gemini 2.5 Pro I/O Editionは以前のバージョンと同じ価格設定を維持しており、入力/出力100万トークンあたり$1.25/$10となっています。これはClaude 3.7 Sonnetの$3/$15と比較して低価格であり、コストパフォーマンスの面でも優位性を持っています。また、最大100万トークン（場合によっては200万トークンまで拡張可能）という広大なコンテキストウィンドウを持っており、大規模なコードベースの処理に適しています。

しかし、ベンチマークの結果だけでAIモデルの実用性を判断することには注意が必要です。Google、Anthropic、Meta、OpenAIなどの大手テクノロジー企業は、ベンチマークでの順位を競っていますが、これらのベンチマークが実際の使用シナリオを正確に反映しているかどうかについては議論があります。

実際の開発現場では、Gemini 2.5 ProとClaude 3.7 Sonnetはそれぞれ異なる強みを持っています。Gemini 2.5 Proは速度と効率性に優れており、特にUI設計やウェブアプリ開発において卓越したパフォーマンスを発揮します。一方、Claude 3.7 Sonnetは精度と論理的思考に重点を置いており、複雑なコーディング課題での優位性を示しています。

この競争は開発者にとって朗報と言えるでしょう。AIコーディングアシスタントの進化が加速し、より使いやすく高性能なツールが開発されることで、ソフトウェア開発の生産性が向上する可能性があります。

一方で、AIによるコード生成が進化することで、プログラミングスキルの価値が変化する可能性もあります。基本的なコーディングタスクはAIに任せ、人間の開発者はより高度な設計や創造的な問題解決に集中するようになるかもしれません。

今後のGoogle I/Oでは、このGemini 2.5 Pro I/O Editionについてさらに詳細な情報が公開されると予想されます。AIコーディングの進化は、ソフトウェア開発の未来を大きく変える可能性を秘めており、私たちinnovaTopiaは引き続きこの動向に注目していきます。

【用語解説】

LLM（大規模言語モデル）:
膨大なテキストデータから学習し、人間のような文章を生成できるAIモデル。Gemini 2.5 ProやClaude 3.7 Sonnetはこの一種である。

マルチモーダル:
テキストだけでなく、画像や音声、動画など複数の形式（モード）の情報を理解・処理できる能力。

WebDev Arena Leaderboard:
ウェブアプリ開発能力に基づいてAIモデルをランク付けする第三者評価サイト。

コンテキストウィンドウ:
AIが一度に処理できる情報量。トークン数で表され、大きいほど長文や複雑な情報を処理できる。Gemini 2.5 Proは最大100万トークン（場合によっては200万トークンまで拡張可能）のコンテキストウィンドウを持つ。

トークン:
AIが処理する最小単位。英語では単語の一部や記号が1トークン、日本語では1-2文字程度が1トークンに相当する。

プロンプト:
AIに与える指示や質問のこと。料理のレシピに例えると、材料と手順を指定するようなもの。

【参考リンク】

Google DeepMind（外部）
Googleの人工知能研究部門。Geminiシリーズを開発している。

Google AI Studio（外部）
Geminiモデルを無料で試せるプラットフォーム。APIキーも取得可能。

Anthropic（外部）
Claude AIを開発する企業。元OpenAIメンバーが2021年に設立。

Gemini公式ページ（外部）
Geminiモデルの詳細情報と機能が紹介されている。

【参考動画】

【編集部後記】

AIコーディングの世界が日々進化する中、皆さんはどのようにこれらのツールを活用していますか？Gemini 2.5 Pro I/O Editionのような最新モデルは、プログラミング初心者からプロの開発者まで、創造の可能性を広げてくれます。単一のプロンプトからウェブアプリが作れる時代、次に作ってみたいものはありますか？ぜひSNSで共有してください。また、AIコーディングアシスタントを使った面白い体験があれば、ぜひ教えてください。私たちも日々新しい可能性を探求しています。

【関連記事】

AI（人工知能)ニュースをinnovaTopiaでもっと読む

AI（人工知能）ニュース

Headline News

山本達也

『デジタルの窓口』代表。名前の通り、テクノロジーに関するあらゆる相談の”最初の窓口”になることが私の役割です。未来技術がもたらす「期待」と、情報セキュリティという「不安」の両方に寄り添い、誰もが安心して新しい一歩を踏み出せるような道しるべを発信します。ブロックチェーンやスペーステクノロジーといったワクワクする未来の話から、サイバー攻撃から身を守る実践的な知識まで、幅広くカバー。ハイブリッド異業種交流会『クロストーク』のファウンダーとしての顔も持つ。未来を語り合う場を創っていきたいです。

記事一覧