Google DeepMindは2026年2月11日、Gemini Deep Thinkシステムを使用した研究成果に関する2つの論文を公開した。論文タイトルは「Towards Autonomous Mathematics Research」と「Accelerating Scientific Research with Gemini: Case Studies and Common Techniques」である。同システムは2025年の国際数学オリンピック(IMO)で金メダル水準のパフォーマンスを達成し、国際大学対抗プログラミングコンテスト(ICPC)でも同様の結果を記録している。
1つ目の論文では数学研究エージェント「Aletheia」を紹介し、ブルームのエルデシュ予想データベースに掲載された700の未解決問題を評価、4つの未解決問題を自律的に解決した。2つ目の論文では学術専門家との協働による18の研究問題への取り組みを記録している。
成果の約半分はICLR 2026での採択を含む主要会議をターゲットにしている。
From:
DeepMind reports research-level results from Gemini Deep Think
【編集部解説】
今回のDeepMindの発表は、AIが「問題を解く」段階から「研究を行う」段階へ移行したことを示す重要なマイルストーンです。これまでのAIは高校や学部レベルの数学問題では高い精度を示してきましたが、研究レベルの問題は文献の深い理解や創造的な発想が必要で、データ不足によるハルシネーション(誤った出力)が課題でした。
Aletheiaの最大の特徴は「生成-検証-修正」という反復プロセスにあります。従来のAIが答えを一度出力して終わるのに対し、Aletheiaは自然言語で論理的欠陥を特定し、何十回も解答を洗練させます。さらに重要なのは、解決できない問題については「失敗」を明示的に報告できる点です。この正直さが、人間の研究者との協働効率を大幅に向上させています。
性能面では、博士レベルの数学問題集「FutureMath Basic」で95.1%の精度を達成しました。ただし、これは解答した問題に限定した条件付き精度であり、全体の60%未満の問題にしか解答していません。つまりAletheiaは「解けない問題を認識する能力」と「解ける問題での高精度」を両立させているのです。
実際の研究成果として、算術幾何学における固有重みの計算を完全自律で行い、論文として発表しました。またエルデシュ予想データベースの700問を評価し、4つの未解決問題を自律的に解決しています。エルデシュ問題は組合せ論の巨匠ポール・エルデシュが残した1000問以上の難問群で、その多くが数十年未解決のままです。
人間-AI協働の事例も注目に値します。2015年に提案された予想を反証する反例の構築や、機械学習最適化における適応的ペナルティメカニズムの理論的説明など、18の研究問題に取り組んでいます。これらの成果の約半分はICLR 2026などの主要国際会議への投稿を目指しており、AI支援研究が学術コミュニティで正式に評価される時代が到来しつつあります。
一方で、AI支援研究にはリスクも存在します。大規模な文献探索における「無意識の盗作」の可能性や、問題の「オープン」ステータスが難易度ではなく単に文献の見落としによるものだったケースも指摘されています。今後は、AIが生成した研究成果の独創性検証や、既存研究との関連性を適切に評価する仕組みが不可欠になるでしょう。
長期的には、証明支援ソフトウェアへの統合が予想されており、AIがリアルタイムで提案や妥当性チェックを提供する未来が見えてきました。人間と機械の知性の境界が曖昧になることで、数学的発見のスピードは飛躍的に加速する可能性があります。しかし同時に、「研究とは何か」「独創性とは何か」という根本的な問いにも向き合う必要が出てくるはずです。
【用語解説】
Gemini Deep Think
Googleが開発した高度な推論機能を持つAIシステム。複雑な問題に対して段階的に思考を深め、解答の質を高める機能を備える。2025年に国際数学オリンピックで金メダル水準を達成した。
IMO(国際数学オリンピック)
毎年開催される高校生向けの国際数学競技大会。各国から選抜された生徒が難易度の高い数学問題に挑戦し、世界中の数学的才能が競い合う場として知られる。
ICPC(国際大学対抗プログラミングコンテスト)
大学生を対象とした世界最大規模のプログラミング競技大会。チームで複雑なアルゴリズム問題を解き、プログラミング能力と問題解決能力を競う。
Aletheia
DeepMindが開発した数学研究エージェントの内部コードネーム。ギリシャ語で「真理」を意味する。生成-検証-修正の反復プロセスを通じて研究レベルの数学問題に取り組む。
エルデシュ予想
ハンガリーの数学者ポール・エルデシュが生涯にわたって提示した1000問以上の数学的予想や問題。組合せ論、数論、グラフ理論など幅広い分野にわたり、多くが未解決のまま残されている。
ハルシネーション
AIが事実に基づかない情報を生成する現象。「幻覚」とも訳される。特に学習データに含まれない専門的な内容や、データ不足の領域で発生しやすい。
FutureMath Basic
博士レベルの数学問題を集めたベンチマークデータセット。研究レベルのAIの能力を評価するために設計されており、従来の学生レベルのベンチマークよりも高度な問題を含む。
算術幾何学
数論と代数幾何学を融合した数学の分野。整数や有理数の性質を幾何学的な手法で研究する。現代暗号理論の基礎にもなっている。
劣モジュラ最適化
集合関数の特殊なクラスである劣モジュラ関数を扱う最適化問題。機械学習、ネットワーク設計、データマイニングなど幅広い応用がある。
【参考リンク】
Google DeepMind公式ブログ(外部)
GoogleのAI研究部門DeepMindの公式ブログ。最新の研究成果、技術解説、プロジェクトの進捗状況を発信している。
ICLR(International Conference on Learning Representations)(外部)
機械学習と表現学習に関する世界有数の国際会議。深層学習やAI研究の最先端成果が発表される場として評価が高い。
arXiv.org(外部)
コーネル大学が運営するプレプリントサーバー。査読前の研究論文が公開され、研究者が最新の研究成果を迅速に共有できる。
GitHub – Erdős Problems Database(外部)
数学者テレンス・タオらが管理するエルデシュ予想のコミュニティデータベース。未解決問題の状態や進捗が記録されている。
【参考記事】
Gemini Deep Think: Redefining the Future of Scientific Discovery(外部)
Google DeepMind公式ブログ。生成-検証-修正プロセスやハルシネーション対策の詳細を解説している。
Google claims that its Gemini 3 Deep Think-based agent, ‘Aletheia’, solved unsolved mathematical problems(外部)
FutureMath Basicで95.1%の条件付き精度達成、60%未満の問題にのみ解答したことなど具体的数値を報じる。
Towards Autonomous Mathematics Research(外部)
Aletheiaの技術的詳細を記述した学術論文。生成-検証-修正ループの仕組みや性能評価が詳述されている。
Google DeepMind’s AI Solves 13 Erdős Mathematical Problems(外部)
エルデシュ問題への具体的な取り組みと、13問の解決に関する報道。証明支援ソフトウェアへの統合可能性に言及。
Semi-Autonomous Mathematics Discovery with Gemini(外部)
AI支援研究におけるリスク、特に「無意識の盗作」の可能性や文献見落としによる問題を指摘した論文。
【編集部後記】
AIが高校レベルの問題を解く時代から、未解決の研究課題に挑む時代へ。この変化は、みなさんの専門分野にも間もなく訪れるかもしれません。数学だけでなく、物理学や経済学、コンピュータサイエンスでも同様の動きが始まっています。
もし明日、あなたの仕事にAI研究パートナーが加わったら、どんな問いに挑戦したいですか?創造性や独創性の定義が変わりつつある今、私たちは「研究とは何か」を改めて考える岐路に立っているのかもしれません。一緒に、この未来について考えてみませんか。





































