Googleは2025年10月16日、腫瘍の遺伝子配列における癌関連変異をより正確に特定できるAIツール「DeepSomatic」を発表した。このツールは畳み込みニューラルネットワークを使用して、腫瘍細胞内の遺伝的変異を現在の手法よりも高い精度で特定する。
GoogleはUCサンタクルーズゲノミクス研究所および国立癌研究所と共同で、6組の腫瘍と正常細胞株ペアからなるCancer Standards Long-read Evaluation (CASTLE)データセットとベンチマークバリアントセットを作成し、公開した。
DeepSomaticはIllumina配列決定データで90%のF1スコアを達成し、次善の手法の80%を上回った。Pacific Biosciencesデータでは80%以上のスコアを記録し、次善のツールの50%未満を大きく上回った。
カンザスシティのChildren’s Mercyとの共同研究では、小児白血病の8つのサンプルを分析し、既知の変異に加えて10の新しい変異を特定した。GoogleはDeepSomaticとトレーニングデータセットの両方をオープンに公開している。
From: Google AI tool pinpoints genetic drivers of cancer
【編集部解説】
DeepSomaticの登場は、癌研究における長年の課題に対する重要な突破口です。癌細胞の遺伝子変異を正確に特定することは治療戦略の基盤となりますが、従来の手法では配列決定エラーと真の変異を区別することが困難でした。特に体細胞変異は腫瘍内に極めて低頻度で存在することがあり、その検出率が配列決定の技術的エラー率を下回るケースも珍しくありません。
このツールの技術的優位性は、挿入・欠失変異(Indels)の検出精度に顕著に表れています。Illuminaプラットフォームでは従来手法が80%だったのに対し90%を達成し、Pacific Biosciencesでは50%未満から80%超へと劇的な改善を見せました。この精度向上は、従来見逃されていた変異の発見につながり、より的確な治療選択を可能にします。
注目すべきは「腫瘍のみ」モードの実装でしょう。白血病のような血液癌では正常細胞サンプルの採取が困難ですが、DeepSomaticはこの制約下でも機能します。実際、Children’s Mercyとの共同研究では小児白血病サンプルから既知変異に加え10の新規変異を発見しており、臨床現場での実用性が実証されています。
オープンソース化された点も見逃せません。CASTLEデータセットとともに公開されたことで、世界中の研究機関が独自の改良や検証を行えます。これは癌ゲノム解析の民主化を意味し、研究開発の加速が期待されます。
一方で、AIによる変異予測には慎重さも求められます。検出された変異が実際に癌を引き起こす「ドライバー変異」なのか、単なる「パッセンジャー変異」なのかの判断には、依然として専門家の知見が不可欠です。また、FFPE保存サンプルや全エクソーム配列決定といった低品質データでも機能する点は過去の研究資産を活用できる利点がある反面、データ品質管理の重要性を改めて浮き彫りにしています。
精密医療の実現に向けて、このツールは個別化治療の選択肢を大きく広げるでしょう。しかし同時に、遺伝情報の取り扱いに関する倫理的配慮や、新規変異発見に伴う臨床試験デザインの複雑化といった新たな課題も生じています。
【用語解説】
DeepSomatic
Googleが開発した、腫瘍の遺伝子配列から癌関連変異を特定するAIツール。畳み込みニューラルネットワークを用いて、配列決定データを画像化し解析する。オープンソースで公開されている。
Indels(挿入・欠失変異)
DNA配列における塩基の挿入(Insertion)または欠失(Deletion)を指す。癌においては遺伝子の機能を大きく変化させる重要な変異タイプである。
F1スコア
機械学習モデルの性能評価指標。精度(Precision)と再現率(Recall)の調和平均で、真の変異をどれだけ正確に検出できるかを示す。
CASTLEデータセット
Cancer Standards Long-read Evaluation datasetの略。Googleと研究機関が作成した、腫瘍と正常細胞の遺伝的多様性を記録した高品質ベンチマークデータセット。
FFPE(ホルマリン固定パラフィン包埋)
組織サンプルの保存方法。ホルマリンで固定後パラフィンに包埋する標準的手法だが、DNA損傷を引き起こすため遺伝子解析が困難になる場合がある。
全エクソーム配列決定(WES)
タンパク質をコードするゲノムの約1%の領域のみを配列決定する手法。全ゲノム配列決定より低コストで、臨床現場で広く利用されている。
畳み込みニューラルネットワーク
画像認識に優れた深層学習アーキテクチャ。DeepSomaticでは遺伝子配列データを画像化し、このネットワークで変異パターンを識別する。
【参考リンク】
Nature Biotechnology(外部)
世界最高峰の生命科学・バイオテクノロジー分野の学術誌。DeepSomaticの研究論文が掲載され査読済み。
UC Santa Cruz Genomics Institute(外部)
カリフォルニア大学サンタクルーズ校のゲノミクス研究機関。CASTLEデータセット作成に貢献。
Google Research Blog(外部)
Googleの研究開発に関する公式ブログ。DeepSomaticの技術的詳細や開発背景を提供。
Children’s Mercy Kansas City(外部)
カンザスシティの小児専門病院。小児白血病サンプルの解析研究でGoogleと協力。
【参考記事】
Using AI to identify genetic variants in tumors with DeepSomatic(外部)
GoogleのKishwar Shafin氏らによる技術解説。F1スコア90%達成の詳細が記載されている。
New AI tool detects hidden cancer mutations(外部)
UC Santa Cruzによる公式発表。329,011の体細胞変異を特定したことが報告されている。
Google’s DeepSomatic AI speeds cancer genetic analysis by 10x(外部)
遺伝子解析速度を10倍に高速化した技術的インパクトと膠芽腫サンプルでの検証結果を解説。
DeepSomatic accurately identifies genetic variants in cancer(外部)
Google公式ブログによる一般向け解説。オープンソース化の意義と精密医療への貢献を説明。
Google Marks 10 Years of AI-Powered Genomics Breakthroughs(外部)
Googleのゲノミクス研究10年の歩み。DeepVariantからDeepSomaticへの進化を振り返る。
【編集部後記】
AIが癌治療にもたらす変革は、私たち一人ひとりの未来に直結しています。DeepSomaticのようなツールがオープンソースで公開されたことで、世界中の研究機関が協力し合える環境が整いました。
もし身近な方が癌治療に向き合っているなら、こうした技術の進歩が数年後にはどのような選択肢をもたらすのか、想像してみませんか。精密医療の実現は、もはや遠い未来の話ではありません。皆さんは、AIによる遺伝子解析がどこまで医療を変えると思いますか。ぜひご意見をお聞かせください。