advertisements

Google DeepMind、ゲノムの98%を解析するAI「AlphaGenome」公開、がん研究に革新

Google DeepMindは2026年1月28日、疾患の遺伝的要因を特定するAIツールAlphaGenomeを発表した。AlphaGenomeは遺伝子がいつ、どの細胞で、どの程度スイッチオンになるかを制御する変異の影響を予測する。

ヒトゲノムは30億対の塩基対で構成され、約2%がタンパク質生成を指示し、残りの98%が遺伝子活動を調整している。このAIは一度に最大100万文字のDNAコードを分析可能で、ヒトとマウスの遺伝学データベースで訓練された。

DeepMindチームは、このツールが神経細胞や肝細胞などの組織発達に不可欠な遺伝子コードの特定や、がんなどの疾患を引き起こす重要な変異の特定に役立つと考えている。

ブリティッシュコロンビア大学のCarl de Boer氏は、AlphaGenomeが変異の影響を特定し、対抗薬剤の開発につながる可能性を指摘した。UCLのMarc Mansour氏はがん研究における段階的変化と評価し、エクセター大学のGareth Hawkes氏は非コードゲノム領域の理解における大きな前進と述べた。

From: 文献リンクGoogle DeepMind launches AI tool to help identify genetic drivers of disease

【編集部解説】

Google DeepMindは生命科学分野で再び大きな一歩を踏み出しました。2024年のノーベル化学賞を受賞したタンパク質構造予測AI「AlphaFold」の成功に続き、今度はヒトゲノムの98%を占める「遺伝子制御領域」の解読に挑む新しいAIツールAlphaGenomeを発表したのです。

ヒトゲノムは30億対の塩基配列から構成されていますが、実際にタンパク質の設計図となっているのはわずか2%に過ぎません。残りの98%は長らく「ジャンクDNA」と呼ばれていましたが、現在ではこの領域が遺伝子のオン・オフを制御する重要な役割を担っていることが判明しています。心臓病、自己免疫疾患、精神疾患、そして多くのがんは、この制御領域の変異と関連していることが分かっています。しかし、膨大な塩基配列の中から疾患の原因となる変異を特定することは、これまで極めて困難でした。

AlphaGenomeの最大の特徴は、一度に最大100万文字のDNA配列を単一塩基解像度で分析できることです。従来の最先端モデルであるBorzoiは50万塩基対を32文字の「ビン」単位で処理していましたが、AlphaGenomeは文字通り「1文字単位」で正確な予測を行います。これは、DNAの「近所」を指し示すのではなく、「正確な1文字」を特定できることを意味します。

Nature誌に掲載された論文によれば、AlphaGenomeは24種類のゲノム予測ベンチマークのうち22項目で既存の最高性能モデルを上回りました。変異効果予測においても、26項目中25項目で最高性能を達成しています。特に細胞特異的な遺伝子発現予測では、Borzoiと比較して17.4%の性能向上を実現しました。

このAIはENCODE、GTEx、4D Nucleome、FANTOM5といった大規模な公開データベースで訓練され、遺伝子の開始位置や終了位置、スプライシング部位、RNA産生量、DNA塩基のアクセシビリティ、クロマチンの近接性、転写因子の結合部位など、数千種類の分子特性を同時に予測できます。

実用面では、がん研究において特に大きな可能性を秘めています。ユニバーシティ・カレッジ・ロンドン(UCL)の小児血液腫瘍学臨床教授Marc Mansour氏は、がん細胞と正常細胞のゲノムを比較すると数千もの変異が見つかるが、どれが実際に機能的な影響を持つのかを判断することは非常に困難だと指摘します。AlphaGenomeは影響度の高い変異をランク付けし、研究者がフォローアップ研究に集中できるようにします。

また、希少疾患の診断や新しい遺伝子治療の設計にも応用が期待されています。例えば、神経細胞では特定の遺伝子をオンにするが筋肉細胞ではオフにする、といった全く新しいDNA配列を設計することも可能になります。脊髄性筋萎縮症や嚢胞性線維症などの希少疾患の一部は、RNAスプライシングのエラーによって引き起こされますが、AlphaGenomeはこのスプライシング部位の位置と発現レベルを直接モデル化できる初のAIとなりました。

ただし、限界もあります。10万塩基対以上離れた制御要素の影響を正確に捕捉することはまだ難しく、細胞や組織特異的なパターンの把握も改善の余地があります。また、AlphaGenomeは個人のゲノム全体から形質を予測するようには設計されておらず、あくまで個々の遺伝子変異の影響を評価するツールです。複雑な疾患は発生過程や環境要因も関与するため、遺伝子変異だけで全てを説明できるわけではありません。

DeepMindはこのモデルを非商用利用に限り科学コミュニティに公開する方針を明らかにしました。研究者は自身のデータセットでモデルを微調整し、独自の研究課題に適応させることができます。AlphaFoldが2年間で200万人以上の研究者に利用され、科学的発見を加速させたように、AlphaGenomeもまた生命科学の新たな地平を切り開く基盤となることが期待されます。

AlphaFoldがタンパク質の「形」を予測したように、AlphaGenomeは遺伝子の「制御」を予測します。この二つのツールが組み合わさることで、DNAの配列から生命現象を理解する包括的なフレームワークが構築されつつあります。

【用語解説】

非コーディングDNA(ジャンクDNA)
ヒトゲノムの約98%を占める、タンパク質をコードしない領域。かつては機能のない「ジャンク」と考えられていたが、現在では遺伝子のオン・オフを制御する重要な役割を担っていることが判明している。

塩基対(base pair)
DNAの基本単位。アデニン(A)とチミン(T)、グアニン(G)とシトシン(C)がそれぞれ対を形成する。ヒトゲノムは約30億塩基対で構成される。

遺伝子制御(gene regulation)
遺伝子がいつ、どこで、どの程度発現するかを制御するメカニズム。転写因子や調節領域が関与し、細胞の分化や機能に不可欠。

RNAスプライシング
遺伝子から転写されたRNA前駆体から不要な部分(イントロン)を切り出し、必要な部分(エクソン)を連結する過程。このエラーが疾患を引き起こすことがある。

QTL(量的形質遺伝子座)
身長や血圧など連続的に変化する形質に影響を与える遺伝子領域。eQTL(発現QTL)は遺伝子発現量に影響を与える変異を指す。

ベンチマークテスト
AIモデルの性能を標準化されたテストセットで評価する手法。AlphaGenomeは24/26タスクで既存モデルを上回る性能を示した。

【参考リンク】

AlphaGenome: AI for better understanding the genome — Google DeepMind(外部)
Google DeepMindの公式ブログ。AlphaGenomeの技術詳細と応用例を解説

Advancing regulatory variant effect prediction with AlphaGenome(外部)
Nature誌掲載の査読済み論文。技術詳細と性能評価の完全版を提供

GitHub – google-deepmind/alphagenome(外部)
AlphaGenomeのAPIとドキュメント。コード例とチュートリアルを提供

The Nobel Prize in Chemistry 2024(外部)
2024年ノーベル化学賞プレスリリース。AlphaFoldの業績を詳述

ENCODE: Encyclopedia of DNA Elements(外部)
AlphaGenome訓練に使用されたゲノム機能要素データベースプロジェクト

【参考記事】

Google DeepMind unleashes new AI AlphaGenome to investigate DNA’s ‘dark matter’(外部)
非コーディングDNA解析の課題とAlphaGenomeの技術的ブレークスルー、100万塩基対の長配列処理能力について詳述

DeepMind’s latest AI tool makes sense of changes in the human genome(外部)
AlphaGenomeがAlphaFoldの成功を基盤に、遺伝子制御の複雑性に挑戦する過程を解説

DeepMind releases AlphaGenome source code(外部)
AlphaGenomeのソースコード公開と非商用利用の意義、創薬開発への応用可能性を分析

DeepMind’s AlphaGenome Breakthrough: Decoding the 1-Million-Letter Language(外部)
Borzoiとの技術比較、ハイブリッドアーキテクチャの詳細を解説

Nature Reports: Google’s New Model Understands DNA Variations(外部)
ベンチマークテストの詳細な数値データ。eQTL予測で25.5%、aQTL予測で8%の性能向上を報告

【編集部後記】

Google DeepMindがまた一つ、生命の根源的な謎に挑む扉を開きました。ゲノムの98%を占める「暗黒領域」の解読は、私たちがこれまで見過ごしてきた遺伝情報の大部分に光を当てることになります。がんや希少疾患の治療、個別化医療の実現に向けて、AlphaGenomeがどのような発見をもたらすのか、注目していきたいと思います。皆さんはこの技術が医療や生命科学にもたらす変化について、どのような期待や懸念を持たれますか?ぜひご意見をお聞かせください。

投稿者アバター
Satsuki
テクノロジーと民主主義、自由、人権の交差点で記事を執筆しています。 データドリブンな分析が信条。具体的な数字と事実で、技術の影響を可視化します。 しかし、データだけでは語りません。技術開発者の倫理的ジレンマ、被害者の痛み、政策決定者の責任——それぞれの立場への想像力を持ちながら、常に「人間の尊厳」を軸に据えて執筆しています。 日々勉強中です。謙虚に学び続けながら、皆さんと一緒に、テクノロジーと人間の共進化の道を探っていきたいと思います。

読み込み中…

innovaTopia の記事は、紹介・引用・情報収集の一環として自由に活用していただくことを想定しています。

継続的にキャッチアップしたい場合は、以下のいずれかの方法でフォロー・購読をお願いします。