ハーバード大学医学部とバルセロナのゲノム制御センター(CRG)の研究チームは、希少疾患の診断を支援するAIモデル「popEVE」を開発し、Nature Genetics誌に発表した。
popEVEは数十万種の生物種からの進化データと、UK BiobankおよびgnomADの遺伝データを組み合わせ、約20,000のヒトタンパク質全体で変異の重症度をランク付けできる。研究チームは31,000以上の家族の遺伝データで検証を行い、popEVEは98%のケースで原因変異を正しく特定し、DeepMindのAlphaMissenseを上回る性能を示した。
popEVEは発達障害と関連付けられていなかった123の新規遺伝子を発見し、そのうち104は1人または2人の患者でのみ観察された。このモデルは患者の遺伝情報のみで診断が可能で、資源が限られた医療システムでも迅速かつ低コストな診断を実現する。
From:
AI learns from the tree of life to support rare disease diagnosis
【編集部解説】
このAIモデルpopEVEが注目される理由は、希少疾患診断における根本的な課題を解決する可能性を秘めているからです。現在、希少疾患患者の約50%が明確な診断を受けられず、「診断オデッセイ」と呼ばれる長い診断の旅を余儀なくされています。popEVEは、この問題に対して進化論的アプローチという独自の切り口から挑んでいます。
従来のAI診断ツールとpopEVEの決定的な違いは、変異の「重症度」を遺伝子間で比較できる点にあります。例えばAlphaMissenseのような既存の予測モデルは、遺伝子Aの変異が有害かどうかは判定できますが、遺伝子Aの変異と遺伝子Bの変異を同じスケールで比較することはできませんでした。医師が患者のゲノム全体から最も有害な変異を特定する必要がある臨床現場では、この制約が大きな問題となっていました。
popEVEは数十億年にわたる進化の記録を学習データとして活用しています。地球上の生命は既に無数の実験を繰り返しており、タンパク質がどのような変化に耐えられるか、どの変化が致命的かをテストしてきました。この膨大な「自然実験」のデータを、UK BiobankとgnomADという健康な人々の遺伝データと組み合わせることで、ヒト特有の制約を反映させた予測モデルを構築しています。
臨床現場での実用性も高く評価されています。31,000以上の家族を対象とした検証では、既に原因が特定されていたケースの98%で、popEVEが正しくその変異を最も有害なものとしてランク付けしました。さらに重要なのは、患者本人の遺伝情報だけで診断が可能という点です。従来は両親のDNAと比較する「トリオ解析」が一般的でしたが、popEVEはその必要がありません。これは資源が限られた医療環境や、両親のDNAが入手できない状況でも診断を可能にします。
研究チームは発達障害と関連付けられていなかった123の新規遺伝子を発見し、そのうち104は1人または2人の患者でのみ観察された「唯一無二」の希少疾患でした。論文のレビュー期間中に、これらのうち25遺伝子が独立した研究で疾患関連遺伝子として確認されたことは、popEVEの予測精度の高さを裏付けています。
もう一つ見逃せないのが、遺伝データベースにおける人種的偏りへの対処です。既存の遺伝データベースはヨーロッパ系祖先を持つ人々に偏っており、他のツールは単に「見たことがない変異」というだけで病原性とフラグ付けしてしまう問題がありました。popEVEはすべての人類の変異を平等に扱う設計により、偽陽性を減らし、より公平な診断を実現しています。
将来的な影響として、popEVEは新薬開発のターゲット特定にも活用できます。疾患を引き起こす遺伝子変異を高精度で特定できれば、その変異がどのようにタンパク質機能を破壊するかを理解し、それを標的とした治療薬の開発が加速します。また、出生前診断や新生児スクリーニングへの応用も視野に入ります。
ただし、popEVEにも限界があります。このモデルはタンパク質を変化させるミスセンス変異のみを解釈し、他のタイプの変異(ナンセンス変異や欠失など)はカバーしていません。また、AIモデルはあくまで臨床判断を補助するツールであり、医師の専門知識と病歴分析を置き換えるものではありません。
ゲノム医療が普及する中で、popEVEのような解釈ツールの需要は今後さらに高まるでしょう。特に、世界中で患者が一人しかいないような超希少疾患に対しても診断の道を開く点は、医療の民主化という観点からも極めて重要な進展といえます。
【用語解説】
popEVE(Population-aware EVE)
進化データと人口統計データを組み合わせた変異予測AIモデル。約20,000のヒトタンパク質全体で変異の重症度を統一的にランク付けできる初のツールである。
ミスセンス変異
DNA配列の1塩基が変化し、タンパク質を構成するアミノ酸が別のアミノ酸に置き換わる変異。病原性のあるものと無害なものが混在しており、その判別が診断上の課題となっている。
プロテオーム
生物が持つタンパク質の全体像を指す。ヒトの場合、約20,000種類のタンパク質がゲノムにコードされており、popEVEはこの全体を対象に変異評価を行う。
トリオ解析
患者本人と両親の遺伝情報を比較する遺伝子診断手法。popEVEは患者単独のデータで診断可能なため、この手法が不要となる。
診断オデッセイ
希少疾患患者が正確な診断を受けるまでに何年もかかり、複数の医療機関を転々とする状況を指す医療用語。
【参考リンク】
Centre for Genomic Regulation (CRG)(外部)
バルセロナに拠点を置くゲノム研究の国際的機関。popEVE開発でハーバード大学と共同研究を行った。
Harvard Medical School(外部)
popEVEプロジェクトを主導したDebora Marks博士が所属する米国の名門医学校。
Nature Genetics(外部)
popEVEの研究成果が掲載された国際的な遺伝学専門誌。査読を経た信頼性の高い論文を発表している。
UK Biobank(外部)
約50万人の英国市民から遺伝情報と健康データを収集した世界最大級のバイオバンク。
【参考記事】
New Artificial Intelligence Model Could Speed Rare Disease Diagnosis(外部)
ハーバード大学医学部の公式発表。popEVEが98%の精度を達成したことを報告。
Proteome-wide model for human disease genetics(外部)
Nature Genetics誌の原著論文。popEVEの技術的詳細とAlphaMissenseとの性能比較を掲載。
AI learns from the tree of life to support rare disease diagnosis(外部)
進化データを活用したpopEVEの仕組みと123の新規疾患遺伝子発見について解説。
【編集部後記】
ゲノム医療の進化は、私たちが想像するよりもずっと速く進んでいます。popEVEのように、進化の記録から学ぶAIが登場したことで、これまで診断がつかなかった希少疾患の患者さんに光が当たり始めています。
もし身近な方が原因不明の症状に悩んでいたら、ゲノム診断という選択肢があることを知っておくだけでも意味があるかもしれません。技術の進歩が、一人ひとりの人生を変える力を持つ時代です。みなさんは、このような医療AIの発展をどう捉えますか?期待や不安も含めて、一緒に考えていけたら嬉しいです。
























