マス・ジェネラル・ブリガム(米国マサチューセッツ州ボストン)の研究チームが、GPT-4を使用した身体診察支援に関する研究結果を2023年12月に医学人工知能ジャーナルで発表した。
研究の主要ポイント
研究チーム
- 上級著者:マーク・D・スッチ博士(MESH Incubatorエグゼクティブディレクター)
- 筆頭著者:アリヤ・ラオ(ハーバード医科大学)
- 評価者:3名の担当医
研究結果
- GPT-4は全体で80%以上の高いスコアを獲得
- 特に「運動時の脚の痛み」の症例で最高評価
- 「下腹部痛」の症例では相対的に低評価
この研究に加えて、最新の研究ではGPT-4は複雑な医療判断において人間の専門家と同等以上の性能を発揮することが判明した。具体的には、複雑な症例の52.7%を正しく診断し、医学雑誌の読者の平均36%を上回る成績を収めた。
また、放射線診断支援の分野では、乳がん検診の推奨において98.4%の精度を達成するなど、専門的な医療判断においても高い性能を示している。
from Study: GPT-4 helps clinicians with physical exam guidance
【編集部解説】
この研究は、医療AIの実用化に向けた重要な一歩となっています。特筆すべきは、GPT-4が単なる情報提供だけでなく、臨床推論能力を示している点です。
最新の研究によると、GPT-4は医療判断において優れた性能を発揮しています。医学専門医試験では90.2%の正確性を達成し、前年から22.6ポイントの大幅な向上を示しました。また、皮膚がん診断の支援では、医療従事者の診断精度を感度75%から81.1%へ、特異度81.5%から86.1%へと向上させることに成功しています。
ただし、いくつかの課題も明らかになっています。放射線画像検査の選択など専門的な判断が必要な場面では、依然として人間の医師による最終確認が必要とされています。また、性別や人種による偏りの問題も指摘されており、特に主観的な患者評価において23%のケースで性別や人種による有意な差が見られました。
将来的には、実際の患者データを用いたファインチューニングにより、より正確で実用的なツールとなることが期待されています。特に、医療リソースの限られた環境での活用や、若手医師の支援ツールとしての役割が注目されています。
医療分野でのAI活用は着実に進展しており、2024年には米国食品医薬品局(FDA)から約400のAIアルゴリズムが放射線分野で承認されています。これは、医療の質を向上させながら、医師の負担を軽減する新しい医療の形を示唆しています。
【用語解説】
Mass General Brigham(マス・ジェネラル・ブリガム)
Mass General Brigham は、アメリカ合衆国マサチューセッツ州ボストンにある、全米最大規模の学術医療センターです。マサチューセッツ総合病院とブリガム・アンド・ウィメンズ病院という、世界的に有名な2つの病院を中核とし、その他にも複数の病院、クリニック、研究所を傘下に置いています。
医療提供に加えて、ハーバード大学医学部と提携し、医学研究、教育、イノベーションにおいても中心的役割を担っています。年間20億ドルを超える研究予算を持ち、最先端の医療技術の開発や、医療従事者の育成に力を入れています。
MESH Incubator
MESH Incubator は、起業家、研究者、臨床医など、様々な分野の専門家が集まり、アイデアを共有し、共同でプロジェクトを進める場を提供しています。また、資金調達、メンタリング、ビジネス開発などのサポートも提供することで、革新的な医療ソリューションの社会実装を促進しています。
Mass General Brigham のような大規模な学術医療センター内に設置されていることで、MESH Incubator は、臨床現場のニーズを直接的に捉え、研究成果を迅速に実用化できるという強みを持っています。