MicrosoftのAI部門CEOムスタファ・スレイマンが2025年6月30日、同社の新AI診断システム「MAI Diagnostic Orchestrator(MAI-DxO)」を発表した。
このシステムは、OpenAIのo3、GPT、GoogleのGemini、AnthropicのClaude、MetaのLlama、xAIのGrok、DeepSeekの複数AIモデルを統合して動作する。
ニューイングランド医学雑誌の304症例を用いたSequential Diagnosis Benchmark(SDBench)テストで、MAI-DxOは最高85.5%の診断精度を達成し、米英の経験豊富な21名の医師の20%を4倍以上上回った。同時に診断コストを20%削減した。
Microsoftは商業化を検討中で、検索エンジンBingへの統合や医療専門家向けツール開発可能性を探っている。同社はGoogle AI研究者数名を引き抜いてプロジェクトを推進した。
From: Microsoft Says Its New AI System Diagnosed Patients 4 Times More Accurately Than Human Doctors
【編集部解説】
Microsoftが2025年6月30日に発表したMAI-DxOは、医療AI分野における画期的な転換点を示しています。従来のAI医療ツールが単一モデルで動作していたのに対し、MAI-DxOは複数の最先端AIモデルを「仮想医師団」として機能させる点が革新的です。
システムの核心は「連鎖討論スタイル」と呼ばれる仕組みにあります。OpenAIのo3、GPT、GoogleのGemini、AnthropicのClaude、MetaのLlama、xAIのGrok、DeepSeekといった異なる特性を持つAIモデルが、それぞれ専門医の役割を担当し、人間の医師チームのように議論を重ねながら診断に至ります。
注目すべきは診断精度の圧倒的な差です。MAI-DxOが最高85.5%の正答率を記録した一方、5-20年の臨床経験を持つ21名の医師は20%にとどまりました。ただし、この結果には重要な条件があります。医師たちは追加の診断ツールや参考資料の使用を禁じられており、実際の臨床現場とは異なる環境での比較である点は留意が必要でしょう。
コスト削減効果も見逃せません。MAI-DxOは不要な検査を避けることで医療費を20%削減しました。米国では一般的に医療費の多くが無駄とされる現状を考えると、この効率化は医療制度全体に大きなインパクトをもたらす可能性があります。
一方で、潜在的なリスクも存在します。AIシステムの判断根拠が完全に透明化されていない「ブラックボックス」問題、特定の人口統計に偏った学習データによるバイアス、そして医師の判断力低下への懸念などが挙げられます。
規制面では、FDA(米国食品医薬品局)をはじめとする各国の医療機器承認機関が、このような高度なAI診断システムをどう評価・承認するかが今後の焦点となります。現在のガイドラインでは想定されていない複雑なシステムのため、新たな規制フレームワークの構築が求められるでしょう。
長期的には、このテクノロジーが医療の民主化を加速させる可能性があります。専門医が不足する地域や発展途上国でも、高度な診断支援が受けられるようになれば、医療格差の解消に貢献するかもしれません。ただし、臨床試験での実証が不可欠であり、実用化までには慎重な検証プロセスが必要です。
【用語解説】
Sequential Diagnosis Benchmark(SDBench)
ニューイングランド医学雑誌の304症例を用いて作成された、AI診断システムの性能評価基準である。従来の一問一答形式ではなく、実際の診療のように段階的に情報を収集しながら診断に至るプロセスを評価する。
オーケストレーション
複数のAIモデルを連携させて、より高度な機能を実現する技術手法である。各AIが異なる役割を担い、人間の専門家チームのように協力して問題解決にあたる。
Gatekeeper
診断テストにおいて患者情報を管理し、質問に応じて必要な情報のみを開示する言語モデルである。実際の診療における患者との対話を模擬する役割を果たす。
連鎖討論スタイル
複数のAIエージェントが異なる医師の役割を演じ、議論を重ねながら診断に至る手法である。個々の認知バイアスを軽減し、より精度の高い診断を可能にする。
医療超知能
世界最高の人間医師を上回る診断能力を持つAIシステムの概念である。広範囲の医学知識と専門的な洞察力を併せ持つことを目指している。
【参考リンク】
Microsoft AI – The Path to Medical Superintelligence(外部)
MAI-DxOの詳細な技術解説と研究成果を掲載するMicrosoft公式ブログ記事
New England Journal of Medicine(外部)
診断症例の出典となった世界最高峰の医学雑誌の公式サイト
【参考記事】
AI vs. MDs: Microsoft tool hits 85.5% accuracy in tough diagnoses(外部)
テクノロジー専門メディアによるMAI-DxOの詳細な技術解説記事
Sequential Diagnosis with Language Models(外部)
MAI-DxOの学術論文。研究方法論と実験設計について詳細に記述
【編集部後記】
AIが医師を上回る診断精度を示したこのニュースを読んで、皆さんはどう感じられたでしょうか。私たちも正直、驚きと同時に複雑な思いを抱いています。技術の進歩は素晴らしい一方で、医療の現場で人間の役割がどう変わっていくのか、気になるところです。もし皆さんが患者の立場だったら、AIの診断と医師の診断、どちらを信頼したいと思われますか?また、この技術が普及した時、医療費削減の恩恵を受けられる反面、医師との対話の機会が減ることについてはいかがでしょう。ぜひSNSで皆さんの率直なご意見をお聞かせください。