AIに「賢く考えさせる」より、足元のデータの通り道を整えるほうが効いた——Anthropicが公開した研究は、そんな逆転の発見を伝えています。最先端のAIエージェントにウイルスの配列データを集めさせたところ、同じ問いでも答えがバラバラで、進行中のエボラ流行のような一刻を争う場面では命取りになりかねない精度でした。ところが「gget virus」という地味な仕組みを一枚かませるだけで、精度はほぼ100%に。なぜ最新モデルより“確実な配管”が大事なのか、そして生物学のデータ基盤がこれからどう変わるべきなのかを読み解きます。
2026年6月8日、Anthropicはローラ・リュバートによる記事「Paving the way for agents in biology」を公開した。記事はフェルドゥス・ナスリらの研究に基づく。リュバートらは科学研究エージェントのClaude、Biomni、Edison Analysis、GPTに、データベースNCBI Virusからウイルス配列を取得させるベンチマーク「VirBench」を開発した。
VirBenchは40の病原体にまたがる120件のクエリで構成される。Claude Sonnet 4、Claude Opus 4.7、Biomni、Edison Analysis、GPT-5.2-pro、GPT-5.5の平均精度は16.9%から91.3%だった。NCBIと協働で開発した決定論的取得レイヤー「gget virus」を加えると、全エージェントで精度が90%を超え、GPT-5.5で99.7%に達した。記事はコンゴ民主共和国でのBundibugyoウイルスによるエボラのアウトブレイクを例に挙げた。
From:
Paving the way for agents in biology
【編集部解説】
なぜ私が今このニュースを取り上げるのか。それは、この研究が机上の理論ではなく、いままさにコンゴ民主共和国で進行しているエボラのアウトブレイクという「現場」と地続きだからです。記事はBundibugyoウイルスによる流行を例に引いていますが、これは2026年5月に発生し、WHOが「国際的に懸念される公衆衛生上の緊急事態(PHEIC)」と認定した、現実の危機です。データへのアクセスが遅れることは、対応の遅れに直結します。
ここで鍵となるのが、見慣れない言葉「決定論的レイヤー(deterministic layer)」です。難しく聞こえますが、発想はとてもシンプルです。AIに賢く推論させて毎回ゼロから道を探させるのではなく、「同じ問いには必ず同じ正しい答えを返す配管」をあらかじめ敷いておく、という考え方です。リュバートらが開発したgget virusは、まさにその配管にあたります。
私がこの記事で最も注目したのは、「モデルを賢くする」より「足元のインフラを直す」方が効いた、という逆説的な発見です。最新の高価なAIに頼らずとも、安価なモデルでも適切なツールと組み合わせれば信頼できる結果が出る——これは、研究のアクセスを一部の潤沢な予算を持つ機関から、より広い研究者へと開く可能性を秘めています。
この技術が実用化されれば、アウトブレイク時に「いつ、どこで流行が始まったのか」を推定する系統樹の構築や、既存の治療薬が変異したウイルスに今なお有効かどうかの確認が、再現性をもって素早く行えるようになります。初動の数日が命を分ける感染症対応において、これは小さくない前進でしょう。
一方で、見落としてはならない緊張関係があります。同じAnthropicが、生物学データをエージェントに「使いやすく」する研究を進める一方で、自社のより新しいモデルについては、バイオセーフティ上の理由からアクセスを制限している点です(記事の脚注に明記されています)。記事の後半でエボラの系統樹や抗体の解析にClaude Sonnet 4が使われているのも、それより新しいモデルがバイオセーフティ上の理由で使えなかったためでした。
この矛盾めいた姿勢は、偶然ではありません。2026年6月5日、Anthropicを含むOpenAI、Google DeepMind、Microsoft AIの首脳は、合成DNAのスクリーニング義務化を求める書簡を米議会に共同提出しています。生物学とAIの融合は、創薬や感染症対策に資する一方で、悪用されれば壊滅的な被害をもたらしうる「デュアルユース(両義性)」の典型だからです。
つまり今回の研究は、「生物学データをどこまでAIに開くか」という、より大きな規制論議の真ん中に置かれています。アクセスを広げる利便性と、リスクを管理する慎重さ。その両立をどう設計するかが、これからの焦点になります。
ここで一つ、参照元とは少し違う角度を提示させてください。リュバート自身が認めているように、モデルが十分に賢くなれば、gget virusのようなツールはいずれ不要になるかもしれません。しかし私は、むしろここに本質があると考えます。「AIにできるか」と「毎回AIにやらせるべきか」は別の問いです。コスト、速度、そして何より「どうやってその答えにたどり着いたかを後から検証できるか(監査可能性)」を考えれば、退屈なほど確実な土台の価値は、モデルの賢さとは独立して残り続けるはずです。
長期的に見れば、この記事が投げかけているのは、技術というより設計思想の転換です。これまで生物学のデータベースは「人間がブラウザで操作する」ことを前提に造られてきました。これからは「エージェントを大規模な利用者として最初から想定する」必要がある——その視点の移行こそが、人類が新しい道具と共に進化していくための、地味だが確かな一歩なのだと思います。
【用語解説】
VirBench
Anthropicのチームが開発したベンチマークである。40の病原体にまたがる120件の現実的なウイルス配列クエリで構成され、手作業で検証した正解カウントを基準に、AIエージェントがNCBI Virusから配列を正しく取得できるかを評価する。
決定論的レイヤー(deterministic layer)
同じ問いに対して常に同じ正しい答えを返すよう設計された、機械的・再現可能な実行の仕組みを指す。AIに毎回推論で道を探させる代わりに、確実な「配管」をあらかじめ用意する発想であり、gget virusがその一例にあたる。
系統樹(phylogenetic tree)
ウイルスや生物の配列を比較し、相互の進化的なつながりを枝分かれの図として再構成したものである。アウトブレイクでは、検体間の関係や流行の起点を推定する標準的な解析手段として用いられる。
Bundibugyoウイルス
エボラウイルスの一種(種名 Orthoebolavirus bundibugyoense)である。今回コンゴ民主共和国で流行しているのはこの型で、既存のエボラ治療薬の多くが別の型であるザイールエボラウイルス向けに開発されている点が、対応上の課題とされる。
PHEIC(国際的に懸念される公衆衛生上の緊急事態)
国際保健規則(IHR)に基づき、WHO事務局長が宣言する最高レベルの警報である。国際的な対応の協調が必要と判断された際に発令される。
デュアルユース(dual-use/両義性)
同じ技術が、正当な研究にも悪用にも使えるという二面性を指す。生物学とAIの融合は、創薬や感染症対策に資する一方で、悪用時のリスクも大きい代表例とされる。
合成DNAスクリーニング
人工的に合成・受注されるDNA配列に、危険な病原体に該当するものがないかを事前に審査する仕組みである。バイオセキュリティ上の「関門」として、義務化の是非が議論されている。
バイオセーフティ
病原体や生物学的素材を扱う際に、流出や悪用、事故を防ぐための安全管理の考え方である。AIモデルへのアクセス制限も、この観点から論じられる。
監査可能性(auditability)
ある結論について「どのような手順でその答えに至ったか」を後から検証・追跡できる性質を指す。科学的ワークフローの信頼性を担保するうえで重視される。
【参考リンク】
プレプリント(arXiv)(外部)
VirBenchとgget virusの詳細を記した査読前論文。ナスリらによる原典で、評価手法と結果の根拠を直接確認できる。
NCBI Virus(外部)
米国NCBIが運営するウイルス配列記録の検索データベース。記事の配列取得タスクの対象となった一次的なデータ基盤である。
gget(pachterlab)(外部)
リュバートとパクターが開発したゲノム参照DB問い合わせツール。今回のgget virusはその新モジュールにあたる。
Biomni(Stanford)(外部)
スタンフォード大学などが開発した汎用生物医学AIエージェント。記事の評価で比較対象の一つとして用いられた。
FutureHouse / Edison Scientific(外部)
AIによる科学の自動化を掲げる研究組織。記事のEdison AnalysisやRobinを生み出した母体にあたる。
世界保健機関(WHO)(外部)
事例となったエボラ流行について、PHEIC認定や優先治療候補などの公式情報を発信する国際機関である。
【参考動画】
記事が引用した、アンドレイ・カルパシーの講演「Software Is Changing (Again)」。「エージェントのために造るべきだ」という主張が、本記事の問題意識の出発点になっている。
【参考記事】
Ebola disease caused by Bundibugyo virus – DRC(WHO)(外部)
WHO公式の状況報告。5月21日時点でDRCの疑い746件・死亡176件、両国で確定85件・死亡10件(致死率12%)と記す。
Ebola Disease Outbreak in the DRC and Uganda(CDC)(外部)
米CDCの勧告。5月15日にDRCが流行確認、16日時点で疑い246件・死亡80件、17日にWHOがPHEIC認定と記す。
PHEIC determination(WHO)(外部)
WHOがPHEICを宣言した公式発表。5月16日時点で確定8件・疑い246件・疑い死亡80件と示し根拠を説明する。
CEOs Ask Congress To Mandate Synthetic DNA Screening(Yellow.com)(外部)
6月5日、OpenAI・Anthropic・Google・Microsoftの首脳が合成DNAスクリーニング義務化を米議会に求めた件を報じる。
AI synthetic DNA regulation: OpenAI and Anthropic urge Congress(The Cryptonomist)(外部)
同書簡を、生物学とAIの融合がデュアルユースリスクの典型である背景から解説し、悪用ハードル低下の論点を補強する。
Anthropic研究の紹介(Digg)(外部)
元記事の二次まとめ。Sonnet 4が同一クエリで106・15・5配列を返した(正解266)など本記事の数値を整理して伝える。
【関連記事】
Amazon Bio Discovery|コーディング不要でAI創薬インフラを束ねる、AWSの新プラットフォーム AWSが創薬向けに束ねたAIインフラ。バイオ領域へAIが入り込む基盤づくりの最前線を押さえられる一本。
Anthropic、AI悪用サイバー攻撃を1年分分析 AnthropicがAI悪用の実態を1年分まとめた報告。攻撃側から見たAIリスクを俯瞰でき、視点を補完する。
Lunai Bioworks、AI化学兵器生成を阻止する「Sentinel」発表 AIによる化学兵器設計を防ぐ「Sentinel」。バイオ・化学領域のAIセーフティを考える上で外せない事例。
【編集部後記】
AIが「賢くなること」より「足元の配管が整っていること」のほうが大切だった——この発見は、私たちが日々触れるツールにも通じる話かもしれません。みなさんは、新しい技術を選ぶとき「最新かどうか」と「確実に動くかどうか」のどちらを重く見ますか。
生命に関わる場面で、その判断はどう変わるでしょう。よければ、ご自身の仕事や暮らしに引きつけて考えてみてください。そこから見えてくる景色を、私もぜひ伺ってみたいです。












