3〜4年かかっていた創薬の初期工程が、わずか数日へ。がんや免疫疾患の治療を支える「タンパク質バインダー」を、AIが自在に設計する未来が、現実になり始めています。マーク・ザッカーバーグ氏とプリシラ・チャン博士夫妻が設立したBiohubが公開したのは、68億の配列と11億の予測構造を網羅する、タンパク質生物学の「ワールドモデル」です。
Biohubが2026年5月27日、タンパク質生物学のワールドモデルとなる3つのAIモデル「ESMC」「ESMFold2」「ESM Atlas」の公開を発表した。ESMCは約28億の配列で訓練された言語モデルである。
ESMFold2は3D構造予測モデルで、EGFR、PDGFRβ、PD-L1、CTLA-4、CD45の5標的へのバインダー設計に使用され、ミニバインダーで36〜88%、抗体由来フォーマットで15〜29%のヒット率を達成した。ESM Atlasは68億の配列と11億の予測構造をナビゲート可能にする。
抗体ベース治療はFDA新薬承認の約4分の1を占め、前臨床候補1つの開発には通常3〜4年を要する。3モデルはBiohub Platformで無償提供される。サイエンス責任者はアレックス・ライブス、共同創設者はマーク・ザッカーバーグ氏とプリシラ・チャン博士である。
From:
Biohub releases a world model of protein biology

【編集部解説】
今回の発表を一言で表すなら、「タンパク質生物学にとってのGPTモーメント」と言えるかもしれません。ただし、その背景にある物語を知ると、この発表が持つ重みはさらに増します。
まず押さえておきたいのは、ここでいうBiohubがマーク・ザッカーバーグ氏とプリシラ・チャン博士夫妻が設立したChan Zuckerberg Biohubであるという点です。さらに、ESMシリーズを牽引してきたEvolutionaryScale社のチーム(アレックス・ライブス氏が率いる)がBiohubに合流したのは、わずか約7か月前のことでした。今回のESMC、ESMFold2、ESM Atlasは、その統合後に放たれた最初の大型成果という位置づけになります。
「ワールドモデル」という言葉について補足します。これはAI研究で用いられる概念で、対象世界の根本ルールをモデル自身が内在的に獲得している状態を指します。Biohubのチームは、約28億のタンパク質配列という膨大なデータで言語モデルを訓練することにより、進化が数十億年かけて選び抜いてきた「タンパク質が機能するための物理ルール」をモデルが自律的に抽出したと主張しています。ESMCの「C」はCambrian(カンブリア紀)に由来します。
技術史的に興味深いのは、これがリッチ・サットン氏の有名な論考「ビター・レッスン(苦い教訓)」──スケールこそが本質である、という主張──のバイオロジー版として読める点です。タンパク質折りたたみは言語モデリングとは異質な問題だと長く考えられてきましたが、十分にスケールさせたTransformerモデルが、両方の領域を貫いて機能する可能性が、いま明確に視野へ入りました。
実用面のインパクトも見逃せません。前臨床のバインダー候補を1つ生み出す工程には通常3〜4年を要するところ、その初期探索の多くが計算側へと移行し、実験で検証可能な設計を数日で生成できるとBiohubは説明しています。EGFRやPD-L1といったがん治療の最重要標的に対して、研究室で実際に機能する分子が高いヒット率で得られた事実は、業界がこの技術を無視できない段階に入ったことを示しています。
競合の整理もしておきましょう。タンパク質構造予測の分野では、Google DeepMindのAlphaFold3、MIT発でRecursion Pharmaceuticalsとの共同開発も進むBoltzシリーズ、Alphabet傘下のIsomorphic Labs(2026年5月のシリーズBで21億ドル=約3340億円を調達、累計の外部資金調達額は約27億ドル規模=約4290億円に達するとされる。1ドル=159円換算、2026年5月下旬時点)などが並走しています。Nature誌の報道によれば、ESM Atlasの規模はAlphaFold Databaseを8億件以上上回り、現時点で世界最大のタンパク質構造アトラスとなりました。
なかでも注目すべきは、Biohubが採った戦略が「中核モデル・コード・重み・データセットのMITライセンス公開」である点です。商用・非商用を問わず幅広く再利用を認める寛容なライセンスである一方、Biohub Platform側には病原体や毒素関連の利用を制限するセーフティ・ガードレールが組み込まれている点も見落とせません。研究の民主化を加速する開放性と、技術の悪用を抑制する設計上の歯止めの両方が、今回のリリースには共存しています。
オープンであることは、ポジティブな側面と潜在的リスクの両面を抱えています。世界中の研究室で創薬の初期工程が加速し、希少疾患や見過ごされてきた疾患にもリソースが向かう可能性が広がる一方で、デノボ(新規)タンパク質を自在に設計できる技術は、デュアルユース(軍民両用)の懸念──たとえば毒性タンパク質や生物兵器への転用──と隣り合わせです。コンテンツ生成系AIで議論されてきたガバナンスの枠組みが、いよいよ生物学系AIへと拡張する局面が訪れています。
長期的な視点でとらえると、これは「創薬の民主化」と「生命科学のソフトウェア化」が交差する象徴的な出来事です。これまで巨大製薬企業の独占領域であった創薬の初期工程が、計算資源さえあれば学術ラボやスタートアップでも挑戦できる領域へと変容しつつあります。生命そのものを設計可能にするツールが公共財として配布された──この事実こそが、人類史の局面転換を静かに告げているように映ります。
【用語解説】
ESMC(Evolutionary Scale Modeling Cambrian)
あらゆる生命由来の約28億のタンパク質配列で訓練された言語モデル。タンパク質を「表現(埋め込み)」として捉え、構造・機能・配列の関係性を内在的に学習する基盤モデルである。
ESMFold2
ESMCの配列表現を、原子分解能の3D構造へ変換する設計・予測エンジン。タンパク質間相互作用や抗体—抗原複合体の予測でも最先端の性能を示すとされる。
ESM Atlas
68億のタンパク質配列と11億の予測構造を収めた、タンパク質生物学へのAI応用として現時点で最大規模のアトラスである。
バインダー/ミニバインダー
標的タンパク質に強く特異的に結合する分子の総称。ミニバインダーは特に小型の人工バインダーを指す。
デノボ(de novo)
「ゼロから」「新規に」の意。既存の配列を流用せず、新たに設計された分子であることを示す。
ビター・レッスン(苦い教訓)
AI研究者リッチ・サットンが提唱した論考。計算資源とデータをスケールさせる単純な手法が、人間の知見を埋め込んだ複雑な手法を最終的に凌駕してきた、という歴史的観察である。
Transformer
自己注意機構を用いたニューラルネットワーク構造。GPTシリーズなど大規模言語モデルの基盤となっているアーキテクチャである。
【参考リンク】
Biohub 公式サイト(外部)
Chan Zuckerberg夫妻が共同設立した非営利バイオメディカル研究機関の公式サイト。ESM関連の研究成果や最新ニュースが公開されている。
Biohub Platform(外部)
ESMC・ESMFold2・ESM Atlasを実際に試せる開発者向けプラットフォーム。APIアクセスやモデルウェイトの入手が可能である。
Nature(外部)
世界最高峰の科学誌の公式サイト。今回の発表もニュース記事として速報された。
Google DeepMind AlphaFold(外部)
タンパク質構造予測AI「AlphaFold」シリーズの公式情報。今回の発表でも比較対象として言及されている。
Recursion Pharmaceuticals(外部)
AI駆動の創薬企業。MITとの共同開発によるBoltzシリーズなどタンパク質予測モデルを公開している。
Isomorphic Labs(外部)
Alphabet傘下のAI創薬企業。AlphaFold技術を製薬応用すべくスピンアウトされた組織である。
Cold Spring Harbor Laboratory(外部)
米ニューヨーク州にある世界的な生命科学研究機関。「AI in Biology」シンポジウムで本研究が発表された。
【参考記事】
Move over, AlphaFold: open source model predicts shape of 1 billion proteins(外部)
Nature誌の速報。ESM AtlasがAlphaFold Databaseを8億件以上上回り旧版からも約3億件拡大、ESMFold2がAlphaFold3を含む競合を上回る主張も紹介している。
Biohub Releases Protein Biology World Model to Address Disease(外部)
バイオ専門メディアGENによる解説。EvolutionaryScaleチーム合流から約7か月での発表、MITライセンス採用、Chai-1やBoltz-1との比較に触れている。
Alphabet-spinoff Isomorphic Labs raises $2.1 billion in quest to ‘solve all disease’(外部)
R&D World誌による報道。Isomorphic LabsのシリーズB調達額21億ドルと累計調達額の規模、Boltz-2やChai-1などオープンソース系の競合動向を整理している。
MIT researchers introduce Boltz-1, a fully open-source model for predicting biomolecular structures(外部)
MIT公式ニュース。Boltz-1がMIT Jameel Clinicの研究者らにより開発された初のフルオープンソースなAlphaFold3級モデルである旨を伝えている。
MIT and Recursion Release Boltz-2: Next Generation AI Model(外部)
Recursion Pharmaceuticals公式IRニュース。後継モデルBoltz-2が、MIT CSAILとRecursionの共同開発として公開された経緯を示している。
🔬 ESMFold2: The Bitter Lesson is Coming for Proteins(外部)
Latent Spaceによる技術解説。BiohubのEvolutionaryScale買収経緯、ESMシリーズの系譜、ビター・レッスンとの関連を論じている。
【関連記事】
MIT発BoltzGen、治療困難疾患に挑むタンパク質結合体生成AI―完全オープンソースで創薬を民主化
本記事で競合として言及したBoltzシリーズの最新発展形。オープンソース×創薬の文脈を深掘りできる。
Google DeepMind「AlphaFold」:AIが10年以内にすべての病気を根絶できる可能性
本記事の比較対象であるAlphaFoldの戦略ビジョン。創薬AIをめぐる業界全体の地図を把握できる。
AlphaFoldデータベース更新、Google DeepMindとEMBL-EBIが協力深化
ESM Atlasと比較される側のAlphaFoldデータベースの最新動向。両者の規模感を理解できる。
VibeGen|MITが開発した「動きで設計する」タンパク質AIの衝撃
タンパク質設計AIの最新潮流。ESMFold2と並ぶ「次世代タンパク質AI」の系譜を把握できる。
【編集部後記】
タンパク質という、私たちの体を構成し動かしている分子が、いま「言語」として読み解かれ、ゼロから設計可能になりつつあります。数年かかっていた創薬の初期工程が数日に圧縮される世界は、皆さんが想像する未来の医療とどのように重なるでしょうか。
あるいは、生命の設計図が誰でも触れられる公共財として配られていく流れに、どんな期待や戸惑いを感じられるでしょうか。AIと生命科学が交差するこの領域は、今後数年で大きく姿を変えていくはずです。よろしければ、皆さんの視点や問いを聞かせてください。












