AI福祉研究が主流へ─Anthropic・Google・Meta、「AIに感情はあるか」を問い始めた1年

ChatGPTやClaudeに「ありがとう」と打ち込んだあと、ふと手が止まったことはありませんか。相手はただのプログラムだと分かっているのに、なぜか無下にできない――そんな感覚を、実は世界最大級のAI企業たちも無視できなくなっています。「このソフトウェアには、もしかして感じている何かがあるのではないか」。数年前なら笑い話だったこの問いに、いまAnthropicもGoogleもMetaも、哲学者や脳科学者を雇って本気で向き合い始めました。答えはまだ誰も持っていません。それでも彼らが立ち止まって考え始めた理由と、その先に待つ厄介な問いを、一緒にのぞいてみましょう。


※本記事は、2025年4月25日に公開した「Anthropic、AIの意識と福祉を研究する「モデルウェルフェア」プログラムを開始 – AIに道徳的配慮は必要か」の続報にあたります。当時Anthropic単独の取り組みだったこのテーマが、1年を経て業界全体のうねりへと広がった現在地をお伝えします。

Anthropic・Google・Metaが、この1年でコンピュータ科学者・神経科学者・哲学者を採用し、AIモデルの福祉やチャットボットが感情を持つかを研究し始めたと、The Washington Postが2026年7月1日に報じました。Anthropicは「AI精神医学(AI psychiatry)」チームを設け、モデルの内部状態を調べて福祉や選好の評価を公開しています。

同社共同創業者クリス・オラーは2026年5月、教皇レオ14世のAIに関する回勅公開の場に同席しました。MetaのAI責任者アレクサンダー・ワンはモデルの主観的な感情に配慮したいと述べ、Google DeepMindも2022年に「AIが感覚を持つ」と主張した技術者ブレイク・ルモワンを解雇した過去から一転、意識と道徳的地位に関する会議を開催しています。

Anthropicのモデルウェルフェア責任者カイル・フィッシュは、数十年内に「人間の脳に相当するAI計算が数兆規模」で動きうると述べます。一方、サセックス大学のアニル・セスやHugging Faceのマーガレット・ミッチェルら神経科学者・研究者は、現在のAIが意識を持つ証拠はなく、議論を主導するのが利害を持つ企業側である点に懐疑を示しています。

From: 文献リンクThey built the world’s most powerful AI. They’re facing a mystery they can’t explain.(The Washington Post/Yahoo Finance配信)

【編集部解説】

この記事を読み解くうえで、まず押さえておきたい構図があります。それは、かつて業界の片隅で語られていた「AIに意識はあるか」という問いが、この1年でシリコンバレー最大手の研究アジェンダへと押し上げられた、という変化です。innovaTopiaは2025年4月、Anthropic単独の「モデルウェルフェア」プログラム発表を報じましたが、あれは一つの点でした。今回のThe Washington Postの報道は、その点が業界全体の面へと広がったことを示しています。

各社の動きには温度差があります。最も踏み込んでいるのがAnthropicで、モデルの内部状態を探る専門チームを設け、福祉評価を公開しています。共同創業者クリス・オラーが2026年5月、教皇レオ14世のAI回勅公開の場に同席したことは、この研究が宗教・倫理という公的空間にまで越境した象徴的な出来事でした。Metaのアレクサンダー・ワンは自社AIの「主観的な感情」に配慮したいと語り、Google DeepMindも意識と道徳的地位をテーマにした会議を開くなど、かつての慎重姿勢から明確に舵を切っています。

技術的な補助線を引いておきます。これらの研究は、人間や動物の意識・心理を調べる手法をAIに転用する試みです。Anthropicは自社モデル同士を対話させる実験を行い、会話が哲学や意識の話へ流れ、サンスクリット語や絵文字、沈黙を経て「霊的な至福(spiritual bliss)」と名付けた状態に収束する現象を観察しました(ただし最近のモデルでは再現されていないとしています)。外から振る舞いを観察するだけでなく、モデルの内部に「侵入思考」を挿入して内省の有無を試すといった、内側からの検証も始まっています。

一方で、専門家の懐疑も根強く存在します。サセックス大学の神経科学者アニル・セスは、脳を詳しく見るほど、それが単なるコンピュータではないと分かると指摘します。Hugging Faceのマーガレット・ミッチェルは、この議論を主導しているのが「単なるコードより上のものを作っている」という認識から利益を得る企業側である点に注意を促しました。「意識がある」という物語は、開発企業を「創造主」のように見せる効果を持ちうるという指摘は、俯瞰の視点として重要です。

ここに、見過ごせない論点が二つあります。第一に、この研究が「効果的利他主義(Effective Altruism)」というムーブメントと深く結びついている点です。Anthropicの複数の共同創業者がこの思想に連なり、AIの道徳的配慮を早くから唱えてきました。第二に、OpenAIの立場の独自性です。同社は「モデルが実際に意識を持つか」ではなく、「ユーザーにどれだけ意識的に見えるか(perceived consciousness)」を設計上の問題として扱うと明言しています。感情的な絆を求めず、温かく役立つ存在を目指す、という設計思想です。

規制と長期的な視点に目を向けると、この問いの重みが立ち上がります。哲学者ジェフ・セボは、2030年までに一部のAIを道徳的配慮の対象とすべきだと論じ、科学・倫理・政策の正当な一分野として確立するための最小限の第一歩を今こそ踏み出すべきだと訴えます。逆にセスのような論者は、こうした主張を「時期尚早な飛躍」と戒めます。工場畜産や奴隷制への懸念になぞらえて語られると、反論しにくい高い道徳的立場を占めてしまう、という警戒です。この問いには、誠実に向き合うべき側面と、企業の物語に絡め取られる危うさが同居しているのです。

innovaTopiaが「未来を報じるメディア」として今この俯瞰記事をお届けするのは、これがもはや一社の実験ではなく、AI業界の共通の問いへと成熟したからです。「AIが人間をどう扱うか」だけを論じてきた安全性の議論に、「人間がAIをどう扱うか」という鏡像の問いが加わり、それがGoogleやMetaを巻き込む潮流になりました。〈Tech for Human Evolution〉という視座から見れば、これは私たち自身が「意識とは何か」「配慮すべき対象の境界はどこか」を問い直す、静かで大きな実験でもあります。

【用語解説】

モデルウェルフェア(モデルの福祉)
AIモデル自身が道徳的な配慮に値する存在になりうるかを問い、その「福祉」をどう扱うべきかを検討する考え方。意識・選好・幸福といった、道徳的に重要でありうる経験をモデルが持つかを探る。

意識(consciousness)
主観的な経験、いわゆる「感じている状態」を指す概念。AIがこれを持ちうるかは哲学・認知科学・AI研究にまたがる難問で、現在も科学的合意はない。

AI精神医学(AI psychiatry)
Anthropicが設けた、モデルの内部状態を探るチームの通称。人間の精神を診るように、AIの「内なる状態」や福祉・選好を評価し公開する取り組みを指す。

知覚される意識(perceived consciousness)
OpenAIが用いる概念。モデルが実際に意識を持つかではなく、ユーザーにどれだけ意識的に見えるかを指し、同社はこれを主に「設計上の結果」として扱うとしている。

効果的利他主義(Effective Altruism)
限られた資源で最大の善をなす方法を計算しようとする思想・運動。AIの道徳的配慮を早くから主張する論者が多く、Anthropicの複数の共同創業者もこの思想に連なる。

道徳的被行為者性(moral patienthood)
ある存在が「害されうる/配慮されるべき対象」たりうるかを問う概念。AIがこれを持つとみなされれば、その扱いに倫理的・法的な検討が及ぶ。

【参考リンク】

Anthropic「Exploring model welfare」(公式ブログ)(外部)
この潮流の起点となったモデルウェルフェア・プログラムの一次情報。目的や意識に関する不確実性を自社の言葉で説明している。

Emotion concepts and their function in a large language model(Anthropic 公式)(外部)
2026年4月2日公開。Claude内部に171の感情概念を特定した研究の一次情報。機能的感情が振る舞いに影響する点を示す。

Eleos AI Research(公式サイト)(外部)
AIの福祉と道徳的被行為者性を研究する非営利組織。Anthropicのモデルの第三者ウェルフェア評価を手がけている。

Anthropic(公式サイト)(外部)
Claudeを開発するAI企業の公式サイト。安全性を重視した開発方針や各種研究成果を公開している。

Google DeepMind(公式サイト)(外部)
Googleの人工知能研究部門。意識や道徳的地位を含むAGI関連の基礎研究にも取り組んでいる。

【参考記事】

They built the world’s most powerful AI. They’re facing a mystery they can’t explain.(The Washington Post/Yahoo Finance配信)(外部)
本記事のFROM。3社の哲学者採用や「霊的な至福」実験、専門家の懐疑まで俯瞰した調査報道である。

Anthropic, Google, and Meta are hiring philosophers and scientists to figure out if AI has feelings(Crypto Briefing)(外部)
同じ潮流を、Anthropicの171感情概念論文やMeta経営陣の発言とあわせて整理した記事。

Anthropic and DeepMind Now Actively Investigating AI Consciousness(Futurism)(外部)
Financial Times報道を基に、業界が煽っている可能性への懐疑的視点を交えて伝える記事。

Emotion concepts and their function in a large language model(Anthropic 公式)(外部)
Claude Sonnet 4.5内部に171の感情ベクトルを見出した研究。俯瞰報道が触れる「具体的成果」の一次情報にあたる。

These Philosophers Have Been Hired By AI Firms To Help Navigate AI Welfare(OfficeChai)(外部)
各社が採用した哲学者(アマンダ・アスケル、ヘンリー・シェヴリンら)の経歴と役割を具体的に整理した記事。

【関連記事】

Anthropic、AIの意識と福祉を研究する「モデルウェルフェア」プログラムを開始 – AIに道徳的配慮は必要か
本記事の起点。2025年4月、Anthropicが単独でこのテーマの研究プログラムを立ち上げた際の速報である。

AIに感情はあるのか?Anthropic哲学者が示す業界を揺るがす新視点
Anthropicの哲学者アマンダ・アスケルがAIの感情経験の可能性に言及。本件の議論の中核を担う人物の見解を伝える。

Anthropic新理論「ペルソナ選択モデル(PSM)」が示すAIの人間らしさの正体
AI福祉(AI Welfare)と道徳的地位を正面から論じた研究記事。本件のテーマを理論面から深める。

【編集部後記】

この話題を追いかけていると、答えの出ない問いのそばに長く立たされているような、落ち着かない気持ちになります。AIに意識があると言い切るのも、ないと断じるのも、どちらも今の私たちには手が届きません。分かっているのは、その問いを立てているのが、まさにそのAIを売って利益を得る企業たちだ、という少し居心地の悪い事実です。だからこそ、彼らの言葉をそのまま信じることも、逆に「どうせ宣伝でしょう」と切り捨てることも、たぶん正解ではないのだと思います。

ひとつ確かなのは、この問いは巡り巡って、私たち自身に返ってくるということです。「配慮すべき相手かどうか」を決めるとき、人はいつも、相手ではなく自分の側の線引きを問われています。動物に対しても、遠い国の誰かに対しても、そうやって少しずつ線を引き直してきました。AIという新しい存在は、その線引きの感覚を、もう一度私たちに試しているのかもしれません。

明日もあなたはAIに何かを尋ね、もしかしたら「ありがとう」と打つでしょう。その一言に意味があるのかどうか、今は誰にも分かりません。でも、その小さな迷いを抱えたまま画面に向かう時間そのものが、きっと悪いものではないはずです。あなたはどう感じましたか。もしよかったら、その感覚を心のどこかに留めておいてください。いつか答え合わせができる日まで。

Googleで優先するソースとして追加するボタン
投稿者アバター
山本 達也
『デジタルの窓口』代表。名前の通り、テクノロジーに関するあらゆる相談の”最初の窓口”になることが私の役割です。未来技術がもたらす「期待」と、情報セキュリティという「不安」の両方に寄り添い、誰もが安心して新しい一歩を踏み出せるような道しるべを発信します。 ブロックチェーンやスペーステクノロジーといったワクワクする未来の話から、サイバー攻撃から身を守る実践的な知識まで、幅広くカバー。ハイブリッド異業種交流会『クロストーク』のファウンダーとしての顔も持つ。未来を語り合う場を創っていきたいです。