AGI Hub設立｜「AGIの何が問題か」を日本語で議論できる場が生まれた意味ーXAI・RAI・ベンチマーク問題……AGIをめぐる未解決の問いと、日本の議論不足

AI（人工知能）ニュース

RAI（責任あるAI）　XAI（説明可能AI）　Headline News

野村貴之

[公開]

2026年6月25日16:43

[更新]2026年6月25日

AIは今、「何ができるか」より「何が問題か」を問われる段階に入っています。なぜ判断したかを説明できないブラックボックス問題、責任あるAIのガバナンス、Transformerアーキテクチャの限界論、そして人間を超えた知能をどう測るかという根本的な問い。AGIをめぐる未解決の問いを整理するとき、それを日本語で議論できる場があるかどうかは、思っているよりずっと重要です。

生成AIの普及を背景に、AGI（汎用人工知能）が社会に与える変化をリサーチ・発信する機関「株式会社AGI Hub」が2026年6月15日に設立された。代表は有路翔太・神楽坂やちまの2名。本社は東京都港区。

同社の設立背景として、AIセーフティやAIアライメントをめぐる最先端の議論が英語圏の研究機関・スタートアップ・財団に集中しており、日本国内では日本語での情報が不足し、企業・政策決定者・学術界・一般社会の間で議論が分断されているという問題認識が示されている。

事業としては、企業・大学・政府向けの講演、メディアへの記事寄稿、共同研究・提言の公表、AGI・AIセーフティ・AIアライメント領域の専門人材紹介の4本柱を展開する。英語圏のAGIエコシステムと日本の産官学を接続する「共創のハブ」と位置づけている。

From: AGI時代の社会変化をリサーチ・提言する「AGI Hub」設立のお知らせ｜PR TIMES

【編集部解説】

AGI Hub設立のニュースを読んで、まず感じるのは「なぜ今なのか」という問いです。生成AIが日常に溶け込みつつある現在、AGI（汎用人工知能）という言葉は急速に市民権を得ました。しかし、そもそもAGIをめぐっては、実現の可否から測定方法、安全性、ガバナンスに至るまで、未解決の問いが山積しています。その問いの多くは、まだ英語圏の研究者・技術者のあいだでしか十分に議論されていません。

今のAIは「なぜそう判断したか」を説明できない

AIが医療診断を補助し、採用審査に使われ、ローンの可否を判定する時代になりました。しかしこれらのシステムの多くは、依然として「ブラックボックス」です。入力に対して出力を返すことはできても、その判断プロセスを人間が理解できる形で説明することができない。

この問題に取り組む研究領域がXAI（Explainable AI：説明可能なAI）です。LIME（Local Interpretable Model-agnostic Explanations）やSHAP（SHapley Additive exPlanations）といった手法が開発され、「なぜこの予測をしたか」を事後的に近似する試みは進んでいます。しかし2026年時点においても、これらの手法はあくまで「事後的な近似説明」であり、モデルが実際に何をしているかを完全に解明したものではありません。

ブラックボックス問題が深刻なのは、単に「仕組みが分からない」という知的な不満に留まらないからです。誰が責任を負うのかが不明確になる。バイアスが潜んでいても検出できない。法制度が要求する説明可能性を満たせない。医療・司法・金融のような「説明責任が不可欠な領域」での活用が、根本的に難しくなります。

AIをどう「責任ある形」で使うか——RAIとガバナンスの問い

XAIが技術的な問いだとすれば、RAI（Responsible AI：責任あるAI）は制度・社会的な問いです。公平性、透明性、プライバシー、安全性をどう担保するか。これは国際的な議論の場でも焦点になっています。

日本では2025年5月にAI推進法（AIに係る技術の研究開発及び利活用の促進に関する法律）が国会で成立し、同年9月にAI戦略本部が設置されました。ただし日本のアプローチはEU AI法のような罰則規定を設けず、ガイドラインと業界の自律的対応を中心とする「ソフトな規制」路線です。これはイノベーションを阻害しないという観点では評価できますが、一方でガバナンスの実効性をどう担保するかという問いは残ります。

EU AI法との比較、米国の分野別規制アプローチとの比較も含め、「何をもって責任あるAIとするか」の基準はまだ国際的に統一されていません。AGIのような、より強力なシステムが登場したとき、現在の枠組みで対応できるのかという問いも、今まさに議論されている最中です。

Transformerを使い続けてAGIは実現できるのか

現在のAIの主流アーキテクチャはTransformerです。GPT系列からGemini、Claudeに至るまで、大規模言語モデルの大部分はTransformerをベースにしています。そしてここ数年の性能向上の多くは、このアーキテクチャのままモデルを大きくし、データを増やす「スケーリング」によって達成されてきました。

しかしこのスケーリング路線の持続可能性に、疑問符が付き始めています。MMULやHumanEvalといった従来のベンチマークでは、フロンティアモデルの多くが90%超のスコアを記録するようになり、差別化の指標として機能しなくなりました。モデルを大きくするための計算コストは指数関数的に増大しており、物理的な限界が近づいているという見方もあります。

Transformerは「見たことのあるパターンを補間する」ことは得意ですが、「まったく新しい問題を少数の例から解く」流動的推論には構造的な弱点があるという指摘があります。この限界を超えるために、Mamba（状態空間モデル）、JEPA（Joint Embedding Predictive Architecture）、ニューロシンボリックAIなど、新たなアーキテクチャの研究が加速しています。ただしこれらはまだ研究段階のものが多く、商用スケールでの検証はこれからです。

「TransformerのスケーリングだけではAGIに届かない」という立場と、「スケーリングはまだ限界に達していない」という立場が並立している状況です。AGIが実現するかどうか以前に、現在の技術路線で実現できるのかという根本的な問いが、研究者のあいだで真剣に議論されています。

「人間を超えた知能」をどう測るか

AGIの議論でもう一つ見落とされがちなのが、ベンチマーク問題です。「AGIが実現した」と誰がどうやって判断するのか。

ARC-AGI（Abstraction and Reasoning Corpus）は、人間には簡単だがAIには難しいタスクを通じて「流動的知能」を測ろうとするベンチマークです。OpenAIのo3モデルはARC-AGI-1で人間の平均スコアを超えましたが、その直後にARC-AGI-2、さらにARC-AGI-3が開発されており、ベンチマーク自体がAIの進化を追うように更新されています。

この構図は「AGIの定義とベンチマークが追いかけっこをしている」状態とも言えます。あるタスクでAIが人間を超えるたびに、「それは本当の知能ではない」と定義が書き換えられる。これは知性の本質をどう定義するかという哲学的問いと直結しており、純粋な技術的問題ではありません。

日本語で議論できる場がなかった

以上の問いはすべて、現在進行形の未解決問題です。そしてその多くは英語圏の研究機関・企業・財団の内部で議論されており、日本語でアクセスできる情報は限られています。

日本でもAI推進法の成立によって制度的な議論の枠組みは整いつつありますが、企業の実務担当者、政策立案者、学術研究者、一般市民がそれぞれの立場からAGIについて議論できる「共通の土台」は乏しい状況です。AGI Hubが目指すのは、この分断を埋めることだと読み取れます。

「過度に楽観することも、過度に悲観することもなく、不確実性を正面から受け止める」という創業者コメントは、AGIをめぐる議論の難しさをよく示しています。何が問題なのかを整理すること自体が、まず必要な仕事です。

【編集部後記】

AGIが「来るかどうか」の前に、「何が問われているか」を理解することが出発点です。私たちも、これらの問いを日本語で考え続けていきたいと思います。

【関連記事】

AGIは2026年にも到来か？OpenAI・Anthropicトップの予測から読み解く準備すべき未来
AGIの到来時期について、主要AI企業のトップ予測と専門家の見解の幅を整理した記事。

Anthropic、AIの隠れた目的を発見する「アライメント監査」技術を開発
AIが隠れた目的を持っている可能性を技術的に検証するアライメント監査の最新研究を解説した記事。

XAI(説明可能AI）がビジネスを変える？：横浜国立大学人工知能研究拠点長長尾先生にインタビュー

【参考記事】

From Black Box to Glass Box: A Practical Review of Explainable Artificial Intelligence (XAI)｜MDPI（外部）
XAIの技術動向・LIME/SHAPなどの手法・2025〜2030年のロードマップを包括的に整理した査読論文。「情報開示における限界収益逓減」という経済学的概念を用いてXAIの限界も論じている。

Inside the AI Black Box, for Real This Time — The 2026 State of AI Interpretability and Explainability｜Adnan Masood PhD（外部）
2026年時点のXAI研究の重心変化を論じた技術解説。LIME/SHAPから「メカニスティック解釈」へという潮流を整理している。

ARC-AGI-3: A New Challenge for Frontier Agentic Intelligence｜arxiv（外部）
AGI評価の最前線であるARC-AGI-3の設計論文。TransformerのスケーリングがなぜAGIに届かないかを技術的に説明しており、AGIベンチマーク問題を考える上で重要な一次資料。

AI Regulation Japan 2025: Key Policies & Governance Guide｜Nemko Digital（外部）
日本のAI推進法・AI戦略本部設置の経緯と企業への影響をまとめたガイド。

Japan’s emerging framework for responsible AI: legislation, guidelines and guidance｜International Bar Association（外部）
日本のAIガバナンスの三本柱（AI推進法・AI事業者ガイドライン・既存法の解釈指針）を国際的な比較のなかで整理した解説記事。

【用語解説】

AGI（Artificial General Intelligence：汎用人工知能）
特定タスクに特化した現在の「ナローAI」とは異なり、人間のように多様な知的タスクを自律的にこなせる人工知能。実現時期・定義・測定方法については研究者のあいだで見解が大きく分かれており、確立された共通定義はない。

XAI（Explainable AI：説明可能なAI）
AIモデルの判断プロセスを人間が理解できる形で説明しようとする研究領域。LIME・SHAPなどの手法が代表的。現状の多くの手法は「事後的な近似説明」にとどまり、モデルの内部動作を完全に解明するものではない。

AIアライメント（AI Alignment）
AIシステムの目標・行動・価値観を人間の意図と一致させる取り組み。強力なAIが人間の望まない行動を取ることを防ぐための技術的・理論的研究を指す。AIセーフティの中核テーマのひとつ。

RAI（Responsible AI：責任あるAI）
公平性・透明性・説明可能性・プライバシー・安全性などの観点から、AIを倫理的・社会的に責任ある形で開発・運用する枠組み。国や機関によって具体的な定義は異なる。

スケーリング則（Scaling Laws）
モデルの規模（パラメータ数）・データ量・計算量を増やすほど性能が向上するという経験則。2024年以降、この関係が頭打ちになりつつあるという指摘が相次いでいる。

ARC-AGI（Abstraction and Reasoning Corpus）
François Cholletが設計したAGI評価ベンチマーク。少数の入出力例から未知のパターンを発見する「流動的知能」を測ることを目的とし、AIの能力向上に合わせてARC-AGI-1・2・3と段階的に更新されている。