【今日は何の日?】情報理論の父シャノン生誕─生成AIが「賢いのに嘘をつく」本当の理由

1948年、ベル研究所の静かな革命

4月30日―今日は「情報理論の父」クロード・エルウッド・シャノンが生まれた日です。1916年、米ミシガン州ペトスキーに産声を上げた一人の少年が遺した思想は、生誕から110年の時を超えて、いま私たちの掌の中で動く生成AIへと結実しています。その壮大な物語は、ある一つの「逆説」から始まりました。

時計の針を1948年に戻しましょう。ニュージャージー州マレーヒル、ベル電話研究所の薄暗い研究室で、一人の若き数学者が奇妙な遊びに没頭していました。机の上には、英語の小説から無作為に切り取られた単語の山。彼はそれをトランプのように繰りながら、ノートに何かを書きつけ、こう呟きます。「次に来る単語の確率は、直前の二単語によって、どれだけ規定されるだろうか」――。

その男こそ、当時32歳のシャノン。彼が紙の上で組み立てていたのは、後に『A Mathematical Theory of Communication(通信の数学的理論)』として20世紀を書き換えることになる、情報理論の骨格そのものでした。

驚くべきことに、彼が生成した文章は意味をなさない、文法的にもどこかぎこちない単語の羅列に過ぎません。ところがシャノンは、その「無意味な連なり」のなかに、人類の通信、計算、そして思考の未来そのものが折り畳まれていることを見抜いていたのです。

それから78年。彼が無造作に並べた単語の確率実験は、いま私たちのポケットの中で、ChatGPTという形をとって稼働しています。


「意味」を排除したことが、デジタル化の始まりだった

シャノンの最も革命的な決断、それは「情報から意味を切り離す」ことでした。

それまで通信といえば、「何を伝えるか」――愛の言葉、株価、戦況報告――その内容こそが本質だと考えられていました。しかしシャノンはこの常識を真逆にひっくり返します。「通信工学が扱うべきは、メッセージの意味ではない。それを正確に再現できるかどうかという、純粋に数学的な問題だ」と。

意味(セマンティクス)を放棄する代わりに、彼は情報を「ビット」という純粋な量として定義しました。1か0か。ある事象が、他のあり得た事象に対してどれだけ「不確実性」を減少させたか。それだけが情報の正体なのだ、と。

これは奇妙な逆説です。本質と思われていたものを捨てた瞬間に、世界は「計算可能」になった。意味を切り離したからこそ、声も画像も動画も、すべて等しくビットへと還元できる。今日のデジタル文明は、シャノンが「意味を捨てる」と決断した、その瞬間に産声を上げたのです。

イノベーションの本質は、しばしばここにあります――何を加えるかではなく、何を勇気を持って削ぎ落とすか。


シャノンの「Nグラム」実験は、GPTのプロトタイプだった

シャノンが冒頭の実験で手作業で行っていたのは、現代でいう「Nグラム言語モデル」のシミュレーションでした。

直前のN個の単語から次の単語を確率的に予測する。彼はこの方法で、徐々に「英語らしさ」が立ち上がってくる様を観察します。1グラム(単語をランダムに並べる)では完全な意味不明な羅列。2グラム、3グラムと文脈窓を広げるにつれ、文章は驚くほど「英語らしく」なっていく――しかし、決して意味を理解しているわけではない。

この光景に、既視感を覚えないでしょうか。GPTをはじめとする現代のLLMがやっていることの本質は、まさにこれです。文脈ウィンドウ内のトークン列から、次のトークンの確率分布を計算し、最も確からしいものを選ぶ。違いは、Nが2や3ではなく、数十万トークンにまで拡張されたこと。確率推定がカウントベースから巨大なニューラルネットワークに置き換わったこと。それだけです。

つまり、現代のAIは「思考」しているのではありません。シャノンが1948年に紙とペンで示した確率論を、最新のGPUクラスタと数千億のパラメータを使って、圧倒的なスケールで実行しているにすぎない――この視点を持てるかどうかが、AI時代を読み解く分水嶺になります。


なぜAIは「ハルシネーション(幻覚)」を起こすのか

ここまで来れば、生成AIの「ハルシネーション」――もっともらしい嘘――の正体も見えてきます。

それはバグではありません。エラーでもありません。シャノン理論から見れば、ハルシネーションは「確率的な最適解」が必然的に生む産物なのです。

LLMは「真実」を出力するよう設計されてはいません。「確からしいトークン列」を出力するように訓練されています。確からしさと真実は、しばしば一致しますが、本質的には別物です。実在しない論文を引用し、ありえない人物の経歴を流暢に語るとき、AIは「嘘をついて」いるのではない――シャノンが定義した情報空間のなかで、最も統計的に自然な経路を辿っているだけなのです。

意味を捨てた地平で動くシステムが、意味の正しさを保証できない。これは欠陥ではなく、シャノンの設計思想の論理的帰結です。


未来予測:シャノンを超えて「意味の通信」へ

そしていま、AI研究は静かに、しかし確実に、シャノンが意図的に切り捨てた「意味」を取り戻そうとしています。

近年注目を集める「セマンティック通信(Semantic Communication)」は、ビットの正確な再現ではなく、意味の正確な伝達を目指す新たなパラダイムです。RAG(検索拡張生成)、ファクトチェック層、世界モデル、シンボリックAIとの統合――これらはすべて、確率的羅列の上に「意味の階層」を再構築する試みだといえるでしょう。

シャノンが「捨てた」ものを、彼の理論の上に「載せ直す」。これは復古ではなく、止揚(アウフヘーベン)です。

2026年4月30日、シャノン生誕110周年。彼が一度切り離した「意味」と「量」、二つの河はいま、再び合流しようとしています。情報理論の次の革命が、どこかの研究室で、また一人の若者によって、静かに始まっているのかもしれません。


Information

【用語解説】

ビット (bit)
情報量の最小単位である。シャノンは「2つの等確率の選択肢のうち1つを特定するのに必要な情報量」を1ビットと定義した。binary digitの略であり、現代デジタル文明の根本単位となっている。

エントロピー
情報源が持つ平均的な不確実性、あるいは情報量の期待値である。シャノンは熱力学のエントロピーとの数学的類似に着目し、情報理論の中核概念に据えた。値が大きいほど予測困難で、情報量も大きい。

セマンティクス(意味論)
言葉や記号が指し示す「意味」を扱う学問領域である。シャノンは通信工学の対象から意味を意図的に除外することで、情報を数学的に定量化する道を拓いた。

Nグラム (N-gram)
連続するN個の要素(単語や文字)の並びを統計的に扱う手法である。直前のN-1個から次の要素を予測する確率モデルは、初期の機械翻訳から現代の大規模言語モデルまで、自然言語処理の系譜を貫く基本原理だ。

LLM(大規模言語モデル)
膨大なテキストで訓練され、文脈に基づいて次のトークンを確率的に予測するニューラルネットワークの総称である。GPTシリーズなどがこれに該当し、シャノンのNグラムモデルの直系の発展形と位置づけられる。

ハルシネーション
生成AIが事実と異なる情報をもっともらしく出力する現象である。確率的に「自然」な系列を選ぶアーキテクチャの必然的副産物であり、根絶よりも検出と管理が現実的課題となっている。

RAG(検索拡張生成)
Retrieval-Augmented Generationの略で、LLMが回答を生成する前に外部知識ベースから関連情報を検索し、その文脈を踏まえて出力する手法である。ハルシネーション抑制の代表的アプローチとして注目を集めている。

セマンティック通信
ビット列の正確な再現ではなく、メッセージの「意味」の正確な伝達を最適化する次世代通信パラダイムである。6Gの中核技術候補の一つとされ、AIとの統合による情報通信の革新が期待されている。

【参考リンク】

Nokia Bell Labs(Claude Shannon Archive)(外部)
シャノンが1941年から1956年にかけて在籍し、情報理論を生んだ研究機関である。現在はノキアの研究部門として6Gや量子通信などの最先端研究を継承しており、同ページではシャノンの業績を辿る公式アーカイブが公開されている。

IEEE Information Theory Society(外部)
シャノンの1948年論文を起源とする、情報理論分野の世界的な学術団体である。IEEE傘下の分科会の中でも明確な「創設論文」を持つ唯一の学会とされ、毎年シャノン賞(Shannon Award)を授与している。

OpenAI(外部)
ChatGPTおよびGPTシリーズを開発する米国のAI研究機関である。シャノン理論の延長線上にある大規模言語モデルを世界規模で実用化し、現在の生成AIブームの起点となった。

A Mathematical Theory of Communication / Wiley Online Library(外部)
シャノンが1948年に発表した情報理論の原典論文である。掲載誌Bell System Technical Journalの公式アーカイブを継承するWileyのデータベース上で閲覧できる。

【参考動画】

Tech Icons: Claude Shannon(AT&T Tech Channel公式)
ベル研究所の親会社であったAT&Tが運営する公式チャンネルが制作した、シャノンの生涯と業績を辿る短編映像である。情報理論誕生の歴史的背景を、当事者企業のアーカイブ視点から確認できる。

【関連記事】

4月19日【今日は何の日?】フレデリック・ブルックスの誕生日――「銀の弾丸はない」と語ったソフトウェア工学の巨人
ソフトウェア工学の巨人ブルックスの誕生日を、現代のAI時代から再評価する記事である。同じ「歴史的技術者の誕生日 × 現代テクノロジーへの接続」というフォーマットを共有する先行記事として、本記事と並べて読むと20世紀計算機科学の系譜が立体的に浮かび上がる。

4月13日【今日は何の日?】レーダーの父ワトソン=ワット誕生と未来のセンシング
レーダーの発明者ワトソン=ワットの誕生日を起点に、現代のセンシング技術の進化を辿る記事である。「○○の父」と称される20世紀の技術者を現代テクノロジーの系譜に位置付けるアプローチが、本記事(情報理論の父シャノン)と共通する。

2月7日【今日は何の日?】1956年人間とコンピュータの「対話」の始まり
1956年、人間とコンピュータの初期対話が始まった日を扱う記事である。シャノンの1948年情報理論はその後の人間-機械間コミュニケーションの理論的基礎となっており、時系列的にも論点的にも本記事と直接接続する位置にある。

投稿者アバター
TaTsu
『デジタルの窓口』代表。名前の通り、テクノロジーに関するあらゆる相談の”最初の窓口”になることが私の役割です。未来技術がもたらす「期待」と、情報セキュリティという「不安」の両方に寄り添い、誰もが安心して新しい一歩を踏み出せるような道しるべを発信します。 ブロックチェーンやスペーステクノロジーといったワクワクする未来の話から、サイバー攻撃から身を守る実践的な知識まで、幅広くカバー。ハイブリッド異業種交流会『クロストーク』のファウンダーとしての顔も持つ。未来を語り合う場を創っていきたいです。