4月23日【今日は何の日?】YouTube最初の動画「Me at the zoo」公開から21年

サンディエゴ動物園のゾウ舎の前で、ハイキングジャケットを着た1人の青年が、ぎこちなくカメラに向かって話しかけていました。撮影していたのは彼の高校時代の友人、ヤコフ・ラピツキー。話し手はYouTube共同創業者の1人、ジョード・カリム。

その短い映像は、こう始まります。

「All right, so here we are in front of the elephants.」 (それじゃあ、ゾウの前に来ました)

わずか19秒。ピントは甘く、色はくすみ、今の目で見ればおよそ「コンテンツ」と呼ぶに値しないホームビデオです。けれども、この砂嵐のようなノイズの向こう側に、21世紀のインターネットのかたちが眠っていました。


カリムがこの映像をアカウント「jawed」からYouTubeにアップロードしたのは、2005年4月23日、太平洋夏時間(PDT)の夜20時31分のこと。「Me at the zoo」──人類が「動画」というメディアを手のひらで交換し合う時代の、紛れもない第1カットがこうして公開されました。

当時、動画をWebで再生するということは、重たいプラグインを読み込ませ、読み込みバーが終わるまでじっと待ち、画質の粗さに目をしばたたかせる行為でした。カリムたちが挑もうとしていたのは、その不便を「誰もが5分以内に動画を共有できる」体験へと置き換えることでした。21年後、私たちはその成果の中に暮らしています。


プラグインの終焉と、標準化への闘争

YouTubeが産声をあげた2005年前後、Web動画の世界はAdobe Flash Playerがほぼ独占していました。ブラウザに読み込ませたFlashプラグインが、FLV形式の動画ファイルを再生する。この構図がデファクトスタンダードだったのです。

しかしFlashは、PCのスペックを容赦なく食い、バッテリーを吸い上げ、セキュリティホールを生み、タッチ操作を前提としない「マウス時代の作法」で設計されていました。モバイル端末が世界の主役になろうとする時代と、致命的に相性が悪かったのです。

潮目を変えたのは、1通の公開書簡でした。2010年4月、当時アップルCEOだったスティーブ・ジョブズが『Thoughts on Flash』を発表し、自社のモバイル製品でFlashをサポートしない理由を6項目にわたって明快に列挙しました。曰く、Flashは閉じており、不安定で、電力を浪費し、タッチ時代にふさわしくない。代替となるべきは、オープンな標準規格であるHTML5と、映像コーデックとしてのH.264である──。

この書簡は技術的判断という以上に、産業の未来をめぐる政治的宣言でもありました。書簡の公開からおよそ5年後、YouTubeは既定の再生環境をHTML5に切り替えます。読者の皆さんが今、ブラウザを開いて何の意識もせずに動画を再生できているのは、この「プラグインなき世界」への移行が完了したあとの風景なのです。

プラグインの時代の終わりは、動画が「特殊な添え物」から「Webの構成要素」へと格上げされた瞬間でもありました。


ビットレートの聖戦──コーデック進化論

動画を「小さく、美しく、速く」届けるための数学的格闘──これがコーデックの歴史です。

同じ画質を半分のデータ量で送れれば、視聴者の通信費は半減し、配信事業者のサーバーコストも劇的に下がります。だからこそ、映像圧縮の研究は終わりなき軍拡競争の様相を呈してきました。

  • H.264(AVC):2000年代後半に標準の座を獲得した、長きにわたる覇者。互換性の高さは今も揺るぎません。
  • VP9:Googleが主導して開発した、HEVCのオープンな対抗馬。YouTube内では早くから採用されましたが、Googleエコシステムの外には広がりきらなかったという現実もあります。
  • AV1:Alliance for Open Media(AOMedia)が策定した、ロイヤリティフリーの次世代コーデック。Netflixの技術報告によれば、AV1セッションはAVCやHEVCと比べて帯域使用量を約3分の1削減しつつ、画質評価スコア(VMAF)でも上回るとされています。

そして2026年現在。ストリーミングメディア誌の年次サーベイでは、調査対象の40%が2026年中のAV1新規導入を計画しており、通年で産業全体の導入率は57%に達する見込みが示されています。Meta社員のハッセン・トマール氏は、業界カンファレンス「Streaming Media Connect 2025」において、Facebook・Instagram・Messengerでの視聴時間の約7割がすでにAV1で配信されていると明かしています。

一方で、アライアンスは2025年9月に次の世代AV2の開発を正式に発表。AV1比でさらに30%の圧縮効率向上を掲げ、8K配信やAR/VR用途を見据えています。Netflixのエンジニアは「AV2は未来であり、AV1は現在である」という言い方で、この過渡期を端的に表現しています。

ここで私たちが直視すべきは、YouTubeが「動画の博物館」であると同時に「動画の再製版工房」でもあるという事実です。アップロードから20年を経た「Me at the zoo」のような古い映像も、バックエンドでは静かに最新コーデックへと再エンコードされ続けています。アップロード時の画質の限界は変わらなくても、「配信に使われるデータ量」は年々効率化されてゆく。これは単なるコスト最適化ではありません。過去の映像を未来の帯域で運ぶための、地道な営みです。

「同じ画質を半分のデータ量で」──たった1行のスローガンの裏に、20年分の数学的イノベーションが積み重なっています。


YouTubeを支える三位一体のインフラ

コーデックだけでは、動画は届きません。今日の快適な視聴体験は、3つの領域が絡み合った「三位一体」の上に成立しています。

  1. 数学(コーデック):映像を最小のデータ量で表現するアルゴリズム。H.264からAV1、そしてAV2へと続く圧縮技術の系譜。
  2. 物理(通信インフラ):5G、6Gに向けた無線帯域の拡張、そして海底ケーブルと光回線。電波と光が運ぶビットの絶対量が、視聴の上限を決めます。
  3. 工学(クラウドとCDN):世界中に分散したCDN(コンテンツ配信ネットワーク)のエッジサーバーと、Google Cloudの大規模ストレージ。ユーザーに最も近いサーバーから映像を吐き出すことで、レイテンシーは実質的に消えていきます。

この3層が揃って初めて、「手元のスマートフォンで、地球の裏側の19秒の動画が即座に再生される」という当たり前が成立します。どれか1つでも欠ければ、私たちは2005年の読み込みバーの前に引き戻されます。

そしてもう1つ、見落とせない要素があります。Googleは、ユーザーがアップロードしたオリジナルの高品質ファイル(マスターファイル) と、配信用に変換する前段階のメザニン(中間)ファイルを、長期にわたって保管し続けていると見られています。

なぜそんなコストをかけるのか。理由は明快です。

  • 将来のコーデックへの再エンコードに備えるため。
  • AI超解像技術を適用して、過去の低解像度映像を4K・8Kで蘇らせる未来に備えるため。

言い換えれば、YouTubeのストレージ戦略は、単なるバックアップではなく「時間を飛び越える準備」なのです。オリジナルさえ残していれば、技術の進歩に応じて、過去の映像を何度でも再誕させられる。この思想は、映像アーカイブの歴史そのものに対する静かな敬意だと、私は受け止めています。


未来への展望

ここからは想像の領域です。

近い将来、「Me at the zoo」はAI超解像によって4K──いや、おそらく8K相当にアップスケーリングされ、ゾウの皮膚のシワひとつひとつまで描き直されるでしょう。ノイズの向こう側に隠れていたディテールが、ニューラルネットワークによって「それらしく」補間されて立ち上がる。そのとき、21年前の19秒は、私たちが最初に目にした姿とは別の表情を見せるはずです。

ここで立ち止まって考えたいのは、技術がアーカイブの意味を書き換えるという、この静かな革命の重さです。

2005年のあの日、ジョード・カリムは自分の撮った映像が21年後まで再生され続けるとは、おそらく想像していなかったでしょう。けれども彼が押したアップロードボタンは、「どこかの誰かの日常の断片を、全世界と同時に共有する」という、人類史において前例のない振る舞いの、正真正銘の始祖になりました。

20年以上が過ぎ、動画プラットフォームはもはや娯楽の枠を超え、教育、報道、外交、医療、科学研究にまで浸透しました。ロンドンのヴィクトリア&アルバート博物館は2026年2月、この動画と初期UIをコレクションに加え、「インターネットの歴史と文化を保存・記録する」試みの一環として公開しています。

19秒の象の前の映像が、21年後に博物館のガラス越しに展示される。その事実を前にすると、テクノロジーとは「未来を作る行為」であると同時に「過去を作り変える行為」でもあるのだと、あらためて実感させられます。

次の20年、私たちは何をアップロードし、何を未来に残すのでしょうか。AIが映像を生成し、AIが映像を復元する時代にあって、「人間が撮った19秒の手触り」は、むしろ希少な価値を帯びていくのかもしれません。


【用語解説】

メザニンファイル(Mezzanine File)
放送・配信業界で使われる中間ファイルの総称である。撮影時のマスターファイルからは圧縮されているが、最終配信用ファイルよりは高品質に保たれた「中間格(mezzanine=中二階の意)」の位置付けを持つ。YouTubeのようなプラットフォームでは、アップロード後に各配信形式へと再エンコードする際の基準となる原盤として運用されている。

AV1(AOMedia Video 1)
Alliance for Open Mediaが策定した、ロイヤリティフリーの次世代ビデオコーデックである。H.264(AVC)やHEVCと比較して大幅に高い圧縮効率を実現し、同等画質であれば帯域を約30〜50%削減できるとされる。NetflixやYouTube、Metaが主導的に採用を進めており、2026年時点でストリーミング領域の事実上の次世代標準となっている。Appleが2023年にM3およびA17 Proチップでハードウェアデコードを実装したことが、普及の最終的な引き金となった。

CDN(Content Delivery Network:コンテンツ配信ネットワーク)
地理的に分散したエッジサーバー群を経由して、ユーザーに物理的に近い場所から動画や画像などのコンテンツを配信するネットワーク基盤である。オリジンサーバーへの負荷を軽減し、レイテンシー(遅延)を大幅に縮小する役割を担う。AkamaiやCloudflare、AWS CloudFrontなどが代表例であり、YouTubeもGoogle自前のグローバルCDNを運用している。現代の動画配信が「瞬時に始まる」体験は、このエッジ配信の仕組みなしには成立しない。


【参考リンク】

Jawed Karim「Me at the zoo」(YouTube, 2005年4月23日)
本記事の出発点となった、YouTube史上最初の動画。19秒の映像そのものが、動画配信20年史の「ゼロ地点」である。

TechCrunch「YouTube Now Streams HTML5 Video By Default」(2015年1月27日)
YouTubeがHTML5をデフォルト採用した当日の報道。プラグイン時代の終焉を告げる節目のニュース。

Free-codecs.com「AV1 Codec Dominates Streaming Landscape as 2026 Begins」(2026年1月)
2026年時点でのAV1普及状況を総覧する記事。Netflixの帯域削減データや、Appleのハードウェアデコード対応経緯を網羅。

Streaming Media「How Meta Deploys AV1 on Facebook From Reels to Stories to Messenger」(2026年1月16日)
Meta技術プログラムマネージャーのハッセン・トマール氏が「AV1がMetaの視聴時間の約7割をカバーしている」と発言した、業界カンファレンス Streaming Media Connect 2025 のレポート記事。

Streaming Media Global『The State of Streaming Codecs 2026』
AV1、VVC、HEVC、VP9のライセンス動向と市場導入率を、産業レポートベースで分析した2026年春号の特集。

NETINT『2026 State of Video Encoding Report』
AV1の2026年導入計画(40%)、H.264の飽和(84%)など、エンコーディング業界の定点調査レポート。

Ateme「AV1: How Today’s Choices Define Tomorrow’s Video」
AV1と次世代コーデック(AV2、VVC)の技術比較を、配信事業者の視点から論じたホワイトペーパー。

Yahoo News「”Me at the zoo”: The first-ever video uploaded to YouTube video is being honored in a museum」
ロンドンのヴィクトリア&アルバート博物館が、「Me at the zoo」と2006年当時の初期YouTube UIをコレクション化したことを伝える報道。


【編集部後記】

「Me at the zoo」を久しぶりに再生したとき、正直に言うと、私はすこし笑ってしまいました。YouTubeの最初の1本が、ゾウの鼻が長いという素朴な観察で終わる──この肩の力の抜け方こそ、ひょっとすると動画共有というカルチャーの本質を、誰よりも早く体現していたのかもしれません。

テクノロジーの進化史というと、どうしてもコーデックや帯域幅といった硬い言葉が前面に出がちです。けれども、裏側でH.264がAV1に置き換わっていくのは、結局のところ「あなたの撮った何気ない19秒を、地球の裏側の誰かに気持ちよく届けたい」という、ただそれだけの願いを叶えるための営みなのだと思います。

Googleがマスターファイルを保管し続ける理由を知ったとき、私は少し安心しました。自分が撮った何でもない映像も、もしかしたら未来のAIによって、未来の解像度で、未来の誰かに見直される可能性がある。アーカイブとは、過去を閉じ込める行為ではなく、未来に開いておく行為なのだと、あらためて感じます。

次にスマートフォンで動画を撮るとき、あなたはどんな「19秒」を未来に送り出すでしょうか。その問いを、この記事が手渡せていたとしたら、書き手としてこれ以上の喜びはありません。

投稿者アバター
TaTsu
『デジタルの窓口』代表。名前の通り、テクノロジーに関するあらゆる相談の”最初の窓口”になることが私の役割です。未来技術がもたらす「期待」と、情報セキュリティという「不安」の両方に寄り添い、誰もが安心して新しい一歩を踏み出せるような道しるべを発信します。 ブロックチェーンやスペーステクノロジーといったワクワクする未来の話から、サイバー攻撃から身を守る実践的な知識まで、幅広くカバー。ハイブリッド異業種交流会『クロストーク』のファウンダーとしての顔も持つ。未来を語り合う場を創っていきたいです。