ーTech for Human Evolutionー

SynthID：Google DeepMindがAIテキスト透かし技術をオープンソース化｜AI生成コンテンツの信頼性確保へ前進

AI（人工知能）ニュース

Headline News

乗杉海

[公開]

2024年10月25日16:12

[更新]2025年7月15日

A_futuristic_digital_watermark_illustration_featur - innovaTopia

Google DeepMindは2024年10月23日、AI生成テキストを識別するためのウォーターマーク技術「SynthID」をオープンソース化すると発表した。

SynthIDの主な特徴

AI生成コンテンツに目に見えないウォーターマークを埋め込む技術
2024年5月にテキスト版がGeminiアプリとオンラインチャットボットに実装
テキスト版は現在Hugging Faceで無料公開中

技術的な仕組み

大規模言語モデルのトークン生成確率を調整してウォーターマークを埋め込む
テキストの品質や生成速度を損なわずに識別が可能
約2,000万件の会話データで検証済み

現在の制限事項

Googleのモデルで生成されたコンテンツのみ対応
大幅な書き換えや他言語への翻訳には弱い
事実情報を含むテキストでは精度が低下

開発責任者はGoogle DeepMindのリサーチ部門副社長であるプシュミート・コーリ氏で、この研究成果は科学誌「Nature」に掲載された。

from Google DeepMind is making its AI text watermark open source

編集部解説

Google DeepMindが発表したSynthIDのオープンソース化は、AI生成コンテンツの透明性と信頼性を高める重要な一歩となります。

SynthIDの仕組みを詳しく見ていきましょう。大規模言語モデル（LLM）は、文章を生成する際に「トークン」と呼ばれる単位で処理を行います。各トークンには次の単語として選ばれる確率が設定されており、SynthIDはこの確率分布を微調整することでウォーターマークを埋め込んでいます。

この技術の特筆すべき点は、テキストの品質を損なうことなくウォーターマークを埋め込める点です。Google DeepMindは約2,000万件のチャットボット応答を分析し、ユーザーがウォーターマーク付きと通常の応答の違いを認識できなかったことを確認しています。

しかし、いくつかの制限もあります。事実に基づく回答や、他言語への翻訳、大幅な書き換えが行われた場合は、ウォーターマークの検出精度が低下する傾向にあります。

この技術のオープンソース化により、他のAI開発者も自社のモデルにウォーターマーク機能を実装できるようになります。これは、AI生成コンテンツの識別を容易にし、フェイクニュースやディープフェイクなどの悪用防止に貢献すると期待されています。

長期的な視点では、AIウォーターマークの標準化が進むことで、デジタルコンテンツの信頼性確保における新たな枠組みが形成される可能性があります。これは、Web3時代におけるコンテンツの真正性証明の重要な要素となるかもしれません。

参考情報

【用語解説】

・ウォーターマーク：デジタルコンテンツに埋め込む目印や署名のようなもの。紙幣の透かしと同じように、コンテンツの真正性を証明する役割を果たす。人間の目には見えにくいよう設計されているが、専用のツールで検出可能。

【参考リンク】

Google DeepMind（外部）
2010年にイギリスで設立され、2014年にGoogleに買収された世界最先端の人工知能研究所。AlphaGoやタンパク質構造予測のAlphaFoldなど、画期的なAI技術を次々と開発し、2023年にはGoogle Brainと統合して現在の組織となった。

AI（人工知能）ニュース

Headline News

乗杉海

SF小説やゲームカルチャーをきっかけに、エンターテインメントとテクノロジーが交わる領域を探究しているライターです。 SF作品が描く未来社会や、ビデオゲームが生み出すメタフィクション的な世界観に刺激を受けてきました。現在は、AI生成コンテンツやVR/AR、インタラクティブメディアの進化といったテーマを幅広く取り上げています。デジタルエンターテインメントの未来が、人の認知や感情にどのように働きかけるのかを分析しながら、テクノロジーが切り開く新しい可能性を追いかけています。

記事一覧