Last Updated on 2025-04-01 11:02 by admin
OpenAIのCEO Sam Altmanは2025年3月31日、数ヶ月以内に「推論能力を持つ強力な新しいオープンウェイト言語モデル」をリリースすると発表した。この発表はX(旧Twitter)で行われた。
この動きは、中国企業DeepSeekが2025年1月にリリースしたR1モデルの成功や、MetaのLlamaモデルの人気を受けてのものである。DeepSeek R1は671億のパラメーターを持ち、そのうち37億のパラメーターのみが前方パスで活性化される設計になっている。このモデルはMIT licenseの下でオープンソース化されており、商用利用も可能である。
DeepSeek R1の運用コストはOpenAIのo1モデルの約15〜50%と推定されており、Fireworks AIでの実行コストは入出力トークン100万件あたり8ドルである。一方、OpenAIのo1モデルは入力トークン100万件あたり15ドル、出力トークン100万件あたり60ドルのコストがかかる。
Altmanは1月にDeepSeekのモデルがリリースされた直後、「オープンモデルに関して、我々は歴史の間違った側にいる」と述べ、方向転換の兆しを示していた。今回の発表で「今、それを行うことが重要だと感じています」と付け加えた。
OpenAIの技術スタッフSteven Heidelは「今年、自前のハードウェアで実行できるモデルをリリースします」と述べている。また、AI安全性研究者のJohannes Heideckeは、オープンウェイトモデルが悪用されないよう厳密なテストを行うと述べた。
HuggingFaceの共同創設者兼CEOのClement Delangueは「これは素晴らしいニュースです。DeepSeekにより、誰もがオープンウェイトの力に気づき始めています」とコメントしている。
OpenAIは開発者に新モデルの早期アクセスへの応募を呼びかけるウェブページを公開し、今後数週間で新モデルの初期プロトタイプを使用した開発者向けイベントを開催する予定である。
from:Sam Altman Says OpenAI Will Release an ‘Open Weight’ AI Model This Summer
【編集部解説】
OpenAIが大きな方針転換を図ろうとしています。2025年3月31日、同社CEOのSam Altmanは数ヶ月以内に「推論能力を持つ強力な新しいオープンウェイト言語モデル」をリリースすると発表しました。これはGPT-2以来初となるオープンウェイトモデルのリリースとなります。
この発表の背景には、AIモデルの公開方針をめぐる業界の潮流変化があります。特に中国企業DeepSeekが2025年1月にリリースしたR1モデルの成功が大きな影響を与えています。DeepSeek R1は、OpenAIのo1モデルと同等以上の性能を持ちながら、オープンソースとして公開されたことで大きな注目を集めました。
オープンウェイトモデルとは、訓練済みのパラメーター(重み)が公開されているモデルのことです。これにより開発者は元の訓練データがなくても、モデルを検証したり特定の用途向けに調整したりすることが可能になります。完全なオープンソースモデルとは異なり、ソースコード全体や訓練データセット、方法論までは公開されない場合もあります。
業界動向とOpenAIの戦略変更
これまでOpenAIは主にクローズドなモデルを提供してきましたが、MetaがLlamaモデルを2023年7月に公開して以降、オープンモデルの流れが加速しています。Altman自身も「オープンモデルに関して、我々は歴史の間違った側にいる」と認めていました。
今回の決断には、コスト面での競争力も関係しているようです。DeepSeek R1は多くの大規模AIモデルと比較して格段に低いコストで訓練されたと言われています。OpenAIとしても、効率的なモデル訓練能力を示す必要性を感じているのかもしれません。
OpenAIの技術スタッフSteven Heidelは「今年、自前のハードウェアで実行できるモデルをリリースします」と述べており、これはクラウド依存からの脱却を意味します。これにより、ユーザーは機密性の高い情報処理などの用途にモデルを活用しやすくなるでしょう。
オープンウェイトモデルの可能性とリスク
オープンウェイトモデルの普及は、AI開発の民主化を促進する可能性があります。HuggingFaceの共同創設者兼CEOのClement Delangueが「DeepSeekにより、誰もがオープンウェイトの力に気づき始めています」と述べているように、多くの開発者がより自由にAIモデルを活用できるようになるでしょう。
一方で、OpenAIのAI安全性研究者Johannes Heideckeは、オープンウェイトモデルが悪用されないよう厳密なテストを行うと述べています。実際、一部のAI研究者はオープンモデルがサイバー攻撃や生物・化学兵器開発に悪用される可能性を懸念しています。OpenAIは「準備態勢フレームワーク」に基づき、破滅的なリスクをもたらすと判断したモデルはリリースしないとしています。
今後の展開と業界への影響
OpenAIは開発者向けに新モデルの早期アクセス応募ページを公開し、今後数週間で初期プロトタイプを使った開発者イベントをサンフランシスコで開催する予定です。その後、ヨーロッパやアジア太平洋地域でもイベントが予定されています。
この動きは、AIモデルの提供方法に関する業界全体の方向性に影響を与える可能性があります。現在、MetaのLlamaモデルにはトレーニングデータが非公開であることや、商用利用に制限があるなどの課題があります。OpenAIが今回どのようなライセンス形態でモデルを公開するかも注目されるでしょう。
【用語解説】
オープンウェイト(Open Weights)モデル:
機械学習モデルの学習済みウェイト(重み)のみを公開する形態。コードやデータセットは公開されないが、学習済みのパラメータを利用できるため、ゼロから学習する手間が不要となる。
オープンソースモデル:
モデルのコード、学習済みウェイト、データセットなど全てが公開されているモデル。オープンウェイトと異なり、完全に自由にカスタマイズや再学習が可能。
DeepSeek:
中国のAI企業で、2025年1月にR1モデルをリリースした。このモデルはOpenAIのo1と同等の性能を持つとされている。
DeepSeek-R1:
DeepSeekが開発したオープンで高性能な推論(Reasoning)能力を持つ大規模言語モデル。2025年1月に発表され、オープンウェイト形式で公開されている。
Llama:
Meta社が開発したオープンソースの大規模言語モデル。トランスフォーマー構造を基盤にした言語処理技術で、CommonCrawlやGitHub、Wikipediaなどの膨大なデータセットから学習している。
準備態勢フレームワーク:
OpenAIが使用するAIリスク管理の枠組み。NISTの「AIリスクマネジメントフレームワーク」(AI RMF)のような標準的なフレームワークを参考にしている可能性がある。
【参考リンク】
OpenAI(外部)
OpenAIの公式サイト。GPTシリーズなどのAIモデルを開発・提供している企業。
DeepSeek(外部)
DeepSeekの公式サイト。R1モデルを含む様々なAIサービスを提供している。
Meta AI(外部)
Meta社のAI研究部門の公式サイト。Llamaモデルなどを開発・公開している。
HuggingFace(外部)AIモデルのホスティングプラットフォーム。多くのオープンソース・オープンウェイトモデルが公開されている。
【編集部後記】
皆さん、AIの世界は日々変化しています。OpenAIのオープンウェイトモデル発表は、AIの民主化と安全性のバランスを考える絶好の機会かもしれません。もし自分でAIモデルを動かしてみたいと思ったことはありませんか?あるいは、オープン化が進むAI技術にどんな可能性を感じますか?SNSでぜひ皆さんの考えをシェアしてください。次回の記事では、実際にこれらのモデルを試してみた体験もお届けする予定です。