Last Updated on 2025-05-30 16:30 by admin
中国のAIスタートアップDeepSeekが2025年5月28日、オープンソース推論AIモデル「DeepSeek-R1-0528」をリリースした。
同社は香港の定量分析会社High-Flyer Capital Managementのスピンオフで、2025年1月20日にR1の初版を発表していた。新バージョンはMITライセンスで提供され、OpenAIのo3やGoogle Gemini 2.5 Proといった有料プロプライエタリモデルと推論能力でほぼ同等の性能を実現している。
AIME 2025テストでの精度は前バージョンの70%から87.5%に向上し、LiveCodeBenchでは63.5%から73.3%に上昇した。「人類最後の試験」では8.5%から17.7%と2倍以上の性能向上を示した。
推論プロセスは1問あたり平均23,000トークンで、前バージョンの12,000トークンから大幅に増加している。DeepSeek APIの価格は通常時間帯で100万入力トークンあたり0.14ドル、出力は2.19ドルに設定されている。
小型版のDeepSeek-R1-0528-Qwen3-8Bも同時にリリースされ、80億パラメータでQwen3-8Bを10%上回る性能を達成している。
From: DeepSeek R1-0528 arrives in powerful open source challenge to OpenAI o3 and Google Gemini 2.5 Pro
【編集部解説】
技術的な背景と意義
DeepSeek-R1-0528が注目される理由は、単なる性能向上を超えた構造的な革新にあります。このモデルは6850億パラメータのMixture-of-Experts(MoE)アーキテクチャを採用し、推論時には約370億パラメータのみが活性化される設計となっています。この効率的な構造により、大規模モデルでありながら実用的な運用が可能になりました。
推論能力の飛躍的向上
最も注目すべきは推論プロセスの深化です。AIME 2025テストにおいて、前バージョンが1問あたり平均12,000トークンで思考していたのに対し、新版では23,000トークンまで拡張されています。これは人間の数学者が複雑な問題に取り組む際の思考プロセスにより近づいたことを意味します。
オープンソース戦略の戦略的意味
DeepSeekがMITライセンスでの完全オープンソース化を継続している点は、AI業界の競争構造に大きな影響を与えています。OpenAIのo3やGoogle Gemini 2.5 Proといった有料モデルと同等の性能を無料で提供することで、AI技術の民主化を加速させる一方、既存の商用AIサービスのビジネスモデルに挑戦状を叩きつけています。
実用性の向上
今回のアップデートでは、JSON出力対応や関数呼び出し機能の追加により、企業システムへの統合が大幅に簡素化されました。また、幻覚率の削減により信頼性が向上し、実用性が大幅に高まっています。
小型モデルの戦略的意義
DeepSeek-R1-0528-Qwen3-8Bは、AIME 2024でQwen3-8Bを10%上回り、Qwen3-235B-thinkingと同等の性能を達成しています。これにより、限られた計算リソースでも高度な推論能力を利用できるようになり、AI技術の普及がさらに加速する可能性があります。
潜在的なリスクと課題
一方で、これほど高性能なAIモデルが無制限に利用可能になることには懸念もあります。悪意のある利用者による不正使用や、既存のAI企業の収益構造への影響、さらには中国発の技術への依存度増加といった地政学的なリスクも考慮する必要があります。
規制への影響
DeepSeekの成功は、AI技術の輸出規制の実効性に疑問を投げかけています。アメリカが中国への半導体輸出を制限する中で、これほど高性能なモデルが開発されたことは、規制政策の見直しを促す可能性があります。
長期的な展望
DeepSeek-R1-0528の登場は、AI開発における「オープンソース vs クローズドソース」の競争を新たな段階に押し上げました。今後、他の企業もオープンソース戦略を採用する可能性が高く、AI技術の発展速度がさらに加速することが予想されます。また、R2モデルの開発も進行中とされており、AI業界の競争はますます激化していくでしょう。
【用語解説】
AIME(American Invitational Mathematics Examination)
アメリカの高校生向け数学競技で、極めて高難度の問題が出題される。AIの数学的推論能力を測る重要なベンチマークとして使用されている。
LiveCodeBench
Hugging Faceが開発したコード生成AIの評価ベンチマーク。実際のプログラミングタスクでAIの機能的正確さを測定し、Pass@1スコアで性能を評価する。
Mixture of Experts(MoE)
大規模AIモデルのアーキテクチャ技術。複数の専門家ネットワークを持ち、入力に応じて最適な専門家のみを動的に選択することで、計算効率を向上させる。
システムプロンプト
AIがどのような質問やタスクに対しても一貫した対応ができるよう、基本的なルールや方針を設定するもの。AIの「性格や行動」を決定する。
幻覚(ハルシネーション)
AIが事実に基づかない情報を生成してしまう現象。信頼性の向上には幻覚率の削減が重要とされる。
MIT License
最も寛容なオープンソースライセンスの一つ。商用利用、改変、再配布が自由に行える。
トークン
AIが処理するテキストの最小単位。単語、単語の一部、句読点などが含まれる。推論の深さはトークン数で測定される。
【参考リンク】
DeepSeek公式サイト(外部)
中国のAIスタートアップDeepSeekの公式サイト。無料でR1モデルを試用でき、APIサービスも提供している。
Hugging Face – DeepSeek-R1-0528(外部)
DeepSeek-R1-0528の公式モデルページ。詳細な技術仕様とベンチマーク結果を確認できる。
DeepSeek API Documentation(外部)
DeepSeekのAPI利用ガイドと価格情報。開発者向けの詳細な実装方法が記載されている。
High-Flyer Capital Management(外部)
DeepSeekの親会社である香港の定量分析ヘッジファンド。AI技術を活用した量的取引を専門とする。
OpenAI(外部)
ChatGPTやo3モデルを開発するアメリカのAI企業。DeepSeekが性能比較の対象としている主要な競合企業。
Google AI(外部)
Gemini 2.5 Proを開発するGoogleのAI部門。DeepSeekが目標とする性能レベルの一つ。
【参考動画】
【編集部後記】
DeepSeek-R1-0528の登場により、高性能なAI推論モデルが完全無料で利用できる時代が到来しました。みなさんは普段の業務や学習で、どのような推論タスクに苦労されていますか?数学の複雑な証明、プログラミングのデバッグ、ビジネス戦略の分析など、これまで時間のかかっていた作業が劇的に効率化される可能性があります。実際にDeepSeekを試してみて、その推論プロセスの透明性や精度をご自身で体験されてはいかがでしょうか。オープンソースの力がAI業界をどう変えていくのか、一緒に見守っていきましょう。
【参考記事】
DeepSeek’s Minor AI Update Quietly Matches Google’s Flagship Model Performance(外部)
DeepSeek-R1-0528の性能評価と市場への影響について詳細に分析した記事。
Chinese AI start-up DeepSeek pushes US rivals with R1 model – Reuters(外部)
ロイターによるDeepSeek-R1-0528リリースの報道。地政学的な観点からの分析も含む。
DeepSeek Upgrades AI Reasoning Model to Rival OpenAI, Google – PYMNTS(外部)
DeepSeekの技術的背景とビジネスへの影響について詳しく解説した記事。
【関連記事】
AI(人工知能)ニュースをinnovaTopiaでもっと読む