Last Updated on 2025-04-02 18:10 by admin
アリババグループは、フラッグシップAIモデル「Qwen 3」(通義千問3)を早ければ2025年4月中にもリリースする計画であることを報じた。
この発表は、中国のAIスタートアップ「DeepSeek」の急速な台頭を受けて激化するAI競争の中で行われている。DeepSeekは2025年1月10日に「DeepSeek-R1」をリリースし、1月27日にはUS App Storeで無料アプリの1位となり、ChatGPTを上回った。同日時点でDeepSeekのモバイルアプリはApp StoreとGoogle Play合わせて260万ダウンロードを達成している。
アリババは2025年1月29日(旧正月初日)に「Qwen 2.5-Max」をリリースした。このモデルはArena-Hardベンチマークで89.4%のスコアを達成し、DeepSeek-V3の85.5%を約4.5%上回った。また、STEMパフォーマンスのMATHベンチマークでは、Qwen 2.5-Maxが60.1%、GPT-4oが約58%、DeepSeek-V3が56%という結果を示している。
一方で、DeepSeekは2025年3月24日に「DeepSeek-V3」の安定版をリリースしており、ロイターの2月の報道によれば、DeepSeekは5月までに次世代モデルをリリースする計画だという。
AI企業各社は、DeepSeekが西側のライバルよりも安価に開発できたという新モデルでグローバルAI業界に衝撃を与えたことを受け、猛烈なペースで新製品をリリースしている。DeepSeekは2年前に登場したNvidia H800 GPUチップを使用するなどし、V3モデルの開発費を600万ドル未満のコストに抑えることに成功している。
from:Alibaba prepares for flagship AI model release as soon as April, Bloomberg News reports
【編集部解説】
アリババグループが新たなAIモデル「Qwen 3」(通義千問3)を近日中にリリースする計画が明らかになりました。この動きは、中国のAI企業DeepSeekの台頭を受けて激化する国際的なAI開発競争の一環と見られています。
DeepSeekは2025年1月に「DeepSeek-R1」をリリースし、1月27日にはUS App Storeで無料アプリの1位となり、ChatGPTを上回るという驚異的な成功を収めました。同日時点でDeepSeekのモバイルアプリはApp StoreとGoogle Play合わせて260万ダウンロードを達成し、111か国のApp Storeと18か国のGoogle Playで無料アプリのトップ10入りを果たしています。
注目すべきは、DeepSeekが従来の常識を覆す低コストでAIモデルを開発したことです。V3モデルの開発に要したコストはわずか600万ドル未満とされており、これは米国の大手テック企業が投じる巨額の開発費用と比較して驚異的に低い金額です。
アリババの「Qwen 2.5-Max」も高い性能を示しており、Arena-HardベンチマークやSTEMパフォーマンスのMATHベンチマークでは、自社の既存モデルや他社の最新モデルを上回る結果を示しています。
この状況は、AI開発における「コスト効率」の重要性を浮き彫りにしています。高性能なAIモデルを低コストで開発できれば、より多くの企業や研究機関がAI開発に参入できるようになり、イノベーションの加速につながる可能性があります。
また、中国企業の台頭は、AI技術における国際的な力関係にも影響を与える可能性があります。米中のAI開発競争が激化する中、日本を含む他国はどのような戦略を取るべきか、慎重に検討する必要があるでしょう。
長期的には、AIモデルの性能向上と低コスト化が進むことで、AIの社会実装がさらに加速すると予想されます。これにより、様々な産業分野で生産性が向上し、新たなサービスや製品が生まれる可能性があります。
【用語解説】
大規模言語モデル(LLM):
膨大な量のテキストデータを学習し、人間のような自然言語処理能力を持つAIモデル。言わば、言葉を理解し生成する巨大な人工頭脳のようなものだ。
オープンソース:
ソフトウェアの設計図(ソースコード)を公開し、誰でも自由に使用・改変・再配布できるようにする開発方式。料理のレシピを公開して、みんなで改良し合うようなものだ。
Mixture of Experts(MoE):
複数の専門家(エキスパート)モデルを組み合わせて、効率的に問題を解決するAI技術。様々な分野の専門家がチームを組んで問題解決にあたるようなイメージだ。
ベンチマーク:
AIモデルの性能を客観的に評価するためのテスト。Arena-HardやMATHなど様々な種類があり、それぞれ異なる能力を測定する。学校のテストのようなもので、各モデルの得意・不得意が分かる。
【参考リンク】
DeepSeek公式サイト(外部)
DeepSeekが開発したAIモデルやサービスの紹介、最新情報を提供している。
アリババクラウド Qwen Chat(外部)
アリババが開発したQwen AIモデルを無料で試せるチャットボットサービス。
Hugging Face – DeepSeekモデル(外部)
DeepSeekが公開しているオープンソースAIモデルをダウンロードできるプラットフォーム。
LiveBench(外部)
AIモデルのリアルタイム性能評価を提供するプラットフォーム。最新のAIモデル間の性能比較が確認できる。