innovaTopia

ーTech for Human Evolutionー

Qwen3:アリババが中国初のハイブリッド推論AIをオープンソース化 – 「速い思考」と「遅い思考」を使い分ける次世代モデル

Qwen3アリババが中国初のハイブリッド推論AIをオープンソース化-速い思考と遅い思考を使い分ける次世代モデル.png - innovaTopia - (イノベトピア)

Last Updated on 2025-05-04 18:54 by admin

2025年4月29日、アリババグループは同社の最新大規模言語モデル「Qwen3(通義千問3)」を発表した。Qwen3は中国初のハイブリッド推論モデルで、「速い思考」と「遅い思考」の両モードを統合し、計算コストを削減する設計となっている。

Qwen3シリーズは全8種類のモデルで構成され、6つの密モデル(0.6B、1.7B、4B、8B、14B、32B)と2つのMixture-of-Experts(MoE)モデルが含まれている。MoEモデルは、フラッグシップモデルの「Qwen3-235B-A22B」(総パラメータ数2350億、有効パラメータ数220億)と軽量モデルの「Qwen3-30B-A3B」(総パラメータ数300億、有効パラメータ数30億)である。

これらのモデルはすべてオープンソースとして公開され、HuggingFaceやGitHub、アリババクラウドのオンラインインターフェースで無料で利用可能となっている。

Qwen3の特徴は、タスクの複雑さに応じて「詳細な段階的解答」と「迅速な応答」を切り替えられる2つの推論モードを備えていることで、速度と知性を両立させる柔軟な設計思想が採用されている。

アリババクラウドによれば、Qwen3-235B-A22Bはコーディング、数学、一般推論のベンチマークテストで優れた成績を収め、DeepSeek-R1、01.AIのo1およびo3-mini、Grok-3、Gemini 2.5 Proといった最先端モデルと互角の性能を発揮するという。

Qwen3は約36兆トークンという大規模データセットで訓練され、これは前モデルQwen2.5の2倍の規模である。また、119の言語と方言をサポートしており、多言語処理能力も強化されている。

DeepSeek R1と比較すると、Qwen3-235B-A22Bは必要なVRAM(ビデオメモリ)が約3分の1で済み、デプロイメントコストが大幅に削減されている。

from:Alibaba launches and open-source Qwen3, China’s first hybrid reasoning AI model

【編集部解説】

Qwen3の登場は、中国のAI開発における重要なマイルストーンといえます。「ハイブリッド推論」という新しいアプローチは、AIの思考プロセスにおける重要な進化を示しています。

このモデルの最大の特徴は、人間の認知科学で言われる「システム1(速い、直感的な思考)」と「システム2(遅い、熟考的な思考)」に似た二重処理理論を取り入れた点です。これにより、単純な質問には迅速に応答し、複雑な問題には段階的な思考プロセスを展開するという、状況に応じた最適な対応が可能になっています。

特筆すべきは、この高度なモデルをオープンソースとして公開した点です。これにより、研究者やデベロッパーが自由に利用・改変できるため、AI技術の民主化が促進されるでしょう。

ベンチマークテストの結果を見ると、Qwen3-235B-A22Bは多くの分野でGoogle Gemini 2.5 Proに次ぐ性能を示しており、特にCodeForces Eloという競技プログラミングのベンチマークではGemini 2.5 Proを上回る結果を出しています。これは中国のAI研究が世界最先端レベルに到達していることを示す証左といえるでしょう。

また、MoE(Mixture-of-Experts)アーキテクチャの採用により、2350億パラメータのうち実際に使用されるのは約220億パラメータと、効率的な設計になっています。これにより、DeepSeek R1と比較して必要なVRAM(ビデオメモリ)が約3分の1で済み、デプロイメントコストが大幅に削減されています。

Qwen3は119の言語と方言をサポートしており、多言語処理能力も強化されています。また、約36兆トークンという大規模データセットで訓練されており、これは前モデルの2倍の規模です。

中国のAI開発競争は激化しており、DeepSeek、Baidu(百度)のERNIE、ByteDance(字節跳動)のDoubaoなど多くの企業がLLMを開発しています。2024年までに中国では約200の生成AIモデルが登録・サービス開始され、6億人以上の登録ユーザーがいるとのデータもあります。

Qwen3の登場により、AIの応用範囲はさらに広がるでしょう。モバイルデバイス、スマートグラス、自動運転車、ロボティクスなど、次世代アプリケーションの構築に必要な柔軟性を提供しています。

一方で、こうした高度なAI技術の普及は、情報の信頼性や著作権、プライバシーなどの課題も提起します。特に中国のAI企業がアメリカの研究所との競争を激化させる中で、モデルトレーニングに必要なチップへのアクセス制限などの政策も実施されています。

今後、Qwen3のようなハイブリッド推論モデルは、AIの思考プロセスの質的向上をもたらし、より人間に近い判断能力を持つAIの開発につながる可能性があります。これは単なる性能向上を超えた、AIの新たな進化の方向性を示すものといえるでしょう。

【用語解説】

ハイブリッド推論モデル
「速い思考」と「遅い思考」の2つの思考モードを切り替えられるAIモデル。人間の思考プロセスに例えると、直感的な判断(速い思考)と論理的な分析(遅い思考)を状況に応じて使い分けるようなもの。

MoE(Mixture-of-Experts)
複数の「専門家」AIを組み合わせた構造。例えるなら、医師、機械工、料理人などの専門家チームがいて、問題に応じて最適な専門家が対応するようなシステム。全体のパラメータ数は大きいが、実際に使用するのは一部だけなので効率的。

トークン
AIが処理する文章の最小単位。日本語では大体1-2文字が1トークン。36兆トークンの学習データは、人間が数千年かけても読み切れない膨大な量の文章に相当する。

VRAM(ビデオメモリ)
AIモデルを動かすために必要なグラフィックカードのメモリ。大きなモデルほど多くのVRAMが必要になり、コストが高くなる。

【参考リンク】

Qwen公式サイト(外部)
Qwen3の公式ブログ。モデルの特徴や技術的詳細が掲載されている。

アリババクラウド(外部)
アリババグループのクラウドコンピューティングサービス。Qwen3を開発・提供している。

Qwen3 GitHub(外部)
Qwen3のオープンソースコードとモデルが公開されているリポジトリ。

Hugging Face Qwen(外部)Qwenモデルが公開されているHugging Faceのページ。オンラインでモデルを試すことも可能。

【参考動画】

【編集部後記】

AIの「思考法」が進化しています。Qwen3のような「速い思考」と「遅い思考」を使い分けるAIは、私たち人間の認知プロセスに近づいているのかもしれません。皆さんのビジネスや日常生活で、こうした二面性を持つAIをどう活用できるでしょうか?また、オープンソース化されたことで、日本の開発者コミュニティにどんな可能性が広がるのか、一緒に考えてみませんか?AIの進化を「観察する側」から「参加する側」へ-その扉は既に開かれています。

【関連記事】

AI(人工知能)ニュースをinnovaTopiaでもっと読む

投稿者アバター
TaTsu
デジタルの窓口 代表 デジタルなことをまるっとワンストップで解決 #ウェブ解析士 Web制作から運用など何でも来い https://digital-madoguchi.com
ホーム » AI(人工知能) » AI(人工知能)ニュース » Qwen3:アリババが中国初のハイブリッド推論AIをオープンソース化 – 「速い思考」と「遅い思考」を使い分ける次世代モデル