Alibaba「Qwen3.7-Max」発表、35時間自律稼働の新AIとZhenwu M890チップで挑むエージェント時代

中国・杭州で開催されたAlibaba Cloud Summit 2026で、Alibabaが「中国のAIファクトリーを構築する」と宣言しました。発表されたのは、最大35時間自律稼働するという大規模言語モデルQwen3.7-Max、自社開発のAIチップZhenwu M890、128基のアクセラレータを束ねるスーパーノードサーバーPanjiu AL128。チップからクラウド、AIモデル、エージェント基盤まで5層すべてを自社で揃えるフルAIスタック戦略は、米国の輸出規制下で国産代替を進める中国テック企業の最前線を象徴するものです。Anthropic Claude CodeやQoderにも対応するこのモデルが世界中の開発者に届くとき、AI業界の地図はどう塗り替わるのか――エージェント時代の本格突入を告げる発表を、複数の海外報道と公式情報をもとに解説します。


Alibabaは2026年5月20日、中国・杭州で開催されたAlibaba Cloud Summitにおいて、フルAIスタックの包括的アップグレードを発表した。最新の大規模言語モデルQwen3.7-Maxは、自社ベンチマークにおいて最大35時間の連続稼働と1,000回超のツール呼び出しを管理したとされ、OpenClaw、Hermes Agent、Claude Code、Qwen Paw、Qoderに最適化されている。Model Studioを通じて世界の開発者向けに提供予定である。

インフラ面ではPanjiu AL128スーパーノードサーバーを発表し、128基のAIアクセラレータを単一ラックに統合、PB/s規模の帯域幅を実現する。中国市場ではBailianで利用可能となり、Agentic RLを導入した。半導体子会社T-Headは、144GBメモリと800GB/sのチップ間帯域幅を備え、FP32からFP4までをネイティブサポートするZhenwu M890、25.6Tbpsの総帯域幅を持つICN Switch 1.0、ソフトウェアスタックT-Head SAIL™を発表した。Zhenwuは累計56万台超を出荷し、20業界400社超に導入されている。

From: 文献リンクAlibaba Announces Comprehensive Full-Stack AI Upgrade for the Agentic Era

【編集部解説】

今回のAlibabaの発表は、単なる新製品ラインナップの追加ではなく「フルAIスタック」を自社展開する数少ない事業者であるという宣言です。Alibaba Cloud上級副社長のリウ・ウェイガン氏はサミットで「私たちが構築しているのは中国のAIファクトリーだ」と語り、チップ、エージェンティック・クラウド、AIモデル、モデルサービス基盤、エージェント・アプリケーションという5つの層すべてを統合運用する姿勢を打ち出しました。なお、公式ブログ本文には「May 20, 2025」との表記もありますが、ページ日付や関連公式記事、ReutersやSCMPの報道はいずれも2026年5月20日で一致しており、公式本文側の年表記ミスと考えられます。

ここで注目したいのは、今回のリリースが「モデル単体の競争」から「スタック全体の競争」へとAI業界のフェーズが移行しつつあることを象徴する一例である点です。OpenAIやAnthropicがモデル中心、NVIDIAがチップ中心で覇権を争うのに対し、Alibabaは垂直統合型の戦略で勝負を仕掛けています。

Qwen3.7-Maxの「35時間連続稼働、1,000回超のツール呼び出し」という数値は強烈なインパクトを持ちますが、ここには注意が必要です。これらはAlibabaおよびQwen側の社内ベンチマークに基づく主張であり、第三者による独立検証はまだ存在しません。Qwen公式ブログでは「約35時間、1,158回のツール呼び出し、432回のカーネル評価」と具体的な条件が記載されていますが、現時点で同モデルは「Preview」段階にあり、オープンウェイト版もリリースされていないと報じられています。

それでも、長時間自律稼働という方向性自体は、主要AI企業が注力する潮流の一つです。これまでのAIは数分から数時間のタスクが中心でしたが、エージェンティックAIは「一晩寝ている間に、AIが調査・コーディング・検証を完遂している」という世界観を目指しています。Qwen3.7-MaxがClaude CodeやQoderなど他社・自社の主要エージェントフレームワークに最適化されている点は、Alibabaがプラットフォーマーとしての地位を狙っていることを示唆しています。

ハードウェア面のZhenwu M890については、もう一段冷静な見方が必要です。海外報道・分析によれば、同チップのFP16性能は0.6 PFLOPsで、NVIDIA A100と同等、中国向け輸出規制対応版のH20と比べれば約3倍の性能とされています(数値はAlibaba公式本文では確認できず、二次報道ベース)。一方でNVIDIAの最新世代Blackwellとは依然として大きな差があり、立ち位置としては輸出規制下の中国市場におけるH100世代の代替候補と見られています。

ただしこの「H100代替」というポジションこそが地政学的に大きな意味を持ちます。米国の輸出規制により中国企業はH100以上の高性能チップを正規に購入できないため、国産代替の存在自体が、中国市場で競争するための重要な前提条件になります。Huaweiが提供する国産AIチップ「Ascend」の存在感が高まる中、Alibabaも56万台超の出荷実績を掲げて競争に参戦しています。

経済規模も見過ごせません。Alibabaはクラウドおよび AIインフラに3年間で3,800億元(約530億ドル)という同社過去10年の累計AI支出を上回る投資を表明しており、半導体子会社T-HeadのIPO計画も報じられています(時期等は正式未開示)。さらにAlibaba公式によれば、AIモデル・アプリケーション事業のARR(年間経常収益換算)は2026年末までに300億元(約41億ドル)に到達する見込みとされており、AIが収益エンジンとして実体化しつつあります

日本のテック関係者にとっての示唆は明確です。第一に、エージェンティックAIのインフラ要件は「メモリ容量」「チップ間帯域」「低精度演算」という従来とは異なる軸で評価される時代に入りました。第二に、米中の二極化が進む中で、グローバルに展開する日本企業はモデル選定において複数の選択肢を確保しておく必要性が高まっています。

リスク面では、自律稼働時間の長期化に伴う「制御不能性」と「説明責任の所在」が新たな論点になります。Alibabaが「Bailian(百炼)」プラットフォームに安全ガバナンス機能を組み込んだのは、この課題への先回りした対応と読み取れます。1,000回超のツール呼び出しを伴う長時間タスクで何かが起きたとき、どの段階の判断に責任があるのかという問いは、技術と同じ速度で法制度が追いついていない領域です。

長期的な視点では、2027年第3四半期に投入予定とされる後継チップZhenwu V900(メモリ216GB、帯域1,200GB/sと報じられる)、2028年のJ900という公開ロードマップが示すように、中国のAI半導体は性能面でBlackwell世代との差を残しつつも、独自エコシステムの構築では着実に前進しています。世界のAIインフラの地図が今後数年で大きく書き換わっていく予兆として、本件は記憶しておくべき発表だと考えます。

【用語解説】

フルAIスタック(Full AI Stack)
AIサービスを構成する技術層を、半導体チップ、クラウドインフラ、基盤モデル、モデルサービス基盤、エージェントアプリケーションといった複数のレイヤーで縦に積み重ねた構造のこと。すべての層を自社で揃えると最適化や差別化が容易になる一方、巨額の投資と技術力が必要となる。

エージェンティックAI(Agentic AI)
人間の指示を受けるたびに応答する従来型のAIと異なり、目標を与えれば自律的に複数ステップを判断・実行するAIの総称である。コードを書く、ファイルを編集する、Webを検索するといった「ツール呼び出し」を組み合わせて長時間タスクを完遂する。

ツール呼び出し(Tool calls)
LLMが外部のソフトウェアや関数を呼び出して操作する仕組みである。検索、コード実行、ファイル読み書きなどを内部で連鎖させることで、AIが単なる文章生成器から「作業者」へと進化する基盤となる。

ロングホライズン・タスク(Long-horizon task)
完了までに長時間・多ステップを要するタスクのこと。途中で文脈を見失わず、エラーから回復しながら最終目標に到達できる持続力が求められる、エージェンティックAIの核心的な評価指標である。

HBM3(High Bandwidth Memory 3)
GPUなどのAIチップに搭載される高帯域メモリの第3世代規格である。LLMの巨大なパラメータを保持・処理するために不可欠で、容量と帯域がAIチップの性能を左右する。

FP4/FP32(浮動小数点精度)
数値計算における精度の表現単位である。FP32は高精度な学習向け、FP4は4ビットで表現する超低精度フォーマットで、推論時の高速化とコスト削減に有効とされる。

PB/s(ペタバイト毎秒)/Tbps(テラビット毎秒)
データ転送速度の単位である。1PB/sは1秒間に約100万GBを転送する規模で、大規模AIクラスタでは複数チップ間の通信速度がボトルネックになるため重視される。

Agentic RL
エージェントの実行結果をフィードバックとして使う強化学習(Reinforcement Learning)の手法である。実世界での試行錯誤からモデルを継続的に改善していくアプローチで、自律タスクの精度向上に直結する。

AIファクトリー(AI Factory)
学習と推論を連続的に回す仕組みを「工場」と捉える概念である。NVIDIAのジェンスン・フアンCEOがしばしば用いる表現でもあり、AIを電力や鉄鋼のようなインフラ産業として再定義する世界観を示している。

Bailian(百炼)
Alibaba CloudのModel Studioの中国国内向け名称である。Qwenシリーズなどを企業がAPI経由で利用できる生成AIプラットフォームで、今回の発表でAgentic RLや安全ガバナンス機能が追加された。

ARR(Annual Recurring Revenue)
年間経常収益換算のこと。サブスクリプション型ビジネスにおいて毎月の経常収益を12か月分に換算した指標で、安定的な収益基盤の規模を示す。

LM Arena
ユーザーが2つのAIモデルの回答を匿名で比較投票し、相対的な性能順位を決めるベンチマークプラットフォームである。ベンダー公表値に頼らない実利用評価として業界で広く参照されている。

Huawei Ascend/Cambricon
いずれも中国の国産AIチップの代表的存在である。米国の輸出規制下でNVIDIA代替を担う国内勢として、T-Headとともに中国の半導体自給率向上の中核を成す。

【参考リンク】

Alibaba Cloud 公式サイト(外部)
Alibaba Groupのクラウド・AI事業を担う中核子会社の公式サイト。本記事で発表されたQwenなどの製品群を統括する。

Qwen 公式サイト(外部)
Alibabaが開発する大規模言語モデル「Qwen(通義千問)」シリーズの公式ポータル。最新モデル情報や開発者向けドキュメントを提供する。

Alibaba Cloud Model Studio(外部)
QwenシリーズなどをAPI経由で利用できるAlibaba Cloudの生成AIプラットフォーム。中国市場では「Bailian(百炼)」名称で展開される。

T-Head(平头哥半导体/Pingtouge Semiconductor)公式サイト(外部)
Alibaba傘下の半導体設計子会社の公式サイト。Zhenwuシリーズなど AIアクセラレータの設計開発を担う。

Alibaba Group 3,800億元投資発表(外部)
3年間で3,800億元(約530億ドル)のクラウド・AIインフラ投資計画を発表したAlibaba Group公式リリース。

NVIDIA 公式サイト(外部)
GPUおよびAIアクセラレータ市場の世界的リーダーの公式サイト。H100、H200、Blackwellなど本記事の比較対象製品を展開する。

Anthropic(Claude Code)公式サイト(外部)
AnthropicのエージェンティックコーディングツールClaude Codeの公式ページ。Qwen3.7-Maxが対応を表明した主要フレームワークの1つ。

【参考記事】

Qwen3.7: The Agent Frontier(Alibaba Cloud公式)(外部)
Qwen公式ブログによるQwen3.7-Maxの詳細解説。35時間連続稼働の内訳として1,158回のツール呼び出しと432回のカーネル評価という具体条件を公開している。

Alibaba Unveils New AI Chip, Flagship Model, and Rebuilt Cloud Stack AI for Agentic Era(外部)
Alibaba Cloud公式によるスタック全体の解説記事。AI事業のARRが2026年末に300億元(約41億ドル)到達見込みとの数値も明記。

Alibaba unveils new AI chip in push for domestic alternatives(Reuters)(外部)
ロイターによる一次取材。Zhenwu M890発表を中国の半導体自給率強化の文脈で報じ、V900・J900の投入計画にも言及。

Alibaba Targets NVIDIA’s Hopper With Zhenwu M890 AI Chip, Claiming 3x The H20 Performance, 144GB HBM3 & A Roadmap Through 2028(外部)
Zhenwu M890のFP16性能0.6 PFLOPsがNVIDIA A100同等、H20の約3倍とされる二次報道。V900・J900の公開ロードマップも紹介。

Alibaba’s proprietary Qwen3.7-Max can run for 35 hours autonomously(VentureBeat)(外部)
Qwen3.7-MaxがproprietaryモデルとしてAnthropicのClaude Codeなど外部ハーネスをサポートすると報じた分析記事。

Alibaba unveils new Qwen model, custom chips in bid to become China’s AI factory(SCMP)(外部)
リウ・ウェイガン氏の「中国のAIファクトリーを構築している」発言と、AIスタック5層すべてを保有する戦略的位置付けを報じた一次取材記事。

Alibaba Ramps Up AI Push With New Chip, Model Upgrades(Wall Street Journal)(外部)
WSJによる総合報道。Eddie Wu氏がAI製品をAlibaba Cloudの主要収益成長ドライバーと位置づけたコメントを伝える。

Alibaba unveils the Zhenwu M890 as China’s NVIDIA alternative push hardens(TNW)(外部)
Zhenwu M890をNVIDIA H100世代の代替と位置付け、輸出規制下の中国市場では実質的代替となり得るとの独立評価。T-Head IPO計画にも言及。

【関連記事】

アリババが仕掛けるエージェンティックAI「Wukong」―ビジネスの自動化はどこまで進むか
Alibabaが2026年3月に発表したエンタープライズ向けエージェンティックプラットフォーム「Wukong」を解説。今回のフルAIスタック戦略の前段として位置付けられる重要な動き。

アリババがQwen3-Omni発表と530億ドルAI投資計画、欧州・南米にデータセンター展開へ
今回の編集部解説でも触れた3,800億元(530億ドル)のAI/クラウド投資計画を詳細に扱う関連記事。Alibabaのグローバル戦略の全体像が掴める。

Anthropicが描く2028年、米中AI競争の2つのシナリオ ─ 半導体規制が分ける未来
今回の記事の地政学的背景である米中半導体競争を、Anthropic視点で読み解く関連記事。

Qwen3-Coder-Next登場:80Bパラメータでも3Bだけ稼働、ローカル実行可能なコーディングAI
Qwenシリーズのコーディング特化版の発表記事。Qwen3.7-Maxのエージェンティック・コーディング能力の系譜が理解できる。

Huawei Ascend 910C:NVIDIAに挑む中国製AIチップ、米中ハイテク競争の新局面
T-Head Zhenwu M890の競合となる中国国産AIチップHuawei Ascendを扱う記事。中国半導体エコシステム全体の理解に有用。

【編集部後記】

「AIに一晩仕事を任せて、朝起きたら完成している」――そんな働き方が、本当に現実味を帯びてきました。今回のAlibabaの発表は遠い中国の話に見えるかもしれませんが、皆さんが日常的に触れているClaude CodeやQoderといったツールにもQwen3.7-Maxは最適化されており、選択肢は確実に広がっています。

もし手元のプロジェクトでエージェントに任せてみたいタスクがあれば、それは何でしょうか。複数のモデルを試し比べてみる週末、というのも面白そうです。皆さんが「未来に触れた瞬間」、ぜひ聞かせてください。

Googleで優先するソースとして追加するボタン
投稿者アバター
TaTsu
『デジタルの窓口』代表。名前の通り、テクノロジーに関するあらゆる相談の”最初の窓口”になることが私の役割です。未来技術がもたらす「期待」と、情報セキュリティという「不安」の両方に寄り添い、誰もが安心して新しい一歩を踏み出せるような道しるべを発信します。 ブロックチェーンやスペーステクノロジーといったワクワクする未来の話から、サイバー攻撃から身を守る実践的な知識まで、幅広くカバー。ハイブリッド異業種交流会『クロストーク』のファウンダーとしての顔も持つ。未来を語り合う場を創っていきたいです。