中国のZ.ai(旧Zhipu AI)は2025年7月28日、総パラメータ数3550億・アクティブ320億の大規模言語モデル「GLM-4.5」と、総1060億・アクティブ120億の軽量版「GLM-4.5-Air」をMITライセンス(商用利用・改変・再配布が可能)で公開した。ハイブリッド推論とMoEを採用し、12種の標準ベンチマークで上位を獲得。
API料金はGLM-4.5が入力0.11ドル/出力0.28ドル(各100万トークン)と、Claude 3 Opusなど米国勢より大幅に安価。Z.aiは2025年1月15日に米国エンティティリスト入りしたが、モデル重みはHugging Faceなどで配布されている。
From: China’s efficient GLM-4.5 AI model shows high performance doesn’t need high cost
【編集部解説】
GLM-4.5シリーズは「性能=巨大インフラ」という従来の常識を覆す存在です。MoEにより総3550億パラメータを持ちながら推論時は320億だけを動かすため、8枚のNVIDIA H20で動作する省電力設計を実現しました。
注目すべきはAPI価格です。入力0.11ドル・出力0.28ドルという単価は、同等性能帯のClaude 3 Opus(入力15ドル・出力75ドル)と比べ100倍以上低く、独自ライセンスによりオンプレミス導入も選択できます(商用利用は要登録)。中小企業や自治体でも高度な推論・コーディングAIを扱える土壌が整いつつあります。
ただし地政学リスクは無視できません。Z.aiは2025年1月15日付で米国エンティティリストに掲載されました。現状、ソースコードや重みの入手自体は可能ですが、米国企業が公式APIを直接契約すると輸出管理法に抵触する可能性があります。導入検討時には法務・コンプライアンス部署との連携が欠かせません。
技術面では「思考モード/即応モード」を切り替えるハイブリッド推論がユニークです。長大なコード解析やエージェント型タスクでは思考モードで深い推論を行い、チャット応答や検索補助では即応モードで速度を優先することで、リソースと品質の最適化を図ります。
長期的には米中AI価格競争がさらに激化し、西側ベンダーもコスト圧力を受けるでしょう。同時に、オープンソース系LLMが企業ITの標準部品になることで、セキュリティ運用やモデルガバナンスの枠組みを早急に整備する必要があります。
【用語解説】
MoE(Mixture of Experts)
入力ごとに一部の専門サブネットのみ活性化し計算効率を高める手法。
ハイブリッド推論
思考モードと即応モードを用途に応じ自動切替する推論方式。
MITライセンス
商用利用・改変・再配布をほぼ無制限に許可する寛容なOSSライセンス。
エンティティリスト
米商務省が安全保障上懸念のある企業を掲載する輸出規制リスト。
【参考リンク】
Z.ai 公式(外部)
GLM-4.5/4.5-Airの概要、API申込、技術ブログを掲載。
Hugging Face(GLM-4.5)(外部)
重みと推論スクリプトを提供、商用利用も可能。
Zhipu AI Open Platform(外部)
国内向けAPI料金を公開。期間限定50%割引情報も掲載。
【参考動画】
GLM-4.5: Reasoning, Coding, and Agentic Abilities(外部)
技術構成、ベンチマーク詳細、設計思想を説明。
Zhipu AI Launches GLM-4.5, an Open-Source 355B AI Model(外部)
リリース発表とエンティティリスト問題を報道。
DeepSeekよりも安価に高性能のAIを使用できるオープンソースモデル「GLM-4.5」(外部)
12種類のベンチマーク結果、コーディング能力のデモ、他モデルとの性能比較を含む包括的な記事。
【編集部後記】
高性能AIが月額数百円で扱える時代が現実味を帯びてきました。もしあなただったら、このコストメリットを何に活かしてみたいですか?プロトタイピング、業務自動化、あるいはまったく新しいサービス創出――ぜひ皆さんのアイデアを聞かせてください。私たちも一緒に試行錯誤していきます。