innovaTopia

ーTech for Human Evolutionー

DeepSeek V3が Mac Studioで毎秒20トークン処理を実現 — OpenAIの悪夢となるオープンソースAI革命

DeepSeek V3が Mac Studioで毎秒20トークン処理を実現 — OpenAIの悪夢となるオープンソースAI革命 - innovaTopia - (イノベトピア)

Last Updated on 2025-03-26 14:44 by admin

中国のAIスタートアップDeepSeekは2025年3月24日、新しい大規模言語モデル「DeepSeek-V3-0324」をAIリポジトリHugging Faceに正式発表なしに静かに公開した。

このモデルは641GBのサイズで、6850億パラメーターを持ち、MITライセンスで提供されるため商用利用が無制限に可能である。特筆すべき点は、9,499ドル(約142万円)のApple Mac StudioのM3 Ultraチップ上で4ビット量子化した状態で毎秒20トークン以上の処理速度を実現していることだ。

このモデルはMixture-of-Experts(MoE)アーキテクチャを採用しており、685億パラメーターのうち特定のタスクに応じて約370億パラメーターのみを活性化させる設計となっている。さらにMulti-Head Latent Attention(MLA)とMulti-Token Prediction(MTP)という革新的技術を導入し、出力速度を約80%向上させた。Mac Studioは推論時に200ワット未満の電力しか消費せず、従来のNVIDIA GPUベースのAIインフラが数キロワットを消費することと比較して大幅な省エネを実現している。

初期テスターによると、DeepSeek-V3-0324はAnthropicのClaude Sonnet 3.5を上回るパフォーマンスを示しているという。モデルは現在、OpenRouterを通じたAPI利用や、DeepSeek自身のチャットインターフェース(chat.deepseek.com)で利用可能となっている。

DeepSeekのオープンソース戦略は中国のAI企業の動向を象徴しており、Baidu、Alibaba、Tencentなども同様にオープンソースAIモデルをリリースしている。これは米国のOpenAIやAnthropicが採用している有料APIモデルとは対照的なアプローチである。

また、今回のリリースはDeepSeekの次世代推論モデル「DeepSeek-R2」の基盤になるとみられ、4月頃に発表される可能性がある。NVIDIAのCEO Jensen Huangによれば、DeepSeekのR1モデルは「非推論型AIの100倍のコンピューティングリソースを消費する」とされており、R2モデルが登場すれば、OpenAIの次期フラッグシップモデルGPT-5への直接的な挑戦となる可能性がある。

from:DeepSeek-V3 now runs at 20 tokens per second on Mac Studio, and that’s a nightmare for OpenAI

【編集部解説】

今回のDeepSeek-V3-0324のリリースは単なるAIモデルの発表ではなく、AIの民主化における大きな転換点と言えるでしょう。この記事で報じられている内容を複数のソースで確認したところ、DeepSeekの新モデルは実際に3月24日にHugging Faceで公開されており、特に事前の発表や宣伝なく静かにリリースされたことが特徴的です。

まず注目すべき点は、このモデルがMac Studio上で動作する速度です。毎秒20トークン以上というのは、ChatGPTやClaudeなどの商用サービスに近いレスポンス速度であり、これまで大規模なデータセンターでしか実現できなかったパフォーマンスがコンシューマー向けハードウェアで実現されています。価格は高いものの、家庭やオフィスでの高度なAI活用の可能性を大きく広げるものです。

DeepSeekが採用しているMoE(Mixture-of-Experts)アーキテクチャについてもう少し詳しく説明しましょう。従来のAIモデルはすべてのパラメーターを常に使用していましたが、MoEでは特定のタスクに最適な「専門家」パラメーターのみを活性化させます。これは人間が様々な専門家に異なる質問を振り分けるのに似ていて、結果的に計算効率が劇的に向上するのです。

この技術革新の意義は単なる速度向上にとどまりません。エネルギー消費の観点からも注目に値します。記事によれば、Mac Studioは推論時に200ワット未満の電力しか消費しませんが、従来のNVIDIA GPUベースのAIインフラは数キロワットを消費します。気候変動が懸念される現在、AIの環境フットプリントの削減は極めて重要な課題です。

興味深いのは、DeepSeekの静かなリリース戦略です。西側のAI企業が綿密に計画された華々しい製品発表を行うのに対し、DeepSeekは空のREADMEファイルとモデルの重みだけをアップロードしました。この対照的なアプローチは、技術そのものに焦点を当てる中国企業の姿勢を表しているのかもしれません。

DeepSeekのようなオープンソースモデルの台頭は、AI業界のビジネスモデルにも大きな変化をもたらしています。米国のOpenAI、Anthropic、Cohereなどは有料APIモデルを採用していますが、無料で高性能なモデルが利用可能になれば、これらの企業は新たな価値提案を模索する必要があるでしょう。

また、中国と米国のAI開発哲学の違いも興味深い点です。米国企業が独自技術を囲い込む傾向がある一方、中国企業はオープンソース戦略を積極的に採用しています。これは単なるビジネス戦略の違いを超えて、技術発展の哲学の違いを表しているかもしれません。BaiduはErnie 4.5モデルを6月までにオープンソース化する予定であり、AlibabaTencentも特化型のオープンソースAIモデルをリリースしています。

このようなオープンソースAIの進展は、小規模企業やスタートアップにとって朗報です。これまでは巨額の資金がなければ最先端のAI技術を活用することは難しかったですが、DeepSeekのようなモデルが無料で利用可能になることで、イノベーションの民主化が促進されるでしょう。

ただし、早期ユーザーからはコミュニケーションスタイルの変化も報告されています。以前のDeepSeekモデルは会話的で人間らしい調子が評価されていましたが、V3-0324はより形式的で技術志向のペルソナを示しているようです。これは、カジュアルな会話よりも専門的・技術的なアプリケーション向けに意図的に設計されたものかもしれません。

次世代のDeepSeek-R2の登場が噂される中、OpenAIのGPT-5も近々リリースされるとされています。この競争がAI技術の急速な進化をさらに加速させることは間違いありません。私たちはAI革命の真っただ中にいると言えるでしょう。

【用語解説】

大規模言語モデル(LLM): テキストを理解・生成するAIモデル。膨大なデータで学習され、会話や文章作成などができる。

トークン: テキストの最小単位。英語で単語の一部や句読点など。日本語では1文字が約1.5トークンに相当。毎秒20トークンは、人間の会話に近い応答速度に相当する。

MoE(Mixture-of-Experts): 大量のパラメーターを持つAIに「専門家」を分けて、必要な部分だけ使う仕組み。例えるなら、多数の専門医がいる病院で、症状に応じて適切な医師だけが診察する方式。不要な専門家を起動しないため効率が大幅に向上する。

4ビット量子化: AIモデルのデータ精度を下げてサイズを小さくする技術。少し精度は落ちるが、元の1/8程度までサイズを削減できる。家具の「組み立て式」のように、完成品より小さく効率的に扱える形に変換する技術。

推論(Inference): 学習済みAIモデルが新しい入力に対して回答を生成すること。訓練とは異なり、新しい情報を処理して結果を出す段階。

パラメーター: AIモデルの中の調整可能な値。料理のレシピの調味料の量のようなもの。数が多いほど複雑な処理が可能になるが、計算リソースも多く必要となる。

MLA(Multi-Head Latent Attention): 長文脈でのコンテキスト維持能力を強化する技術。記憶力の向上と考えられる。

MTP(Multi-Token Prediction): 通常1回に1つのトークンを生成するところを、複数トークンを同時に生成する技術。出力速度の大幅向上につながる。

【参考リンク】

DeepSeek公式サイト(外部)
中国を拠点とするAI研究企業で、最先端のオープンソースAIモデルを開発・公開している。

Hugging Face(外部)
AIモデルの共有プラットフォームで、オープンソースAIコミュニティの中心地となっている。

OpenRouter(外部)
様々なAIモデルに統一されたインターフェースでアクセスできるサービス。DeepSeek-V3-0324も利用可能。

Hyperbolic Labs(外部)
Hugging Face上でDeepSeek-V3-0324の最初の推論プロバイダーとなった企業。

OpenAI(外部)
ChatGPTやGPT-4などの先進的なAIモデルを開発・提供している米国企業。

Anthropic(外部)
Claude AIを開発する米国のAI企業。安全で有用なAIの構築に重点を置いている。

【編集部後記】

いかがでしたか?オープンソースAIの進化は日々加速しています。皆さんの手元のMacでも最先端AIが動く時代が到来しつつあります。実際にDeepSeek-V3を試してみたい方は、OpenRouterからAPIアクセスできますよ。皆さんなら、AIのローカル実行とクラウドAPIのどちらを選びますか?オープンソースと商用モデル、それぞれの利点は何だと思いますか?SNSでぜひ皆さんのアイデアや経験をシェアしていただけると嬉しいです。AIの民主化の波に、一緒に乗っていきましょう!

【関連記事】

AI(人工知能)ニュースをinnovaTopiaでもっと読む

author avatar
TaTsu
デジタルの窓口 代表 デジタルなことをまるっとワンストップで解決 #ウェブ解析士 Web制作から運用など何でも来い https://digital-madoguchi.com
ホーム » AI(人工知能) » AI(人工知能)ニュース » DeepSeek V3が Mac Studioで毎秒20トークン処理を実現 — OpenAIの悪夢となるオープンソースAI革命