innovaTopia

ーTech for Human Evolutionー

Deep Cogito、ハイブリッド推論機能搭載のオープンソースAIモデル「Cogito v1」をリリース – Llama 3を性能で上回る

 - innovaTopia - (イノベトピア)

Last Updated on 2025-04-09 17:56 by admin

サンフランシスコに拠点を置く新興AI研究企業Deep Cogitoが2025年4月8日に正式に立ち上げられ、オープンソースの大規模言語モデル(LLM)シリーズ「Cogito v1」をリリースした。このモデルはMetaのLlama 3.2をベースにファインチューニングされており、ハイブリッド推論機能を備えている。

Cogito v1モデルは、即時応答モードと「自己反省」モードの両方で動作可能で、後者はOpenAIのo1やDeepSeekのR1のような推論モデルに似た処理を行う。初期ラインナップには5つのサイズがあり、3B(30億)、8B(80億)、14B(140億)、32B(320億)、70B(700億)パラメーターのモデルが提供されている。

Deep Cogitoの共同創業者兼CEOのDrishan Aroraは、以前Googleでシニアソフトウェアエンジニアとして勤務し、Googleの生成検索製品向け大規模言語モデルの開発に貢献していた。もう一人の共同創業者Dhruv Malhotraは、Google DeepMindのプロダクトマネージャーを務めていた。同社は2024年6月に設立され、South Park Commonsから資金調達を行っている。

Aroraは自社のモデルについて「そのスケールにおいて最も堅牢なオープンモデル」であり、LLaMA、DeepSeek、Qwenなどの競合モデルを性能面で上回っていると主張している。特に70BモデルはLLaMA 3 70BをMMLベンチマークで上回り(91.4%対85.3%)、さらにLLaMA 4 Scout 109Bモデルのベンチマークスコアも上回っている(54.4%対53.3%)。

これらのモデルはHugging Face、Ollama、Fireworks AI、Together AIのAPIを通じて利用可能で、Llamaのライセンス条件の下で商用利用も可能となっている。月間7億ユーザーを超える場合はMetaからの有料ライセンスが必要となる。

同社はIDA(Iterated Distillation and Amplification)と呼ばれる独自のトレーニング手法を採用しており、モデルがより良い解決策を生成するために追加の計算リソースを割り当て、その強化された推論プロセスをモデルのパラメーターに蒸留する仕組みを取り入れている。Aroraはこの技術をGoogleのAlphaGoで使用された自己対戦戦略に例え、自然言語処理に応用したものだと説明している。

今後数ヶ月以内に、パラメーター数が109B、400B、671Bに達するさらに大規模なモデルもリリースする予定だとしている。

from New open source AI company Deep Cogito releases first models and they’re already topping the charts

【編集部解説】

今回のDeep Cogitoの登場は、オープンソースAI市場に大きな波紋を投げかけています。この新興企業が発表したCogito v1モデルシリーズは、単なる新しいLLMの登場ではなく、AIの思考プロセスそのものを変革する可能性を秘めています。

まず注目すべきは「ハイブリッド推論」という新しいアプローチです。従来のAIモデルは、即時応答型か推論型かのどちらかに分かれていましたが、Cogito v1はその両方の機能を1つのモデルに統合しています。これにより、単純な質問には素早く回答し、複雑な問題には時間をかけて「自己反省」するという柔軟性を実現しました。

このハイブリッドアプローチの背景には、OpenAIのo1モデルのような推論型AIが数学や物理学などの分野で示した優れた能力があります。これらの推論モデルは問題を段階的に解決し、自己検証を行うことで高い精度を実現していますが、その代償として計算コストと応答時間の増加がありました。

Deep Cogitoの革新的な点は、IDA(Iterated Distillation and Amplification)と呼ばれる独自のトレーニング手法にあります。この手法はGoogleのAlphaGoで使用された自己対戦戦略に似ており、モデルがより良い解決策を生み出すために追加の計算リソースを使い、その強化された思考プロセスをモデル自体のパラメーターに蒸留するというものです。

従来のAIトレーニングでは、人間の教師や大きな教師モデルによる監督が知能の上限を決めていました。しかしIDAでは、モデル自身が反復的に自己改善することで、その上限を超える可能性があります。これはAI開発における根本的なパラダイムシフトと言えるでしょう。

ベンチマークテストの結果を見ると、Cogito v1モデルは同サイズの競合モデルを多くの指標で上回っています。特に注目すべきは、70BモデルがLLaMA 3 70Bを性能面で上回り、さらにはLLaMA 4 Scout 109Bモデルのスコアも上回っているという点です。これは、パラメーター数だけがAIの性能を決めるわけではないことを示す重要な事例となっています。

この技術がもたらす可能性は計り知れません。複雑な推論と迅速な応答を状況に応じて使い分けられるAIは、科学研究、教育、ビジネス分析など幅広い分野で革新をもたらす可能性があります。例えば、医療診断では基本的な症状には即座に対応しながら、複雑なケースには慎重な分析を行うといった使い方が考えられます。

一方で、このような高度なAI技術の普及には潜在的なリスクも伴います。特に、同社が目標として掲げる「汎用超知能(general superintelligence)」の開発は、AIの安全性や倫理的な問題を改めて浮き彫りにするでしょう。人間の能力を超えるAIの開発は、適切な安全対策と規制の枠組みが不可欠です。

また、オープンソースモデルとしてリリースされることで、AIの民主化が進む一方、悪用のリスクも高まります。Meta(旧Facebook)のライセンス条件の下で商用利用が可能であるため、さまざまな企業がこれらのモデルを自社製品に組み込むことが予想されます。

長期的な視点では、Deep Cogitoのアプローチは、AIが単に人間の知識を模倣するだけでなく、独自の思考プロセスを発展させる方向へと進化する兆しを示しています。これは、AIと人間の協働の在り方や、知的作業の未来に大きな影響を与えるでしょう。

今後数ヶ月以内に、さらに大規模なモデル(109B、400B、671B)のリリースが予定されており、AIの能力がどこまで拡張されるのか、業界全体が注目しています。

【用語解説】

ハイブリッド推論(Hybrid Inference):複数の推論手法を組み合わせたアプローチ。Cogito v1の場合、標準的な即時応答と時間をかけた「自己反省」モードの両方を備えている。これは、簡単な質問には素早く答え、複雑な問題には時間をかけて考えるという人間の思考プロセスに似ている。

IDA(Iterated Distillation and Amplification):反復蒸留と増幅と訳される。AIが自己改善するための手法で、より多くの計算リソースを使って良い解決策を見つけ、その思考プロセスをモデル自体のパラメーターに取り込む(蒸留する)というプロセスを繰り返す。GoogleのAlphaGoが自己対戦を通じて強くなっていったプロセスに似ている。

自己反省(Self-Reflection):AIが自分の思考プロセスや回答を振り返り、改善する能力。最近の研究では、AIに自己反省させることで問題解決能力が大幅に向上することが示されている。

汎用超知能(General Superintelligence):ほとんどの人間よりも優れたタスクを実行でき、まだ想像もしていない新しい能力を発見できるAI。Deep Cogitoが目指す最終目標。

MoE(Mixture-of-Experts):専門家の混合モデルと訳される。複数の「専門家」ニューラルネットワークを組み合わせた構造で、入力に応じて適切な専門家を選択して処理を行う。より少ないリソースで大規模なモデルを実現できる。

【参考リンク】

Deep Cogito公式サイト(外部)AIの汎用超知能開発を目指すスタートアップの公式サイト。Cogito v1モデルの詳細情報やダウンロード方法を提供している。

Hugging Face(Cogito v1ページ)(外部)AIモデルの共有プラットフォーム。Cogito v1モデルをダウンロードして利用できる。

Ollama(外部)ローカル環境でLLMを簡単に実行できるツール。Cogito v1モデルをローカルPCで動かすことができる。

【関連記事】

AI(人工知能)ニュースをinnovaTopiaでもっと読む

author avatar
乗杉 海
新しいものが大好きなゲーマー系ライターです!
ホーム » AI(人工知能) » AI(人工知能)ニュース » Deep Cogito、ハイブリッド推論機能搭載のオープンソースAIモデル「Cogito v1」をリリース – Llama 3を性能で上回る