Nous Researchは2025年2月14日、トグル式推論機能を持つAIモデル「DeepHermes-3 Preview」を発表しました。約3億9千万トークンのデータセットで学習された本モデルは、AIの思考プロセスを状況に応じて切り替えることを可能にします。
データセット構成と特徴
トレーニングデータは以下の比率で構成されています
- 一般的な指示:60.6%
- ドメイン専門家データ:12.8%
- 数学:6.7%
- ロールプレイと創作:6.1%
- コーディング:4.5%
- ツール利用とRAG:4.3%
- コンテンツ生成:3.0%
- 操縦とアラインメント:2.5%
【編集部解説】
AIの思考プロセスを自在に切り替える新時代へ
Nous Researchが発表したDeepHermes-3は、AIの思考プロセスを制御できる画期的なモデルとして注目を集めています。
従来のAIモデルは、推論モードか直感的な応答モードのどちらかに特化していましたが、DeepHermes-3は両方の機能を1つのモデルに統合することに成功しました。
技術的特徴と革新性
このモデルの最大の特徴は、ユーザーが必要に応じて「思考の連鎖(Chain of Thought)」を切り替えられる点にあります。システムプロンプトを変更するだけで、詳細な推論プロセスと素早い直感的な応答を使い分けることができます。
トレーニングデータは100万件の通常の応答と15万件の思考連鎖データで構成されており、多岐にわたる分野をカバーしています。
実用性と性能
MacBook Pro M4 Maxで28.98トークン/秒という処理速度を実現しており、一般的なPCでも十分な性能を発揮できます。
数学的推論においては、MATHベンチマークで67%のスコアを記録しています。これはDeepSeek社のR1-distilledモデルの89.1%には及びませんが、より汎用的な用途に特化したモデルとして位置づけられています。
業界への影響
この発表は、OpenAIやAnthropicなど大手AI企業の戦略にも影響を与えています。OpenAIはGPT-5で同様の統合アプローチを採用する予定であり、Anthropicも統合モデルの開発を進めているとされています。
今後の展望と課題
マルチターン対話での推論モードの持続性や、関数呼び出しとの組み合わせにおける一貫性など、いくつかの課題も報告されています。
しかし、このような課題は開発の初期段階では一般的であり、コミュニティからのフィードバックを活かして改善が進められる予定です。
まとめ
AIの「考える速度」をユーザーが制御できるようになることは、人間とAIの協調において重要な一歩となるでしょう。例えば、簡単な質問には即座に回答し、複雑な問題には時間をかけて慎重に推論するという、人間の思考プロセスに近い柔軟な対応が可能になります。
これは、AIを「ツール」としてだけでなく、より自然な「パートナー」として活用できる可能性を示唆しています。