Last Updated on 2024-09-27 20:48 by admin
2024年9月25日、アレン人工知能研究所(Ai2)が新しいオープンソースのマルチモーダルAIモデル群「Molmo」を発表した。Molmoは4つのモデルで構成され、パラメータ数は1億から720億まで幅広い。
最大の720億パラメータモデルは、OpenAIのGPT-4oやGoogle、Anthropicの最新モデルと同等以上の性能を示し、画像理解や文書解析などのタスクで優れた結果を出した。
特筆すべき点は、7億パラメータの小規模モデルがGPT-4oに匹敵する性能を発揮したことだ。これは、Ai2が効率的なデータ収集と訓練手法を採用した結果とされる。
Molmoの訓練には、約60万枚の厳選された画像データセットを使用。これは一般的な数十億枚規模のデータセットと比べて非常に小規模だが、人間のアノテーターによる詳細な音声説明を活用することで高品質なデータを実現した。
また、Molmoは画像内の特定の要素を「指し示す」能力を持ち、ウェブエージェントやロボティクスへの応用が期待される。
Ai2はMolmoのデモを公開し、開発者向けにHugging Faceでも利用可能にする予定だ。これにより、オープンソースAI開発が商用モデルと同等の水準に達したことを示すとともに、効率的なリソース利用と透明性の高い開発アプローチを提示している。
from:A tiny new open-source AI model performs as well as powerful big ones
【編集部解説】
今回は、アレン人工知能研究所(Ai2)が発表した新しいオープンソースAIモデル「Molmo」について、詳しく解説していきます。
Molmoの登場は、AIの世界に大きな波紋を投げかけています。なぜなら、このモデルは完全にオープンソースでありながら、GPT-4oやGemini 1.5のような大手企業の最新モデルと同等以上の性能を発揮しているからです。
特筆すべきは、Molmoが非常に効率的な訓練方法を採用していることです。一般的なマルチモーダルAIモデルが数十億枚の画像データを使用するのに対し、Molmoはわずか60万枚程度の厳選された画像で訓練されています。これは、質の高いデータと効率的な訓練手法の重要性を示しています。
Molmoの特徴的な機能の一つに「指し示す」能力があります。これは、画像内の特定の要素を正確に指し示すことができるもので、ウェブエージェントやロボティクスの分野で革新的な応用が期待されています。
このモデルの登場は、AIの民主化に大きく貢献する可能性があります。オープンソースで高性能なモデルが利用可能になることで、中小企業やスタートアップ、個人開発者でも最先端のAI技術を活用できるようになるからです。
一方で、このような高性能なAIモデルが広く利用可能になることで、偽情報の生成や個人情報の悪用といったリスクも懸念されます。AIの倫理的な使用や、適切な規制の必要性がますます重要になってくるでしょう。
長期的な視点で見ると、Molmoのような効率的で高性能なオープンソースモデルの登場は、AI研究の加速化につながる可能性があります。多くの研究者や開発者がこのモデルを基に新たな応用や改良を行うことで、AIの進化がさらに加速することが期待されます。
最後に、Molmoの登場は、AIの世界がオープンソースと商用モデルの競争によって急速に進化していることを示しています。今後も、このような革新的なモデルの登場に注目していく必要がありそうです。