検索結果: Gemini 1.5
-
FrontierMath衝撃の結果:GPT-4やGemini 1.5も歯が立たない、AIの数学的推論能力の現在地
研究グループEpoch AIは2024年11月11日、最新のAI数学能力評価ベンチマーク「FrontierMath」の結果を発表しました 主な事実は以下の通り テスト結果 Epoch AIは今後もベンチマークの拡張と定期 […]
-
Google Gemini 1.5 Pro: OpenAIを凌駕する次世代AI、その革新性と課題
2024年2月15日、Googleは新しい生成AIモデル「Gemini 1.5 Pro」を発表した。このモデルは、100万トークン(約70万単語)の長文処理能力を持ち、画像、音声、ビデオ、コードなどのマルチモーダルな入力 […]
-
Google Cloud、Gemini 1.5のAIモデル公開で開発者に新たな可能性を提供
Google CloudがGemini 1.5 FlashとGemini 1.5 Proを公開。これらのAIモデルは開発者が高度なAIソリューションを開発するのを支援し、コンテキストキャッシングとプロビジョニングスループットの導入でコスト削減とスケーラビリティを実現します。【用語解説とAIによる専門的コメントつき】
-
Google、新型Gemini 1.5 Flash発表:高速タスク処理を実現
Googleが新しいAIモデル、Gemini 1.5 Flashを発表。200万トークンのコンテキストウィンドウを特徴とし、高速タスクに最適化。Gemini 1.5 Proも同様に拡張され、複雑なタスク向け。これらはGoogle AI StudioのGemini APIを通じて利用可能。AI技術の進化と応用範囲拡大に貢献。【用語解説とAIによる専門的コメントつき】
-
Google Gemini 1.5 Pro、音声ファイル解析機能を新たに獲得
GoogleがGemini 1.5 Proのアップデートを発表、音声ファイルの聞き取り機能を追加しました。この進化により、収益通話やビデオの音声から直接情報を抽出可能に。また、Imagen 2のアップデートで画像生成技術が強化され、画像の出所を特定する透かし機能も導入。これらの技術革新は、AIの応用範囲を広げる一方で、プライバシーやデータ安全性の課題も提示します。【用語解説とAIによる専門的コメントつき】
-
GoogleのGemini 1.5 Pro、大量データ処理の新境地を開く
GoogleのGemini 1.5 Proは、1Mトークンのコンテキストウィンドウで大量情報を処理。ビデオ、オーディオ、コード、テキストの理解・推論が可能。LLMアプリ開発に影響を与え、新たなRAGアーキテクチャの必要性を示唆。技術進化は、教育や医療など多岐にわたる分野での応用を期待させるが、倫理的・規制的課題も指摘。【用語解説とAIによる専門的コメントつき】
-
Googleが発表: Gemini 1.5で長文理解が飛躍的に向上
Googleが会話型AI「Gemini 1.5」を発表。性能向上と長文推論能力が特徴で、100万トークンコンテキストウィンドウにより、大量情報の処理が可能に。AI技術の進化が研究や教育に革新をもたらす一方で、倫理的・セキュリティの懸念も。【用語解説とAIによる専門的コメントつき】
-
Google DeepMind、省エネAI「Gemini 1.5 Pro」発表:大規模データ処理能力が向上
Google DeepMindが強化版AI「Gemini 1.5 Pro」を発表。ビデオ、テキスト、画像処理能力が向上し、以前のモデル「Gemini 1.0 Ultra」と同等の性能をより少ない計算能力で実現。最大1,000,000トークンの入力処理が可能に。この技術進歩はビデオ解析やテキスト抽出を革新し、教育や研究に貢献する可能性がありますが、プライバシーや誤情報のリスクも。【用語解説とAIによる専門的コメントつき】
-
Google、AIモデル「Gemini 1.5」発表:巨大コンテキストウィンドウで情報処理革命
GoogleがAIの新境地、Gemini 1.5を発表。この後継モデルは開発者と企業向けに先行提供され、一般ロールアウトも予定。100万トークンのコンテキストウィンドウで前モデルを大幅に上回る性能を実現。映画製作者や企業の大規模データ分析に革命をもたらす可能性あり。【用語解説とAIによる専門的コメントつき】
-
GoogleのGemini 1.5、次世代AIで性能大幅向上を実現
Googleが次世代AI「Gemini 1.5」を発表。効率的なアーキテクチャと拡張コンテキストウィンドウで性能向上を実現。MoE採用で学習効率と品質を保持し、多様なデータ処理能力を備える。開発者はAI StudioやVertex AIで試用可能。【用語解説とAIによる専門的コメントつき】
-
Alphabet社、AIモデルGemini Pro 1.5発表:他AIを圧倒する処理能力
Alphabet社がAI競争をリードするGemini Pro 1.5を発表。この強力なAIモデルは、大量のテキスト、ビデオ、オーディオを一度に処理し、開発者に新しいアプリケーション開発の可能性を広げます。専門家の混合技術で効率的に動作し、GoogleのAPIを通じて限定的に提供されます。【用語解説とAIによる専門的コメントつき】
-
ByteDanceが推論AI「Seed-Thinking-v1.5」を発表、OpenAIやGoogleを上回る性能を一部ベンチマークで実現
中国のウェブメディア大手でTikTokの親会社であるByteDanceは2025年4月11日、新しい大規模言語モデル「Seed-Thinking-v1.5」を発表した。このモデルは科学、技術、数学、工学(STEM)分野お […]
-
Google:Gemini2.0やAstra─AIアシスタントの概念を一新する革新的プロジェクト発表
OpenAIのGPT-4が市場を席巻する中、Google DeepMindは異なる道を選んだ。「理解する」AIアシスタントという新たな領域への挑戦。そこには、次世代プラットフォームの覇権を握るための周到な戦略が見え隠れす […]
-
Google Cloud、セキュリティ強化のための新プラットフォーム発表:Gemini AI活用で脅威対策を革新
Google Cloudが新しいGoogle Threat Intelligenceプラットフォームを発表。Gemini AIを活用し、Google、VirusTotal、Mandiantのデータを統合して脅威インテリジェンスを強化。セキュリティチームは迅速に脅威に対応し、組織を保護できるようになる。【用語解説とAIによる専門的コメントつき】
-
Gemini×Mandiant: Google Cloudのセキュリティが大幅進化。Google、迅速対応へ向け革新
GoogleがAIプラットフォームGeminiにMandiantのセキュリティ機能を統合し、サイバーセキュリティ攻撃の迅速な検出、停止、修復を可能にする新技術を発表。この進化は、Google Cloud Nextカンファレンスで紹介され、セキュリティオペレーションの効率化を目指す。【用語解説とAIによる専門的コメントつき】
-
Elon MuskのxAI、新AIモデル「Grok-1.5」発表、ChatGPTに挑戦
Elon MuskのxAIが革新的な言語モデル「Grok-1.5」を発表。OpenAIのGPT-4やAnthropicのClaude 3に匹敵する性能を持ち、特に推論や問題解決において改善。数学やコーディングタスクで高スコアを記録し、長文分析に適した128,000トークンのコンテキストウィンドウを特徴とする。Grok-1.5は、ChatGPTに対抗するxAIのXプラットフォーム上のチャットボットとして機能予定。【用語解説とAIによる専門的コメントつき】
-
GoogleのAI「Gemini」、歴史的人物の画像生成で論争に火をつける
GoogleのAI「Gemini」が歴史的人物の画像生成で誤り、右翼から批判を受け機能停止。多様性と歴史的正確性のバランスに挑むAI業界の課題を浮き彫りに。【用語解説とAIによる専門的コメントつき】
-
Claude 3.5 Sonnet、わずか5日でAI競技場の頂点に立つ!
新AIモデル「Claude 3.5 Sonnet」が公開5日後にLMSYS Chatbot Arenaでトップに。コーディングとハードプロンプトで1位、総合で2位に。GPT-4oやGemini 1.5 Proと同等性能を示し、AI業界に変革の可能性をもたらす。【用語解説とAIによる専門的コメントつき】
-
Google、AI技術の最前線を駆ける:年次開発者会議I/Oで新機能発表
Googleが開発者会議I/OでAI製品を発表。新検索機能、Gemini 1.5 Proのアップデート、高解像度ビデオ生成モデル「Veo」、画像生成モデル「Imagen 3」、AI Overviews、AIアシスタントProject Astra、第6世代TPU「Trillium」を披露。これらはOpenAI等の競合に対抗し、AI技術の迅速な展開を目指す。【用語解説とAIによる専門的コメントつき】
-
Microsoft Phi-4が完全オープンソース化、14Bの小規模モデルで大規模AIに匹敵する性能を実現
Microsoftは2025年1月8日、AIモデル「Phi-4」をHugging Faceで公開しました。主な特徴は以下の通りです モデルの主な仕様 性能評価 from:Microsoft makes powerful […]
-
OverallGPTでAIに質問してみた「クリスマスプレゼント、何にしたらいいかな?」5つの代表的なAIのオススメとは
「別れた彼女に贈るクリスマスプレゼントって、何がいいですか?」この質問に対する5つの代表的なAIの回答が、予想以上に興味深いものでした。保守的なアドバイスから斬新なアイデアまで、それぞれのAIが示した「最適解」とは・・ […]
-
AIスケーリングの新時代:「test-time compute」が切り開く次世代AI革新
2024/12/02 14:25:タイトルと内容修正※一般的でない単語が使われていたため、修正いたしました。 VentureBeatに掲載されたEdelmanのゲイリー・グロスマン氏による分析記事を基に、innovaTo […]
-
LLaVA-o1:中国発の新型VLMがOpenAIのo1モデルに挑む – 4段階推論で画像認識の精度を向上
中国の複数の大学の研究者チームが2024年11月22日、OpenAIのo1モデルに対抗する新しいビジョン言語モデル「LLaVA-o1」を発表した。 このモデルは、Llama-3.2-11B-Vision-Instruct […]
-
GitHub Copilot、3大AIモデルに対応へ ─ Anthropic、Google、OpenAIのモデルを自由に選択可能に。新ツール「GitHub Spark」も発表
GitHubは2024年10月29日(米国時間)、サンフランシスコで開催された年次開発者カンファレンス「GitHub Universe 2024」において、以下の発表を行った。 主な発表内容: 1. GitHub Cop […]
-
Google DeepMindのSCoRe:AIの自己修正能力を飛躍的に向上させる革新技術
2024年9月19日、Google DeepMindの研究チームが大規模言語モデル(LLM)の自己修正能力を向上させる新しい技術「SCoRe(Self-Correction via Reinforcement Learn […]
-
Molmo:Ai2が開発した革新的オープンソースAIモデル、GPT-4oを凌駕する性能を実現
2024年9月25日、アレン人工知能研究所(Ai2)が新しいオープンソースのマルチモーダルAIモデル群「Molmo」を発表した。Molmoは4つのモデルで構成され、パラメータ数は1億から720億まで幅広い。 最大の720 […]
-
Google NotebookLM、AI生成ポッドキャスト機能「Audio Overview」を導入 – 学習革命の到来か
Googleは2024年9月11日、AI駆動のノートテイキングアプリ「NotebookLM」に新機能「Audio Overview」を追加した。この機能により、ユーザーの研究内容をAIが生成した2人のホストによる会話形式 […]
-
Groqがテクノロジー大手を凌ぐAI言語モデルを発表、オープンソースで革新を牽引
Groq、AIハードウェアスタートアップがOpenAI、Googleを上回るオープンソース言語モデル「Llama-3-Groq-70B-Tool-Use」を発表。このモデルはBFCLでトップに輝き、AI開発の新たな可能性を示唆。合成データのみを使用し、プライバシーと環境への配慮も実現。AIアクセスの民主化に貢献するGroqの進化は、業界に大きな影響を与えます。【用語解説とAIによる専門的コメントつき】
-
糖尿病患者の食事管理を革新、「Fitterfly Klik」アプリ登場
FitterflyとGoogle Cloudがパートナーシップを結び、糖尿病患者向け食事追跡アプリ「Fitterfly Klik」を発表。このアプリは、37,000種以上の料理を認識し、栄養価を分析。食事管理が簡単になり、糖尿病の自己管理を支援します。【用語解説とAIによる専門的コメントつき】
-
【3回目】AIに都知事選後の都政への影響を予想してもらった│5つのLLMが各支持層の心理を読み解きます
7月7日に投開票となる東京都知事選について、代表的なAIにコメントをしてもらいました。 今回は第3回目です。 ※質問した代表的なAIGPT-4o、Perplexity、Microsoft Copilot、Claude 3 […]
-
【2回目】AIに都知事選を予想してもらった│5つのLLMが各支持層の心理を読み解きます
7月7日に投開票となる東京都知事選について、代表的なAIにコメントをしてもらいました。 今回は第2回目です。(第1回目はこちら) ※質問した代表的なAIGPT-4o、Perplexity、Microsoft Copilo […]
-
【1回目】AIに都知事選を予想してもらった│5つのLLMで比較したら、分かりやすい結果に
7月7日に投開票となる東京都知事選。代表的なAIに得票数を予想してもらいました。質問したAI:GPT-4o、Perplexity、Microsoft Copilot、Claude 3.5 sonnet、Gemini 1. […]
-
AIモデルの視覚タスク性能を競う「Multimodal Arena」が登場、GPT-4oが首位に
LMSYSが新リーダーボード「Multimodal Arena」を立ち上げ、AIモデルの視覚タスク性能を比較。OpenAIのGPT-4oがトップに。しかし、CharXivベンチマークではAIと人間の視覚理解に大きなギャップがあることが明らかに。AIの進歩と課題を示し、研究の新たな方向性を提案。【用語解説とAIによる専門的コメントつき】
-
Google、信頼性向上へ大手と提携: AI精度の新境地へ
GoogleがAI精度向上のため、Moody’s、MSCI、Thomson Reuters、Zoominfoと提携。Vertex AIで高品質データ利用可能に。新機能「高精度グラウンディング」も導入し、AIの信頼性と応答質を向上。CEOは競合との差別化要因を強調。【用語解説とAIによる専門的コメントつき】
-
AnthropicがClaude 3.5 Sonnetを発表、企業AI市場に新風
AI研究企業Anthropicが、企業向けAI市場に革新をもたらす「Claude 3.5 Sonnet」を発表。性能とコスト効率で競合を上回るこのモデルは、高度な推論やコード生成に優れ、企業内協働を促進する機能も搭載。企業の効率化とイノベーション加速に貢献する可能性が高い。【用語解説とAIによる専門的コメントつき】
-
GoogleとHPの「Project Starline」が商品化へ、ヘッドセット不要の没入型ビデオ会議
GoogleとHPが提携し、ヘッドセット不要で没入型ビデオ会議を実現する「Project Starline」を2025年に商業化。3Dチャット体験を提供し、Google MeetやZoomとの互換性も目指す。【用語解説とAIによる専門的コメントつき】
-
GoogleのAIスマートグラスが未来のコミュニケーションを変革!
Google I/O 2024で披露されたAIスマートグラスは、HUDとProject Astraを搭載し、日常生活での情報アクセスを革新します。このリアルタイムAIアシスタントは、見聞きした内容を記憶し理由づける能力を持ち、ビデオと音声入力を効率的に組み合わせます。しかし、プライバシーやセキュリティの懸念も指摘されています。【用語解説とAIによる専門的コメントつき】
-
Google、性能4.7倍のAIチップ「Trillium」発表!エネルギー効率も大幅向上
GoogleがAIチップ「Trillium」を発表、計算性能が4.7倍に。AIチャットボットGeminiと画像生成技術もアップグレード。Nvidiaの「Blackwell」へのアクセス提供も。これらの進化はAIとMLの効率を大幅に向上させるが、プライバシー、セキュリティ、倫理的な使用に関する課題も。【用語解説とAIによる専門的コメントつき】
-
Googleの新AI「Veo」、ビデオ制作の未来を切り開く
GoogleのDeepMindが開発したAIビデオモデル「Veo」は、1080pの高品質ビデオを生成し、写実主義からアニメーションまで対応。Donald Gloverとの協力でテストされ、ビデオ制作を容易にすることを目指す。しかし、一般公開はせず、選ばれたクリエイターのみがアクセス可能。【用語解説とAIによる専門的コメントつき】
-
GoogleのAI製品混乱、消費者を困惑させる戦略に批判集中
GoogleのAI戦略が混乱を招く中、BardからGeminiへの急速なリブランディングや複数のAI製品発表がユーザーを困惑させています。製品間の違いが不明瞭で、競合のOpenAIと比較してナラティブのコントロールを失っているGoogleは、メッセージングの単純化と透明性の向上が急務です。【用語解説とAIによる専門的コメントつき】
-
Anthropic、教育を変革する「Claude教育向け」発表 – AIが答えを教えるのではなく、学生に考えさせる新機能
Anthropicは2025年4月2日、学生の批判的思考スキルを育成するために特別に設計されたAIアシスタント「Claude教育向け」を発表した。このサービスの中核となる「ラーニングモード」は、学生が質問すると直接答えを […]
-
Chrome拡張機能に大規模ハッキング被害:ChatGPT関連など16個のアドオンで60万人超が影響
Chrome拡張機能の大規模ハッキング被害が2024年12月24日から26日にかけて発生し、60万人以上のユーザーに影響を及ぼしました。 被害の詳細 発生期間は2024年12月24日22:32(UTC)から12月26日0 […]
-
AIエージェント革命の始まり 〜 単なるチャットボットを超えた”知的アシスタント”の正体に迫る
AIの進化は、私たちの予想をはるかに超えるスピードで進んでいます。2024年、その最前線で注目を集めているのが「AIエージェント」です。チャットボットを超え、自ら考え、判断し、行動するAIエージェントは、ビジネスと私たち […]
-
Elon Musk主導のxAI、60億ドル資金調達でAI競争加速
Elon Muskのスタートアップ、xAIがシリーズBで60億ドル調達。Valor Equity Partners、Andreessen Horowitzなどが参加。AGI競争を加速し、Grok-1モデル強化へ。【用語解説とAIによる専門的コメントつき】
-
Llama 3リリース – MetaがオープンソースLLMで急速に追い上げ-
Meta、大規模言語モデル「Llama 3」を7月ごろリリース。80億/700億パラメータモデルに加え、GPT-4超える4,000億超パラメータモデルも開発中。安全性ツール導入、自社アプリに統合。オープンソース化と一部利用制限の両立。AGI実現とAI民主化を目指す。
-
AI業界激震: OpenAI、Google、Mistralが新AIモデル発表、競争加速
OpenAI、Google、Mistralが新AIモデルを発表。マルチモーダルシステムが進化し、AI技術の競争が激化。しかし、オープンソースのリスクや大規模言語モデルの限界も指摘されています。【用語解説とAIによる専門的コメントつき】
-
Microsoft Researchが切り開く、LLMの新境地とその未来展望
Microsoft Researchが大規模言語モデル(LLM)の進化、多言語性能評価、オーディオキャプション生成に関する最新研究を公開。特に、ツール使用の正確性向上のためのシミュレーション試行錯誤(STE)、非英語言語でのLLM性能の徹底評価、テキストのみを用いたオーディオキャプションモデルのトレーニングという新しいアプローチが注目されます。これらの研究は、LLMの応用範囲拡大と実用化への貢献が期待される一方で、技術進歩の倫理的問題や社会への影響も考慮が必要です。【用語解説とAIによる専門的コメントつき】