NECは2026年3月19日、AIおよびLLM(大規模言語モデル)を活用した映像分析において、明文化されていない危険の予兆を捉え、改善アドバイスを自動生成する技術を世界で初めて開発したと発表した。本技術は、物流・運送や製造などの現場映像を分析し、危険の予兆を検出したうえで根拠となる映像シーンを提示し、改善アドバイスを文章で自動生成する。
視覚言語モデル(VLM)を採用しており、AIの事前学習が不要なため現場への導入が容易である。物流業のドライバー向け安全運転指導や製造業の現場作業指導への活用を想定しており、NECは2026年度中の実用化を目指す。
From:
NEC、明文化されていない危険の予兆をAIで捉え、改善アドバイスを自動生成する技術を世界で初めて開発

【編集部解説】
今回NECが発表した技術の本質は、一言で言えば「暗黙知のデジタル化」です。
職場の安全管理において長年の課題とされてきたのが、マニュアルや教本には書けない「勘」や「経験則」の伝達です。ベテラン作業者が無意識に行っている予兆察知——路面の模様から横断歩道を予測して早めにブレーキを踏む、部品のわずかな歪みに触れてみる——こうした行動は、言語化されないまま個人の中に眠っています。NECが今回開発した技術は、そうした「言葉にならない安全行動」を映像から自動抽出し、文章として可視化するものです。
技術的なポイントは二つあります。一つ目は、VLM(視覚言語モデル)を採用することで、AIの事前学習が不要になったこと。従来の映像解析AIは、対象となる現場や作業内容ごとに専用データを学習させる必要があり、導入コストが高く、現場ごとのカスタマイズが現実的ではありませんでした。VLMはテキストによる指示(プロンプト)だけで多様な映像を解釈できるため、この障壁を大きく下げます。二つ目は、プロンプトに明記されていないシーンまで検出できる点です。ユーザーが「安全運転の確認をしてほしい」と指示するだけで、AIが関連する一連の行動を時系列で拾い上げます。これはVLMが映像の文脈を「理解」しているからこそ可能であり、単純な物体検出や行動認識とは次元が異なります。
この技術はNECにとって突然の発表ではありません。同社は2023年12月に映像認識AI×LLMを用いた動画自動要約技術を、2024年には井上尚弥選手のボクシング世界タイトルマッチでのリアルタイムSNS配信実証、2025年10月にはローソンとの店舗従業員行動分析実証実験と着実に実績を積み上げてきました。安全運転支援サービス「くるみえ」への機能追加も昨年10月に発表済みです。今回の発表は、こうした研究開発の蓄積がAAAI 2026・WACV 2026という国際学会での論文採択という形でも学術的に裏付けられ、一つの到達点として結実したものと見るべきでしょう。
影響の範囲を考えると、直接的なターゲットは物流・製造現場ですが、応用の裾野は広いと言えます。建設・医療・航空・介護など、手技や判断力が求められるあらゆる現場で同様の課題が存在するからです。日本の深刻な労働力不足と人材育成コストの高騰を背景に、「熟練者の暗黙知を映像から抽出してナレッジベース化する」需要は今後さらに拡大するでしょう。
一方で、無視できないリスクもあります。最も重要なのはプライバシーの問題です。日本では個人情報保護法(APPI)のもと、従業員の映像モニタリングには明確な目的の開示と適切な安全管理が求められます。本技術の導入には、従業員への事前説明と同意取得、収集データの管理方針の明文化が不可欠です。「安全のため」という名目であっても、常時監視は心理的負担や労使間の信頼関係を損なうリスクをはらんでいます。
また、AIによる評価への過度な依存も懸念点のひとつです。VLMを含むLLMは「ハルシネーション(事実と異なる内容の生成)」のリスクを持ちます。プレスリリースでは「根拠となる映像シーンとともに提示」とあり、透明性への配慮は見られますが、管理者がAIの出力を批判的に検証できる運用設計が現場に求められます。
長期的な視点では、この技術が「人が人を教える」という育成の本質をどう変えるかが問われます。AIが暗黙知を可視化・言語化することで、指導者の負担は減り、教育の標準化は進みます。しかしその先に、「AIが示すアドバイスに従うだけの作業者」が生まれないかどうか。人間の判断力や創造的な危機回避能力が、形式化された指導の中で育つのかどうか。技術の恩恵を最大化しつつ、こうした問いに正面から向き合う企業文化と運用設計こそが、導入の成否を分けるはずです。
【用語解説】
LLM(大規模言語モデル)
Large Language Modelの略。大量のテキストデータで学習したAIモデルであり、文章の生成・翻訳・要約・質疑応答などを行う。数十億から数兆のパラメータを持ち、人間の言語を高度に模倣できる。ChatGPT(OpenAI)やGemini(Google)などが代表例。
VLM(視覚言語モデル)
Vision Language Modelの略。画像や映像(視覚情報)とテキスト(言語情報)を同時に処理・理解できるAIモデルのことである。テキストによる指示(プロンプト)だけで映像の内容を認識・解析できるため、事前に専用データを学習させる必要がない点が特長。
暗黙知
個人の経験や勘、技術として体得されているが、言語化・文書化されていない知識のこと。マイケル・ポランニーが提唱した概念で、ベテラン作業者の「勘」や「コツ」がその典型例である。本技術はこの暗黙知をAIが映像から抽出し、言語化する点に最大の革新性がある。
ハルシネーション
生成AIが事実に基づかない内容を、もっともらしい形式で出力してしまう現象。LLMの精度上の課題として広く知られている。NECの技術は映像から抽出した「事実情報」に基づいてテキストを生成することで、このリスクを構造的に低減する設計となっている。
ヒヤリハット
事故には至らなかったものの、一歩間違えれば重大事故につながりかねない「ひやりとした」「はっとした」経験のこと。労働安全の分野で広く用いられる概念で、ハインリッヒの法則(1件の重大事故の背後に29件の軽微な事故、300件のヒヤリハットがある)を根拠に、予防的安全管理の観点から重要視される。
属人化
特定の個人の経験・スキル・知識に業務が依存し、その人がいなければ業務が成立しない状態のこと。人材育成における最大の課題のひとつであり、本技術はこの解消を主要な目的に掲げている。
AAAI / WACV
AIおよびコンピュータビジョン分野における世界最高水準の国際学会。AAAIは「The Association for the Advancement of Artificial Intelligence」の略であり、WACV(The IEEE/CVF Winter Conference on Applications of Computer Vision)はIEEEとCVFが主催する応用コンピュータビジョンの国際会議だ。いずれへの採択も、技術の学術的妥当性を示す重要な指標となる。
個人情報保護法(APPI)
「Act on the Protection of Personal Information」の略称。日本における個人情報保護の主要法令であり、2022年施行の改正により規制が強化された。従業員を映像でモニタリングする際には、APPI上の目的明示・利用制限・安全管理措置の遵守が事業者に求められる。
【参考リンク】
日本電気株式会社(NEC)公式サイト(外部)
1899年創業のIT・通信インフラ大手。映像認識AI・LLM・生体認証など幅広いAI技術を産業分野に展開している。
NEC プレスリリース(本記事の発表元)(外部)
今回の技術発表の原文。危険予兆検出・改善アドバイス自動生成技術の詳細と開発背景・特長・参考論文を掲載している。
NEC 安全運転支援サービス「くるみえ」(外部)
2007年リリースのNECテレマティクスサービス。ドライブレコーダー映像をAIで分析し運行管理DXを支援。2025年10月に生成AI機能を追加した。
NEC 映像認識AI×LLM サービスページ(外部)
長時間映像から短縮動画と説明文を自動生成する製品ページ。2024年3月より有償PoCサービスとして提供されている。
AAAI 2026 公式サイト(外部)
第40回AAAI国際会議の公式サイト。NEC研究者らの論文「Object-Centric Framework for Video Moment Retrieval」が採択・発表されている。
WACV 2026 公式サイト(外部)
IEEE/CVF主催のコンピュータビジョン応用国際会議。NECの「KFS-Bench」論文が発表された場であり、本技術の学術的裏付けとなっている。
【参考動画】
NEC Online TV:次世代ドライビング解析 – 映像認識AI × LLM(外部)
映像認識AIとLLMを組み合わせたドライビング解析技術のデモンストレーション(英語)。実際の走行シーンへのAI適用例を確認できる。
【参考記事】
Using Video Recognition AI x LLM to Automate the Creation of Reports(NEC Technical Journal)(外部)
映像認識AI×LLMによる記述的映像要約技術のフレームワークを詳解。報告書作成時間の半減という検証結果も掲載した技術論文。
NEC’s generative AI and video recognition AI automatically generate text from video(NEC、2023年12月)(外部)
今回技術の原点となる2023年発表の英語プレスリリース。1時間超の動画から数秒で説明文を生成し、報告書作成時間を半減できると明記。
From likes to liability: Navigating online conduct and privacy in Japan(Ius Laboris、2025年)(外部)
日本の職場における従業員モニタリングとAPPIの関係を解説。AI映像監視システム導入に際し企業が遵守すべき要件を整理した専門記事。
AI, Machine Learning & Big Data Laws 2025 – Japan(Global Legal Insights)(外部)
日本のAI・データ法制を網羅した法律専門誌。APPI改正や人事評価目的でのAI監視をめぐるプライバシー論点を詳述している。
What Are Vision Language Models (VLMs)?(IBM、2025年)(外部)
IBMによるVLMの技術解説記事。アーキテクチャや製造・医療・交通安全などへのユースケースを体系的にまとめている。
Foundational Vision-LLM for AI Linkage and Orchestration(NEC Technical Journal)(外部)
NEC研究者によるVLM基盤アーキテクチャ論文。医療データセットで最大26%改善、予測誤りの最大20%修正を達成したと報告している。
【編集部後記】
「熟練者の勘」をAIが読み取る時代が、すぐそこまで来ています。
あなたの職場や身近な現場には、まだ言葉にされていない「暗黙知」がどれくらい眠っているでしょうか。それが映像から自動的に可視化されていくとしたら、働き方や人の育て方はどう変わっていくのか——私たちも一緒に考え続けたいと思っています。







































