ベテランの「勘」は、マニュアルに書けない。その壁に、日本のAIが挑んでいる。
NECが開発した新技術は、誰も言葉にしていなかった「危険の予兆」を映像から自動で読み取り、現場の人材育成を根本から変えようとしている。
NECは2026年3月19日、AIおよびLLM(大規模言語モデル)を活用した映像分析において、明文化されていない危険の予兆を捉え、改善アドバイスを自動生成する技術を世界で初めて開発したと発表した。
本技術は、物流・運送や製造などの現場映像を分析し、危険回避に役立つアドバイスを文章で自動生成する。NEC独自の映像認識AIとVLM(視覚言語モデル)を活用しており、事前学習なしに導入できる。NECはAAAI 2026およびWACV 2026において関連研究を発表しており、2026年度中の実用化を目指している。
From:
NEC、明文化されていない危険の予兆をAIで捉え、改善アドバイスを自動生成する技術を世界で初めて開発
【編集部解説】
今回のNECの発表を理解するうえで、まず「なぜこれが難しかったのか」という問いから始める必要があります。
現場の安全管理においてこれまでAIが得意としてきたのは、「マニュアルに書かれた危険」の検知です。赤信号での停車忘れ、ヘルメット未着用といった、あらかじめ定義されたルール違反を映像から見つけ出すことは、すでに多くのシステムが実現しています。しかし、熟練の指導員が「ちょっと待て」と声をかける瞬間——それは多くの場合、マニュアルには一切書かれていないのです。部品をつかむ手のわずかな迷い、路面の模様をちらりと確認する視線の動き。そうした「暗黙知」の領域にこそ、事故や不良品の予兆が潜んでいます。
NECが今回開発した技術の核心は、まさにこの「書かれていない危険の予兆」をAIが自律的に発見できる点にあります。プロンプトで明示的に指定していないシーンであっても、VLM(視覚言語モデル)が映像全体の文脈を読み解き、危険回避に関わると判断した行動を時系列で抽出します。これはルールベースの検知とは根本的に異なる、生成AI時代ならではのアプローチです。
注目すべきもう一つのポイントは、「AIの事前学習が不要」という点です。従来、AIを現場に導入するためには、その現場の映像データを大量に収集し、専門家が正解ラベルを付与して学習させるという、時間とコストのかかるプロセスが不可欠でした。今回の技術はVLMが持つ汎用的な視覚理解能力を活かすことで、このボトルネックを解消しています。中小規模の物流会社や製造現場にとっても、導入のハードルが格段に下がる可能性があります。
この技術が社会に与える影響は、単なる「安全管理の効率化」にとどまりません。日本が深刻な人手不足に直面するなか、熟練技能者の「目利き力」をAIが補完・継承するという構図は、ものづくりの現場にとって本質的な課題解決につながります。ベテラン指導員一人の判断基準が、AIを介して組織全体に行き渡るとしたら、これは人材育成の民主化とも言えるでしょう。
一方で、潜在的なリスクにも目を向けておく必要があります。AIが生成する「改善アドバイス」の精度と信頼性は、導入する現場によって大きく異なる可能性があります。根拠映像とともにアドバイスが提示される設計は透明性を担保しているとはいえ、AI判断への過信が指導員の思考停止を招くことも考えられます。あくまで最終的な判断を人間が担うという運用設計の徹底が、この技術の価値を最大化するうえで不可欠です。
また、映像による行動監視という性質上、労働者のプライバシーや心理的負担への配慮も議論が必要です。「常時監視されている」という感覚が現場のモラルやモチベーションに与える影響は、技術の導入と並行して真剣に検討されるべきテーマでしょう。
長期的な視点から見ると、この技術は物流・製造にとどまらず、医療現場での処置確認、建設現場の安全管理、さらには介護の技術指導など、「熟練者の暗黙知を形式知に変換したい」あらゆる領域への展開が期待されます。NECが2026年度中の実用化を目指すとしている点も、単なる研究発表ではなく、製品・サービスとして世に問う段階にあることを示しています。「映像認識AI×LLM」という研究軸を2023年から一貫して積み上げてきたNECにとって、今回の発表はその技術ロードマップの上に位置づけられる、一つの重要な到達点といえるでしょう。
【用語解説】
LLM(大規模言語モデル)
Large Language Modelの略。大量のテキストデータを学習した高度なAIモデルであり、自然言語の翻訳・要約・文章生成などを行う。ChatGPTもLLMを基盤とするシステムの一つだ。数百万から数十億以上のパラメータを持ち、文脈理解や推論が可能なため、近年は映像分析との組み合わせが急速に進んでいる。
VLM(視覚言語モデル)
Vision Language Modelの略。画像や動画などの視覚情報とテキストを同時に処理できるマルチモーダルAIモデルだ。「映像を見て、内容を言語で説明する」という能力を持ち、事前に特定の映像データで学習させなくても多様な映像を認識できる汎用性が特長である。
プロンプト
AIに対して与える指示文や質問文のこと。LLMやVLMはこのプロンプトを起点として分析・生成を行う。今回のNECの技術の特徴は、プロンプトに明示的に記載されていない危険の予兆まで自律的に検出できる点にある。
暗黙知
マニュアルや教本に言語化・文書化されていない、経験や直感に基づく知識・スキルのこと。熟練技術者が「なんとなく異変を感じる」という感覚がその典型だ。今回の技術は、この暗黙知をAIが映像から読み解くことを目指している。
DX(デジタルトランスフォーメーション)
デジタル技術を活用して業務プロセスや組織文化を変革し、競争優位性を高める取り組みのこと。本記事においては、AIによる人材育成プロセスの刷新を指している。
AAAI
The AAAI Conference on Artificial Intelligenceは、AI分野における主要な国際学会の一つだ。AAAI 2026は第40回大会にあたる。コンピュータビジョンを含むAI研究全般を対象としており、今回NECはここで映像理解に関する研究を発表した。
WACV
The IEEE/CVF Winter Conference on Applications of Computer Visionの略。コンピュータビジョンの応用研究に特化した主要な国際学会だ。NECはWACV 2026において映像理解に関する研究成果を発表した。
【参考リンク】
日本電気株式会社(NEC)公式サイト(外部)
NECの製品・ソリューション・研究開発情報を網羅した公式サイト。映像認識AIやLLM関連の最新プレスリリースも確認できる。
NEC プレスリリース(2026年3月19日)(外部)
本記事の一次情報。危険予兆検知技術の詳細・適用領域・2026年度中の実用化目標が確認できる公式発表だ。
NEC 映像認識AI×LLM 技術紹介ページ(外部)
NECが2023年に世界初開発した映像認識AI×LLM技術の詳細ページ。研究者インタビューも掲載されており理解が深まる。
NEC Multimedia OLAP 映像認識AI×LLM サービスページ(外部)
NECの映像認識AI×LLMを活用した映像分析サービスの概要ページ。長時間映像からの短縮動画・説明文生成が確認できる。
【参考記事】
NEC builds AI that flags hidden workplace hazards(Telecompaper)(外部)
NECの危険予兆検知AI技術を英語で報道。物流・製造分野での映像分析適用と2026年度の商用化目標を紹介している。
Foundational Vision-LLM for AI Linkage and Orchestration(NEC Technical Journal)(外部)
NECのVLMアーキテクチャを解説する英語技術論文。医療VQAベンチマークで最大26%の改善を示し汎用性を裏付ける。
Using Video Recognition AI x LLM to Automate the Creation of Reports(NEC Technical Journal)(外部)
NECの映像×LLM技術フレームワークを解説する英語論文。100種以上のAIエンジンで数秒以内にシーン抽出が可能。
What Are Vision Language Models (VLMs)?(IBM)(外部)
IBMによるVLMの包括的な解説記事(2025年12月更新)。VLMの仕組みや代表モデル・応用分野を網羅的に整理している。
Top 10 Vision Language Models in 2026(Dextralabs)(外部)
2026年時点のVLM市場を俯瞰した英語記事。AI市場が$391 billion規模でCAGR 35.9%成長と予測する。
【関連記事】
NEC「cotomi v3」、ガバメントAI選定——2年でGPT-4水準に達した国産LLMの実力
NECが開発した国産LLM「cotomi v3」がデジタル庁のガバメントAIに選定。2年でGPT-4水準に達した進化の軌跡を解説する。
鴻池運輸が「生成AI活用プロジェクト」本格始動|AIアンバサダー制度で現場主導の変革へ
物流大手・鴻池運輸が生成AIを現場に根づかせる取り組みを本格始動。人材育成とDX推進の両立を目指す事例を紹介する。
カラダが消える日——AIとXRが解体する「現実」の定義
製造現場の安全教育にAI・XRを融合させた取り組みを紹介。暗黙知の伝承と技能教育の未来を考察する記事だ。
東京大学・理化学研究所、日本語特化の医療AI「142億パラメータ」視覚言語モデルをオープン公開へ
日本語特化の医療用VLM(視覚言語モデル)を東大・理研が開発・公開。VLMの活用領域の広がりを示す注目事例だ。
【編集部後記】
「ベテランの目利き力」——あなたの職場にも、そんな人がいないでしょうか。マニュアルには書かれていない何かを、長年の経験だけで察知できる人が。その「感覚」に、AIが少しずつ近づこうとしています。
AIに何を委ね、何を人間の手に残すべきか——ぜひ、みなさんと一緒に考えていけたらと思っています。







































