リトアニアのニューロテクノロジー社は2025年9月16日、多言語自然言語処理用の独自AI SDKをリリースした。
このソフトウェア開発キットには自動音声認識エンジン、話者分離エンジン、音声活動検出器の3つの主要コンポーネントが含まれる。現在は英語、リトアニア語、ラトビア語、エストニア語の4言語をサポートしている。
クラウドベースではなくオンプレミスで動作し、Microsoft WindowsとLinuxの両方に対応する。C、C++、Java、.NET、Pythonのライブラリを提供し、GPUとCPUの両方をサポートする。
同社のVeriSpeakおよびMegaMatcherバイオメトリクスSDKとの統合も可能である。ニューロテクノロジーは1990年にビリニュスで設立され、世界140カ国以上でソリューションが使用されている。インドのアーダールプログラムなど約20億人のバイオメトリクスデータを処理するプロジェクトに関わっている。
From: Press Release: Neurotechnology AI SDK release
【編集部解説】
ニューロテクノロジー社のAI SDKリリースは、バルト三国における言語技術の地域主権を象徴する重要な動きです。グローバル企業が提供する汎用的なAIサービスとは対照的に、リトアニア語、ラトビア語、エストニア語という話者数の限られた言語に特化した開発は、技術的独立性の観点から注目に値します。
このSDKの最大の特徴は完全なオンプレミス動作にあります。昨今のデータプライバシー規制強化の流れを受け、企業や政府機関では機密情報の外部流出リスクを回避したいニーズが高まっています。特にヨーロッパでは一般データ保護規則(GDPR)により、音声データの取り扱いには厳格な管理が求められており、クラウドサービスへの依存を避けたい組織にとって有力な選択肢となるでしょう。
技術面では、このSDKはモジュラーアーキテクチャを採用しており、3つの音声関連コンポーネント(自動音声認識、話者分離、音声活動検出)を独立して使用することも、組み合わせて使用することも可能です。これにより開発者は細かい制御を行いながらアプリケーションを設計できます。特に多言語環境での会議やコールセンター業務において、リアルタイムでの話者識別と内容転写が同時に行えることで、業務の自動化が大幅に進む可能性があります。
一方で、現在サポートされているのは4言語のみという制約があります。グローバル展開を視野に入れる企業にとっては、今後の言語追加ロードマップが重要な判断材料となるでしょう。また、オンプレミス運用には相応のハードウェア投資とメンテナンス体制が必要で、中小企業には導入コストの面でハードルが高い可能性もあります。
ニューロテクノロジー社は約20億人のバイオメトリクスデータを総合的に処理するプロジェクトに関わった実績を持つ企業として、セキュリティ面での信頼性は高く評価されています。今回のAI SDKも、この技術基盤を活用した信頼性の高いソリューションとして期待されるでしょう。
【用語解説】
自動音声認識(ASR)
音声信号をテキストに変換する技術。機械学習やディープラーニングを活用し、人間の発話内容を自動的に文字化する。
話者分離(Speaker Diarization)
複数の話者が混在する音声から、誰がいつ発話したかを識別・分割する技術。会議録作成やコールセンター分析で重要な機能である。
音声活動検出(VAD)
音声信号から発話部分と無音部分を区別する技術。音声処理の前処理として使用され、効率的な音声認識を可能にする。
オンプレミス
クラウドサービスではなく、企業や組織が自社内のサーバーやインフラでソフトウェアを運用する形態。データの外部流出リスクを回避できる。
SDK(Software Development Kit)
ソフトウェア開発者が特定のプラットフォームやサービス向けのアプリケーションを作成するために提供されるツール群。
バイオメトリクス
指紋、顔、虹彩、音声などの生体的特徴を用いた個人認証技術。偽造が困難で高いセキュリティを提供する。
【参考リンク】
【参考記事】
Lithuania’s Tech Sector Advances(外部)
バルト諸国のテクノロジー産業における地域言語対応AI技術の発展について報じた記事。
【編集部後記】
音声データの扱いについて、皆さんはどのような懸念をお持ちでしょうか。クラウドサービスの便利さと引き換えに、プライベートな会話や機密情報がどこかのサーバーに保存されることに不安を感じたことはありませんか。
今回のニューロテクノロジー社のオンプレミスSDKは、そうした課題への一つの答えかもしれません。特に日本企業においても、取引先との重要な会議や社内の機密性の高い議論を安全に記録・分析したいニーズは高まっているはずです。
皆さんの職場や日常で、音声技術をより安心して活用できるとしたら、どのような使い方を考えますか。また、地域の言語や方言に特化したAI技術の重要性について、どう思われるでしょうか。テクノロジーと地域性の両立という視点で、一緒に考えてみませんか。