国立研究開発法人情報通信研究機構(NICT、理事長: 徳田 英幸)は、NICTが研究開発した言語識別技術を実証実験用多言語音声翻訳アプリ“VoiceTra”(ボイストラ)に実装しiOS, Android端末、共に10月1日(火)から公開します。
この言語識別技術により、1.5秒程度の短い発話から、8言語(日、英、中、韓、タイ、ミャンマー、ベトナム、インドネシア)のうちどの言語であるかを、90%以上の精度で瞬時に識別することができます。この技術は商用ライセンス可能で、今後、遠隔対話やロボットのインターフェースなどでの活用が期待されます。

背景

NICTは、これまで、NICTが研究開発した高精度・高品質の音声認識技術、多言語翻訳技術及び音声合成技術を多言語音声翻訳アプリ“VoiceTra”(ボイストラ)として実装し、iOS、Android端末で動作するアプリとして実証実験用に公開するとともに、利用者からのフィードバックや、総務省及び関係者のご協力の下、改良を重ねてまいりました。
これまでのVoiceTraでは、音声翻訳を始める前に相手言語を選択する必要がありましたが、このたび、NICTが研究開発した言語識別技術 (昨年10月に発表)を “VoiceTra”に追加実装することにより、この手間を省くことが可能となりました。言語識別機能を実装したVoiceTraは10月1日(火)に公開します。基本的に個人での利用を想定していますが、公開後はVoiceTraで言語識別技術の良さを誰もが体験できるようになります。これにより、民間製品・サービスへの技術導入を促進することを目的としています。この言語識別技術は、例えば、遠隔対話やロボットなど、相手の話す言語が事前に分からない場面で、話された言葉が何の言語かを自動判別するインターフェースとして活用されることが期待されます。この技術を実装したソフトウェアは商用ライセンス可能です。
背景

言語識別機能付VoiceTraの特徴

voicetra icon
VoiceTraの音声翻訳機能に加え、言語識別に関する下記の機能が追加されました。
◆ 8言語(日、英、中、韓、タイ、インドネシア、ベトナム、ミャンマー)の短い音声をリアルタイムで識別し、翻訳の言語設定が不要のシステムを開発
◆ 発話時間1.5秒の音声を識別率90%以上、識別時間0.15秒以内のリアルタイム識別を実現
◆ 何語を話しているか分からない外国人の言葉も即座に識別し、音声認識や自動翻訳が可能に

言語識別機能付VoiceTraの特徴

今後の予定

今後、NICTは重点開発対象の言語を、これまでのグローバルコミュニケーション計画において重点対象であった10言語(日、英、中、韓、タイ、フランス、インドネシア、ベトナム、スペイン、ミャンマー)から、在留外国人支援などで重視すべきフィリピン語、ブラジルポルトガル語など、言語識別の対象言語も現在の8言語から順次拡張する予定です。
今後の予定

本件に関する問い合わせ先

先進的音声翻訳研究開発推進センター

E-mail: ictアットマークkhn.nict.go.jp