瞬時に高精度で識別できる技術を開発しました。これにより、例えば、案内ロボットはタッチパネル等での言語選択が不要となり、コールセンターでは適切な言語で対応できるオペレータにスムーズにつなぐことができるようになります。この自動言語識別技術はVoiceTraにも組み込まれており、手軽にお試しいただけます。これらの技術は、産学官連携による実証実験を経て、様々な形態で民間サービス等に採用され、今や、多言語音声翻訳技術は普通に使われる技術となりました。分野や使われるシーンに合わせた商用製品・サービス*も複数生まれました。これらの商用製品・サービスは、NICTの多言語音声翻訳技術のライセンスを受けて実現されています。ライセンスを受けることにより、独自にサーバを立ててサービスを提供することが可能となります。多言語音声翻訳技術を使う目的はコミュニケーション支援であり、民間サービスでは、総合的にコミュニケーションを支援するために、他のツールや技術と組み合わせ、様々な工夫が行われています。例えば、地図等を併用したり、電話通訳等のサービスにシームレスにつないだりと、使われるシーンに合わせて、ベストミックスとなる組み合わせを見つける努力がなされてきました。今後も、更に有用な使い方のアイデアが生まれ、新しいサービスにつながることを期待しています。昨今では、コロナ禍により訪日外国人の数は激減しましたが、その一方で、在日外国人への対応やリモート観光、リモート会議での活用等の需要が増え、リモートでのコミュニケーションがニューノーマルとなりつつあります。世界の「言葉の壁」をなくすため、また、人や国の不平等、特に言葉の不平等をなくす一助となることを願い、NICTでは、VoiceTraに実装されている逐次翻訳だけでなく、ビジネスや国際会議でも使える低遅延のAI同時通訳を実現することを目指し、民間企業と共に更なる研究開発を進めています。* https://gcp.nict.go.jp/news/products_and_services_GCP.pdf年、グローバル化が急速に進展する中、世界共通語である英語等の外国語に苦手意識を持つ人は依然として多く、母語の違いが対等な対話の妨げとなっています。この言葉の不平等をなくし、言葉で困らない社会を実現するため、NICTでは、独自の多言語音声翻訳技術を研究開発してきました。この技術をネットワーク型の音声翻訳アプリ“VoiceTra®(ボイストラ)”に実装しApp StoreやGoogle Playで公開しています。VoiceTraは旅行会話に好適で、テキストでは31言語間の翻訳に対応しています。スマートフォンから入力された音声は、図のようにネットワークを介してサーバに送信され、サーバ内で音声認識、機械翻訳、音声合成の処理がなされた後、翻訳された音声がそのサーバから再びネットワークを介してスマートフォンに返送され再生されます。サーバ内の各処理は、いずれも、言葉のデータベース(コーパス)から深層学習により学習し処理する機構を採用しています。音声翻訳の精度は基盤となるコーパスの量と質に大きく依存します。NICTでは、対象分野を絞り、VoiceTraの利用ログ情報も活用して効率良くコーパスを構築することにより、高い精度を実現してきました。これまで、旅行会話から、日常会話を対象とした生活、災害、医療の分野へと対応範囲を広げてきました。VoiceTraの利用ログ情報等の実利用データは他の用途にも役立つことが確認されています。NICTは、VoiceTraの実利用データを活用することにより、複数の言語に対し、入力音声の言語がどの言語であるかを近世界の「言葉の壁」をなくす技術により、人や国の不平等をなくす内元 清貴(うちもと きよたか)ユニバーサルコミュニケーション研究所研究所長図 ネットワーク型多言語音声翻訳の仕組み及び技術の社会展開例(一例)9NICT NEWS 2022 No.3
元のページ ../index.html#11