HTML5 Webook
76/344

68■概要本開発室では、先進的音声翻訳研究開発推進センターの研究成果である音声認識、音声合成、言語翻訳などの技術を利用した各種統合システムを開発して広く世間に周知することにより、研究成果の成果展開と社会還元を進めている。具体的には、多言語音声翻訳システム、聴障者と健聴者とのコミュニケーション支援アプリ等を開発するとともに、それぞれの共通プラットフォーム化を図ることによりスムーズな成果展開に寄与している。さらに、今後の研究課題である同時通訳システムの研究プラットフォームの整備を行っている。■令和2年度の成果1.多言語音声翻訳システムVボイストラoiceTraの機能拡張VoiceTra(https://voicetra.nict.go.jp/)及び多言語翻訳に関するNICTからのお知らせをVoiceTraサポートページに掲載した場合、その新着情報の有無をVoiceTraアプリ内に表示する機能を追加した。新しいお知らせ情報が掲載されている場合は、アプリの「その他」ボタンと「その他」ボタンをタップして表示されるメニュー画面の「お知らせ」ボタンに赤丸が表示される(図1)。ユーザが「お知らせ」ボタンをタップすると当該のページに遷移することができる。言語に関しては、ネパール語の音声合成及びモンゴル語の音声認識と音声合成を追加し、これで重点整備している15言語(日本語、英語、中国語、韓国語、ベトナム語、インドネシア語、タイ語、ミャンマー語、フランス語、スペイン語、フィリピン語、ブラジルのポルトガル語、クメール語、ネパール語、モンゴル語)について音声認識と音声合成が全て揃そろった。また、言語識別できる言語として、フランス語とスペイン語が追加され、グローバルコミュニケーション計画で定められた10言語(日本語、英語、中国語、韓国語、ベトナム語、インドネシア語、タイ語、ミャンマー語、フランス語、スペイン語)となった。VoiceTraは、今後も音声翻訳性能の向上を図っていくが、アプリケーションとしての機能拡張はこれで一旦終了し、今後は安定稼働のためのメンテナンスを行っていく予定である。2.ライブ音声翻訳サーバの開発長時間の音声を連続して入力すると同時通訳的にその翻訳結果が文またはそれ以下の単位で翻訳されて五月雨式に出力されるライブ音声翻訳サーバを開発し、民間企業へのライセンス供与を開始した。VoiceTraのような対面で1文ずつ翻訳することにより対話を進めるシステムでは、1発話ごとに音声認識、翻訳、音声合成の処理を行えば十分であるが、講演音声や会議の発言など一人の話者が長時間発話する場合では、発話してから結果が出力されるまでの遅延時間が非常に大きくなり、リアルタイム性が失われてしまう(図2)。したがって、本システムでは、音声認識、翻訳、音声合成をできるだけ細かい単位で稼働させることによって遅延を最小化している(図3)。動作の概略は以下のとおりである。(1)音声認識では、認識結果が確定した単語から逐次出力を行う(2)音声認識の最小単位と翻訳できる最小単位は異なるため、音声認識結果を翻訳できる単位になるまで蓄積し、出力する(3)翻訳できる最小単位ごとに翻訳する3.6.3統合システム開発室室長  葦苅 豊ほか2名音声コミュニケーションシステムの開発と研究成果の社会還元図1 お知らせの新着通知(赤丸)

元のページ  ../index.html#76

このブックを見る