対あたり100万文規模と一桁大きくなったが、この手法では、深層学習により、ルールの獲得と優先度付けをまとめて自動学習できるようになったことから、効率的かつ精度良く自動学習できるようになった。ニューラルネットベースの手法の効果が画像認識など様々な応用分野で確認されつつある中、NICTの音声翻訳も2017年にニューラルネットベースに移行し、VoiceTraⓇに実装・公開した。これにより一気にNICTの多言語コミュニケーション技術の性能が向上し、商用サービスとして広く採用されるようになった。我が国で多言語コミュニケーション技術の研究開発が開始されてから、ここまで使える技術に到達するまで、実に30年以上かかっている。2.2NICTにおける多言語コミュニケーション技術の研究開発NICTは独自の多言語コミュニケーション技術をネットワーク型の音声翻訳アプリ“VoiceTra®”に実装しApp StoreやGoogle Playで公開している。VoiceTraⓇは旅行会話に好適で、テキストでは31言語間の翻訳に対応している。スマートフォンから入力された音声は、図2のようにネットワークを介してサーバに送信され、サーバ内で音声認識、機械翻訳、音声合成の処理がなされた後、翻訳された音声がそのサーバから再びネットワークを介してスマートフォンに返送され再生される。サーバ内の各処理では、音声とその書き起こしテキストとの対応関係や、日英対訳間の対応関係などをコーパスから自動学習した結果に基づいて処理している。現在、自動学習には、2.1で述べたニューラルネットベースの深層学習を採用しており、以前の手法に比べて、音声翻訳の精度は基盤となるコーパスの量と質にますます大きく依存するようになっている。現在のVoiceTraⓇは話し言葉の音声翻訳を得意としているが、それは、コーパスベースが主流の頃より、大規模・高品質の話し言葉のコーパスを地道に収集・構築してきたからである。NICTでは、これまで、旅行会話など対象分野を絞り、VoiceTraⓇの利用ログ情報も活用し図2 ネットワーク型多言語音声翻訳の仕組み翻翻訳訳デデーータタのの拠拠出出とと高高精精度度自自動動翻翻訳訳エエンンジジンンのの提提供供ののポポジジテティィブブ・・ルルーーププのの促促進進参加組織:92者(2022年3月末)図3 翻訳バンクの枠組み(https://h-bank.nict.go.jp/)52-1 多言語コミュニケーション技術の概要
元のページ ../index.html#11