り、多言語音声翻訳技術、多言語翻訳技術とも表記される)の研究は1986年頃始まり、長い間連綿と続いてきた(図1)。NICTでも、それ以前からの取組の蓄積を受けて、2008年には音声・言語に関する研究プロジェクトである MASTAR(Multi-lingual Advanced Speech and Text Research)プロジェクト[3]を立ち上げた。その中で、2008年4月より内閣府の社会還元加速プロジェクトの1つとして認定された「言語の壁を乗り越える音声コミュニケーション技術の実現」を実施した。2009年度には、全国5観光地域で「地域の観光振興に貢献する自動音声翻訳技術の実証実験」が実施され、大量の実利用ログが収集されたことにより多言語音声翻訳システムの精度が向上し[4]、2010年8月に、その成果を搭載したスマートフォン用多言語音声翻訳アプリケーション「VoiceTra®」を無料公開した[5](図2)。当初は、6つの言語(日本語、英語、中国語、韓国語、ベトナム語、インドネシア語)について音声認識による入力及び音声合成による出力が可能であり、これらを含む合計21言語についてテキスト入力による翻訳が可能であった。本アプリは、ネットワーク型の処理を行うもの、すなわち •ユーザの入力した音声又はテキストがインターネットを介して多言語音声翻訳サーバへ送信される •サーバで、音声認識、翻訳、音声合成の処理が行われる •各々の結果がクライアントであるスマートフォンへ送信され、ユーザに提示されるというもので、ユーザインタフェース(UI)としては、以下の3つが同時に表示される。 •音声認識(又はテキスト入力)結果 •翻訳結果図2 VoiceTra®(2010年公開バージョン)図1 多言語翻訳技術の進展84 情報通信研究機構研究報告 Vol.68 No.2 (2022)2 多言語コミュニケーション技術
元のページ ../index.html#90