て効率良くコーパスを構築することにより、高い精度を実現してきた。さらに対応範囲は、当初の旅行会話から、日常会話を対象とした生活、災害、医療の分野へと広げてきた。しかし、言語や分野、発話スタイルによっては十分な性能が得られない場合がある。性能向上の鍵となるのは大規模・高品質のコーパスの収集・構築である。そこで、NICTでは、技術の高精度化だけでなく低コスト化や多分野化を加速するため、産学官の協力により翻訳データ(日英など複数言語のテキストが対になった対訳のコーパスや辞書)をNICTに集積する“翻訳バンク®”(https://h-bank.nict.go.jp/)の運用を2017年に開始した。この翻訳バンクの枠組みでは、提供いただいた対訳コーパスを用いて翻訳システムを高精度化し、提供元の組織に対し、高精度化した翻訳システムを安くライセンス供与している(図3)。これはまさに、みんなで国産の翻訳システムを育てるプロジェクトと言える。これまでに、中央官庁、地方自治体、民間企業、各種団体など、データを提供してくださった組織は90者を超え、更に増え続けている。例えば、医薬業界については、アストラゼネカ株式会社から提供いただいた対訳コーパスを用いて翻訳精度を向上させ、その高精度化した翻訳システムを下訳に活用することにより、アストラゼネカ社内での翻訳業務の労力を半分にすることができるという画期的な効果が確認された。この結果を受けて、製薬分野の他の大手企業約8社からも翻訳データを提供いただけることになり、製薬分野の翻訳精度は更に高精度なものとなった。対訳コーパスの提供は、医薬だけでなく、特許や金融など様々な分野に広がっている。これに伴い、対応できる言語や分野も増えつつある。各分野でのコーパスが充実すると、各分野における翻訳精度が向上し、新しいサービスが創出されるという好循環が生まれている。NICTは公的研究機関であるため、民間企業などに比べてデータ提供を受けやすい立場にある。更に安心してデータを提供していただけるようにするために、情報セキュリティマネジメントシステムの国際規格である「ISO /IEC27001」の認証も取得した。今後、データ提供に協力いただける分野が更に広がることを期待している。一方、音声コーパスの収集・構築に関しては、VoiceTraⓇなどのスマートフォン上のアプリを介して収集できる実利用データを有効活用している。収集したデータは、音声コーパスの構築コスト削減に大きく貢献している。さらに翻訳バンクの枠組みを音声コーパスにも適用することにより、種々の発話スタイルの音声コーパスの収集、さらには、音声認識の精度向上にもつながると期待される。また、VoiceTraⓇの利用ログ情報などの実利用データは他の用途にも役立つことが確認されている。NICTは、VoiceTraⓇの実利用データを活用することにより、複数の言語に対し、入力音声の言語がどの言語であるかを瞬時にかつ高精度で識別できる技術を開発した。音声を入出力のインターフェースとして利用するアプリやシステムの多くは、入出力の言語をあらかじめ指定する必要があるが、この自動言語識別技術を利用することにより、あらかじめ言語を指定する必要がなくなる。例えば、案内ロボットはタッチパネルなどでの言語選択が不要となり、コールセンターでは適切な言語で対応できるオペレータにスムーズにつなぐことができるようになる。この自動言語識別技術はVoiceTraⓇにも機能の一つとして組み込んでおり、手軽に試していただくことが可能である。上述のNICTの多言語コミュニケーション技術は、本特集号の2-4「多言語コミュニケーション技術の社会実装」に述べるように、産学官連携による実証実験を経て、様々な形態で民間サービスなどに採用されるようになった。2020年以降のコロナ禍により、インバウンドの需要は一時的に減少したが、その一方で、在日外国人への対応やリモート観光、リモート会議での活用などの需要が増えつつある。VoiceTraⓇに代表される逐次翻訳は、今や、普通に使われる技術になったと言える。2.3多言語コミュニケーション技術の更なる展開新型コロナウィルスがまん延するまでは、訪日外国人の数は増え続け、2019年には3,000万人を超えていた。そのような訪日外国人への対応ニーズに加え、在留外国人、特定技能人材への対応のニーズに対しては、ここ5年ほどの急速な技術の発展を踏まえ、VoiceTraⓇに代表される逐次翻訳の技術が様々なサービスに活用されてきた。一方、グローバル化が加速する中、ビジネス・国際会議での講演や議論の場面、企業での協業の場面などでのニーズが高まっており、従来の技術では対応しきれない場面が増えている。それに伴う課題は大きく二つある。第一に、対応が必要な分野が拡大している。この分野拡大の課題に対しては、上述の翻訳バンクの枠組みを最大限に活用して解決していきたい。第二に、国際会議での講演やビジネス会議でのやりとりなどに対して、長い発話を次から次へと翻訳し、自分の理解できる言語で内容を把握したいという要求が高まっている。しかし、これまでの逐次翻訳のように、交互に発話して翻訳結果をその都度相手に伝え合うという方法では対処しきれない。そこで必要となるのが同時通訳である。我々は、2025年までに同時通訳システムを実現し、その先に、言葉の壁がない世界を実現したいと考えて6 情報通信研究機構研究報告 Vol.68 No.2 (2022)2 多言語コミュニケーション技術
元のページ ../index.html#12