「FUJITSU ハンズフリー多言語音声会話システム」(現在は富士通Japan株式会社から提供)などが挙げられる。これに続き、GC計画2025の推進のため、総務省では「多言語翻訳技術の高度化に関する研究開発」(2020–2024年度)を実施している。NICTは、凸版印刷株式会社、マインドワード株式会社、株式会社インターグループ、ヤマハ株式会社、フェアリーデバイセズ株式会社とともに本研究を受託し、社会実証を受け持つ3者を加えた9者のコンソーシアムを2020年に設立して活動を開始した。本研究開発は、NICTの多言語翻訳技術を発展させ、入力発話の分割点検出技術や多様な情報源を活用した通訳精度向上技術等の基盤技術に加え、実用レベルの自動同時通訳システムを実社会に実装するためのプラットフォームやUI技術の確立を行うものである。NICTは、同時通訳の実現に向けた入力分割・要約・翻訳出力最適化技術の研究開発やコーパス構築を担当している。また、本委託の枠組みで、東京2020大会やCEATECにて共同で実証実験を実施し、専門用語や固有名詞の収集・登録フローの課題や、副作用を抑制する運用方法等の検証を実施し研究開発にフィードバックして、音声認識精度の向上に貢献するとともに、今後の社会実装のための有用な知見を得た。社会実装に向けた活動4.1VoiceTra®の改良とデモシステムの開発GC計画の発表を受け、VoiceTra®の改良を進め、2015年10月には新バージョンを公開した。新バージョンでは、これまでの利用者の意見を参考に、より使い易いインターフェースに改良した(図6)。VoiceTra®は多言語コミュニケーション技術のベースラインを体験できる実証実験用アプリであり、社会実装に結びつくソフトウェアの開発を加速するために、研究開発成果の検証の場として、公開し、改良を行っている。これをGC計画遂行における中心アプリと位置付けて積極的に展開した。GC計画2025では、政府の外国人材受入れ・共生政策や観光戦略等を踏まえ、15言語*1を重点言語としており、2020年度には、これらすべてに音声認識・翻訳・音声合成機能を揃えた。また、基盤となる音声翻訳エンジン・サーバの高速化・安定化や、定型文を登録・利用する機能、言語識別機能の実装を行ってきた。2017年度には、深層学習の導入により、日本語・英語双方向の翻訳品質を大幅に改善した。その後、他の言語や音声認識・音声合成への深層学習の導入も進め、現在では重点言語15言語の音声認識・翻訳・音声合成すべてに深層学習が導入されている。2019年度には、日本語・英語・中国語・韓国語・タイ語・ミャンマー語・ベトナム語・インドネシア語の8言語に、1.5秒程度の入力された音声からどの言語であるかを自動識別する言語識別技術をVoiceTra®に実装した。2020年度には、フランス語・スペイン語を加え、10言語を識別可能とした。さらに、2言語間で翻訳方向を自動判定する技術を、日本語と選択言語間で翻訳方向を自動判定する機能として実装した。今後、同時通訳プロトタイプを搭載するプラットフォームとしての活用も見据えている。VoiceTra®には、誤り情報報告機能も搭載されており、ユーザの協力によってVoiceTra®サーバに音声認識・翻訳・音声合成の様々な誤り情報が収集されている。これらの誤り情報も効率的な精度向上に活用された。VoiceTra®のダウンロード数は、新バージョンは約686万件(図7)、シリーズ累計では約820万件(2022年6月末時点)となっており、1日平均約14万の発話が入力されている。また、VoiceTra®以外に、近未来のコンセプトモデルとしてのイヤホン型多言語音声翻訳システムや同時通訳プロトタイプシステム、自動字幕付与システム、多言語インタビュー字幕システムを開発し、展示会や4図6 VoiceTra®(現行バージョン)*1日本語、英語、中国語、韓国語、タイ語、インドネシア語、ベトナム語、ミャンマー語、フランス語、スペイン語、ブラジルポルトガル語、フィリピン語、クメール語、ネパール語、モンゴル語88 情報通信研究機構研究報告 Vol.68 No.2 (2022)2 多言語コミュニケーション技術
元のページ ../index.html#94