HTML5 Webook
316/344

3081-3.データ利活用基盤分野⑴ 音声翻訳・対話システム高度化技術ア 音声コミュニケーション技術東京オリンピック・パラリンピック競技大会に向けて以下の技術の研究開発を行う。・スペイン語音声コーパス100時間分を収集する。・タイ語、ベトナム語、インドネシア語、ミャンマー語、フランス語、スペイン語につき合計54万語の多言語辞書を作成する。・音声認識技術の適用分野拡大のため、言語モデルカスタマイズツールの改良、及び音響モデルカスタマイズツールの開発を行う。・フランス語、スペイン語、インドネシア語の音声合成に語彙登録機能を搭載する。令和2年以降の世界を見据えた技術として以下の研究開発を行う。・令和元年度に開発したプログレッシブ言語識別モデルのサイズを1/2程度にコンパクト化する。・有効な話者情報の特徴抽出手法を開発し、話者分類及びセグメンテーションの精度を改善する。なお、平成29年度補正予算(第1号)により追加的に措置された交付金を活用して整備した高速演算装置等については、生産性革命の実現に向け、引き続きこれらを用いて多言語音声翻訳の精度向上を推進する。また、令和2年度補正予算(第3号)により追加的に措置された交付金については、「国民の命と暮らしを守る安心と希望のための総合経済対策」の一環としてポストコロナに向けた経済構造の転換・好循環の実現を図るために措置されたことを認識し、多言語翻訳技術をはじめとする言語処理技術の精度向上に必要な高速演算装置等の計算機環境の整備のために活用する。イ 多言語翻訳技術東京オリンピック・パラリンピック競技大会に向けて以下の技術の研究開発を行う。・世界最大規模の話し言葉コーパスの対応言語を3言語(ネパール語、クメール語、モンゴル語)追加する。・翻訳バンクの多分野化をさらに進める。・VoiceTra・TexTraへの実装と技術移転を進める。令和2年以降の世界を見据えた技術として以下の研究開発を行う。・対訳依存度最小化技術を改良する。・アジア言語の文字入力インタフェースの研究開発を進める。・同時通訳のための深層学習に基づいた実験用プログラムを開発する。・ニューラル翻訳のアルゴリズムを改良する。・文脈処理やマルチモーダルの翻訳への利活用の研究を進める。なお、平成29年度補正予算(第1号)により追加的に措置された交付金を活用して整備した高速演算装置等については、生産性革命の実現に向け、引き続きこれらを用いて多言語音声翻訳の精度向上を推進する。また、令和2年度補正予算(第3号)により追加的に措置された交付金については、「国民の命と暮らしを守る安心と希望のための総合経済対策」の一環としてポストコロナに向けた経済構造の転換・好循環の実現を図るために措置されたことを認識し、多言語翻訳技術をはじめとする言語処理技術の精度向上に必要な高速演算装置等の計算機環境の整備のために活用する。ウ 研究開発成果の社会実装・産学官連携拠点として、グローバルコミュニケーション開発推進協議会の事務局を運営し、協議会会員を主な対象として、産学官のシーズとニーズのマッチングの場を提供するとともに、人材交流の活性化により外部連携や共同研究を促進する。・展示会等を通じた広報活動により、協議会会員以外へも研究開発成果の認知・利用を拡大する。・これらの外部連携等を通じて辞書等のコーパスを収集し、研究開発へフィードバックする。・社会実装に結びつくソフトウェアの開発を加速するために、音声翻訳エンジン・サーバとその利用環境を開発及び整備する。・技術移転に向けて、研究開発成果を特許等の知的財産として蓄積・活用する体制の整備を進める。⑵ 社会知解析技術

元のページ  ../index.html#316

このブックを見る