673創つくる●データ利活用基盤分野総務省施策グローバルコミュニケーション計画2025*7の下で公募された委託研究「多言語翻訳技術の高度化に関する研究開発」に本中長期計画で研究してきた同時通訳の基礎技術をベースに提案した研究計画が採択された。同時通訳の研究開発に必要なコーパスの構築を開始し、同時通訳のための分割点を決定するプログラムを実証実験用に各受託機関にリリースした。5年間の研究開発において、個別テーマの研究開発の自由度を確保しつつ、段階的に同時通訳システムを社会実装するため、入力の分割方法の改良と翻訳に供給するTEXT以外の情報の改良を容易にプラグインできるように全体を設計してある(図2)。既存の文単位対訳コーパスで分割を学習し基本機能を確認するところまで今年度で実施し、今年度末に試作完了した同時通訳コーパスを使って、短い単位(フレーズ等と呼ばれる)での分割の研究を来年度に開始予定である。2.委託研究 自主研究の将来展開への布石として、自主研究を補完する研究テーマを設定し、次の委託研究2件を実施してきた。これらはアカデミア的観点と社会実装の観点で高い評価を受けて終了した。成果の一部は既に自主研究に取り込まれており、更に改良・発展させるために共同研究・委託研究を新規に立てることを計画している。研究課題197「多言語音声翻訳高度化のためのディープラーニング技術の研究開発」(受託者:国立大学法人東京工業大学、国立大学法人東京大学、国立大学法人愛媛大学、日本放送協会、一般財団法人NHKエンジニアリングシステム、株式会社時事通信社、研究開発期間:平成30年度~令和2年度) 本課題では、多様な研究に利活用可能な新規な基礎データ(より具体的には、対話、新聞、マルチモーダルのコーパス)の構築方法を創出し、構築したコーパスに基づいて機械翻訳、自動要約、マルチモーダル処理などで独創的な研究に取り組み優れた成果を上げた(図3に対話コーパスと関連研究を例示した)。研究論文(論文誌)として6件、査読付き収録論文(難関国際会議)として19件及び多数の口頭発表を実施し、結果、国際会議Coling 2020でのOutstanding Paper Awardや、VMT Challenge 2020 Winner(参加21チーム中1位)をはじめ国内外で14件受賞した。この短い研究期間における成果として、質・量ともに瞠どう目もくに値する。研究課題211「多言語音声翻訳高度化のための統合的深層学習の研究開発」(受託者:凸版印刷株式会社、マインドワード株式会社、研究開発期間:令和元年度~令和2年度) 本課題では、研究課題197と密接に連携し単独技術では達成できない高精度を実現する統合手法を用いて「ニュースの記事/要約を翻訳配信する」プラットフォームを構築し図4のアプリを使って実証実験を実施した。英語から日本語(あるいはその逆)の場合、現在の自動化技術がニュースの翻訳の困難性を克服して実用化可能なレベルに達成していることを確認した。凸版印刷社は、令和3年4月以降、時事通信社、マインドワード社と連携し事業化を目指す。図3 コーパス構築とアルゴリズム研究の例図4 日英ニュース配信アプリの画面(左:要約、右:記事)*1 https://www.soumu.go.jp/main_content/000285578.pdf*2 https://h-bank.nict.go.jp/*3 https://voicetra.nict.go.jp/*4 https://mt-auto-minhon-mlt.ucri.jgn-x.jp/*5 研究開発の競争状態を鑑み数量は非公開としている。*6 規模は非公開。*7 https://www.soumu.go.jp/menu_news/s-news/01tsushin03_02000298.html3.6 先進的音声翻訳研究開発推進センター
元のページ ../index.html#75