ブックタイトル情報通信研究機構年報

ページ
70/318

このページは 情報通信研究機構年報 の電子ブックに掲載されている70ページの概要です。
秒後に電子ブックの対象ページへ移動します。
「ブックを開く」ボタンをクリックすると今すぐブックを開きます。

概要

情報通信研究機構年報

62■概要当研究室では、東京2020オリンピック・パラリンピック競技大会に向けた自動翻訳技術として、①クラウドの活用を含め多言語、多分野の大規模な対訳データを収集し、②複数のアルゴリズムを並行して実装しながら医療をはじめとする分野適応の実験・改良を行った。また、2020年以降の世界を見据えた自動翻訳技術として、③音声翻訳の漸次化(前処理方式)のプロトタイプを作成し同時通訳の課題を抽出し、④対訳文ではないが同じ内容について記述した2 言語の文書から対訳語を抽出する技術を研究し、Web上の記事等のデータで評価実験し改良を行った。■平成28年度の成果1 . 東京2020オリンピック・パラリンピック競技大会に向けた自動翻訳技術(1)対訳データを効率的に収集するために、クラウドを活用した収集実験を行った。すなわち、音声翻訳アプリVoiceTraの『誤り報告機能』による多数の利用者からの報告を活用して、実利用での誤訳を解消するための1,000件を越える対訳を追加した。対訳データ収集の効率化は、対訳コーパスの増量の加速及び翻訳システムの高精度化につながるため、期待が大きいところである。・ 10言語の多分野(観光、医療、防災、生活)をカバーするための対話の対訳コーパスを構築し(平成28年度に160万文増で、総文数1,300万文:図1 )、順次、実証試験システムであるVoiceTraに投入して精度を改善している。対話のコーパスは世界的に見ても少数しか存在せず、1,300万文の対話の対訳コーパスの構築は、対話と翻訳の両研究の基盤として進捗を加速させる。また、これによって同研究分野での日本の地位を高め、世界の研究を先導し、様々なシステムへ発展するという意味で意義が大きなものである。(2)異なる技術(統計翻訳やニューラル翻訳等)を用い、医療分野で実験・改良を推進した。6 病院(東京大学医学部附属病院、りんくう総合医療センター、大阪大学医学部附属病院、国立国際医療研究センター、三井記念病院、聖路加国際病院)及び富士通と連携して、倫理審査(番号10704-(2))を経て、高精度の医療用音声翻訳システム(日英)の臨床実験を実施した。医療分野向け非接触UIの試作(総務省委託「グローバルコミュニケーション計画の推進-多言語音声翻訳技術の研究開発及び社会実証-I.多言語音声翻訳技術の研究開発」のパートナー富士通研究所との共同開発図2 )も行った。医療分野で実用化した音声翻訳は存在しないため、対訳コーパスの構築、アルゴリズムの比較実験により倫理審査を通す翻訳性能を実現したことは、科学的意義が十分に大きなものである。先進的翻訳技術研究室室長(兼務) 隅田 英一郎 ほか13名3.6.2グローバルコミュニケーション計画に向けた音声技術の研究開発図1 対訳コーパスの整備状況2020年の社会実装を目指して、10言語*多分野の対訳コーパスを着々と構築している。観光、医療、防災、生活1.日本語H282.英語3.中国語H26~H27構築済み4.韓国語5.タイ語H29~H31構築予定6.インドネシア語7.ベトナム語8.ミャンマー語9.フランス語10.スペイン語図2 医療音声翻訳の実証実験医療現場に必要な認識・翻訳の精度と最適なUIを目指して研究開発を進めている。