ポイント

  • 特許庁の次期機械翻訳サービスの中核技術としてニューラル機械翻訳(NMT)が採用
  • NMTで日本語と英語・中国語との間で高精度翻訳を実現
  • NMTの最大の課題の一つである学習時間の短縮を実現
NICT先進的音声翻訳研究開発推進センターが研究開発したニューラル機械翻訳技術は、日本語と英語・中国語との間で実現した高精度が評価され、特許庁の「次期機械翻訳サービス」の中核技術として採用されました。

背景

グローバル化に伴い、特許文献の翻訳ニーズは劇的に増加しています。しかし、人手翻訳ではコストの観点から大量翻訳が難しく、一方で、機械翻訳ではコストは安いものの、文法や語彙に関して日本語と共通点が少ない外国語(例えば、英語や中国語)では、他の外国語(例えば韓国語)に比べ翻訳精度が低い状況にありました。
 

今回の成果

NICTでは、これまで長年にわたり特許庁との連携・協力を行い、特許文献の高精度機械翻訳の実現に向け研究を進めてきました。また、特許文献を対象に多言語で世界最大規模(数億文)の対訳データを作成し、それに基づくニューラル機械翻訳(NMT)の構築を行っています。さらに、NICTはNMTのシステム構築時間の短縮について、国立研究開発法人 産業技術総合研究所(産総研)と共同研究を実施し、マルチノードGPU技術により数億文の学習が週単位で実行可能な技術を確立しました。
このたび、NICTの技術移転先の一つである東芝デジタルソリューションズ株式会社を介し、NICTのNMTが特許庁の「次期機械翻訳サービス」の中核として採用されました。本システムは2019年5月に一般公開され、2023年3月まで長期間広く利活用される予定です。
次期機械翻訳サービス

今後の展望

NICTでは、今後とも上記組織をはじめ幅広い産官学のパートナーと連携しつつ機械翻訳技術を改良し、日本語と多言語との間の翻訳が難しい言語対について海外研究機関の精度を常に凌駕する世界一の精度を維持してまいります。

用語解説

特許庁との連携・協力
NICTと特許庁が多言語特許文献の高精度機械翻訳の実現に向けて協力合意
ニューラル機械翻訳 Neural Machine Translation(NMT)
脳の神経回路を模したニューラルネットワークを用いた機械翻訳技術。膨大な対訳データから学習したニューラルネットワークを用いて翻訳することで、従来よりも大幅に高い翻訳精度が確認されている。NICTでは、音声翻訳アプリ「VoiceTra(ボイストラ)」の高精度化をNMTで実現している。
国立研究開発法人 産業技術総合研究所(産総研)と共同研究
国立研究開発法人 産業技術総合研究所と情報通信分野における連携・協力の推進に関する協定を締結
マルチノードGPU技術
ニューラルネットの学習処理のための専用計算機GPUを複数搭載し、大量データを並列処理する計算サーバをノードという。1ノードでは処理しきれない大規模なデータを扱う場合は複数のノードの効率的な並列処理技術が不可欠であり、これをマルチノードGPU技術と呼ぶ。換言すると、複数のGPUを搭載するノードを複数個効率的に利活用する技術のこと。
次期機械翻訳サービス
現行の機械翻訳サービスであるJ-PlatPatが更新され、その機械翻訳部分が本件のものに変更となる。
例えば、J-PlatPatで試行すると、右上のEnglishボタンを押すと英語サイトに飛び、そこで日本の特許文献を検索し表示すると下図が現れる。左側の英語文が特許文献の日本語文を自動翻訳した結果となる。
次期機械翻訳サービス
[画像クリックで拡大表示]

本件に関する問い合わせ先

先進的音声翻訳研究開発推進センター
知能科学融合研究開発推進センター

隅田 英一郎

Tel: 0774-98-6350

E-mail: textra-infoアットマークkhn.nict.go.jp

広報

広報部 報道室

廣田 幸子

Tel: 042-327-6923

Fax: 042-327-7587

E-mail: publicityアットマークnict.go.jp