NICTは、日本財務翻訳株式会社(財翻、代表取締役社長: 松本 智子)と、IR・金融分野向け自動翻訳システムの共同研究を実施し、翻訳エンジンの開発と検証を行ってきた結果、一定の性能向上を確認しました。引き続き、残された課題の解決に取り組み、IR・金融分野向け高精度自動翻訳エンジン実用化を目指します。

背景

近年、資本市場のグローバル化とコーポレートガバナンスの進展にともなって、英語による情報開示のニーズが高まっており、正確性と迅速性を両立させた翻訳の実現が求められています。
NICTでは、2017年から総務省と連携して、ニューラル翻訳技術に不可欠な翻訳データを集積する翻訳バンクを運用し、多数の組織からデータの提供を受けて、翻訳データの集積・活用を進めてきました。
上場企業の法定開示書類の翻訳を中心に事業を展開する財翻とは、2018年12月から、IR・金融分野向け自動翻訳エンジンについて共同研究を進めてきました。

今回の成果

NICTは、財翻が翻訳バンク*1に提供した開示書類の対訳データを基に、AI翻訳エンジンTexTra(テキストラ)*2アダプテーション*3を行い、IR・金融分野に特化した精度の高い自動翻訳エンジンを開発しました。
財翻が、この特化した自動翻訳エンジンで翻訳したものと、他社製の自動翻訳エンジン、および人間による翻訳の結果を比較検証したところ、IR・金融分野に特化した自動翻訳エンジンによる翻訳精度は、他社製の自動翻訳エンジンに比べて約1.3倍の高精度を実現することができました。また、人間による翻訳と比較しても約0.9倍となり、人間による翻訳の精度に近づきつつあることを確認しました。これを受けて、NICTと財翻は、対訳データを活用したIR・金融分野における自動翻訳エンジンの実用性向上の検討を継続することとなりました。

今後の展望

今回はIR・金融分野向け自動翻訳エンジンの一定の高精度化を確認しましたが、引き続き、更に正確性を確保するための翻訳技術の改良を進めます。
また、NICTでは、IR・金融だけでなく更なる多分野化を実現し、日本の国際競争力の強化に貢献します。

用語解説

*1 翻訳バンク
ニューラル技術による自動翻訳の精度向上には、アルゴリズムの改良に加えて、翻訳データの質と量の影響も大きく、高品質翻訳データの大量の確保が重要となる。NICTは、総務省と共に翻訳データを集積する「翻訳バンク」を運用し、日本語の翻訳技術の多分野化・高精度化に取り組んでいる。
最新版の翻訳精度は、NICTの開発した多言語音声翻訳アプリVoiceTra(ボイストラ)や文字ベースの自動翻訳システムTexTraで自由に確認できる。
*2 TexTra(テキストラ)
NICTでは、文字入力用のNMT(ニューラル機械翻訳)をTexTraと名付けて公開している。公開サイト「みんなの自動翻訳@TexTra®」では、コピー・ペーストしたり、サイト上の翻訳エディタを利用したり、ワードやパワーポイントのファイルを直接翻訳したり、API(Application Programming Interface)を介してプログラムから利用するなど、様々な方法で翻訳精度を試すことができる。
*3 アダプテーション
分野固有の翻訳データを用いて、精度を改善するように、トレーニング済みのNMTのニューラルネットワークを更に調整すること。

本件に関する問い合わせ先

先進的音声翻訳研究開発推進センター

先進的翻訳技術研究室

E-mail: textra-infoアットマークkhn.nict.go.jp