ニューラル機械翻訳エンジン(NMT)の高精度化

2025年8月12日

国立研究開発法人情報通信研究機構

今回、国立研究開発法人情報通信研究機構(NICTエヌアイシーティー)では、「みんなの自動翻訳@TexTra」(https://mt-auto-minhon-mlt.ucri.jgn-x.jp)において、従来のニューラル機械翻訳エンジン(NMT)に、大規模言語モデル(LLM)で利用されている機能を組み込むことにより、大幅に、翻訳性能が向上しました。

背景

NICTでは、従来より自動翻訳エンジンを研究開発しており、2017年からは、NMTにより高精度な汎用エンジンや特許エンジンを構築してきました。これらのNMTは、高速・軽量、かつ、専門分野でのカスタマイズに優れるという強みを持ちます。また、最近のLLMの性能向上は、著しいものです。一方、NMTとLLMは、双方 Transformer という構造のニューラルネットワークですが、NMTは、encoder-decoder型、LLMは、decoder型と呼ばれる構造ですので、LLMの性能向上が、そのままNMTの性能向上にはつながりません。

成果

今回、LLMで利用されている機能の一部をNMTに採用することにより、自動評価尺度BLEUスコアが大幅に向上しました。下の2つの図では、それぞれ、多言語から日本語への汎用エンジンのBLEUスコアを比較しています。
図からわかるように、全言語方向で、BLEUスコアが向上するという明確な性能改善が達成されています。また、BLEUスコアの増分が、2ポイント程度あると、体感的にも自動翻訳性能が向上し、また、5ポイント程度あると、かなり明確な翻訳精度の差が体感できることが、経験的に分かっています。
Transformer では、活性化関数・位置関数・アテンション・層数など、性能を左右するポイントが数多くありますが、今回は、LLMでの利用実績を考慮し、モデルサイズ・翻訳速度の観点から、実用的に高精度となる機能を取り入れました。その結果の傾向としてのモデルの変更点(言語方向ごとに詳細は異なる)は次のものです。

・モデルサイズ:
1.25倍程度に増加(10億パラメタ程度)
・翻訳精度:
BLEUスコアで平均2.2ポイント程度が向上
・翻訳速度(CPU):
0.80倍程度に減少
・翻訳速度(GPU):
ほぼ変わらず
・メモリ使用量(CPU):
1.25倍程度に増加
・メモリ使用量(GPU):
1.20倍程度に増加

※BLEUスコア: 自動翻訳文と人手による参照訳との類似度の一種であり、自動翻訳エンジンの比較に用いられる。BLEUスコアが20以上であれば、実用的な精度で使えることが多い。なお、本測定では、NICTが内部的に構築した汎用テキストを用いており、また、言語方向ごとに、利用した対訳テキストは異なる。

今後の展開

NMTの強みとして、高速・軽量、かつ、入力文の曖昧性が少ない時には、高精度に翻訳ができるというものがあります。これらの強みは、産業翻訳において特に有効なので、今後も、LLMでの発展を取り込むことにより、翻訳性能の性能向上を目指します。

問い合わせ先

先進的音声翻訳研究開発推進センター
先進的翻訳技術研究室

内山 将夫