「アダプテーション」というのは、NMTにおいては、既に訓練されたNMTを、翻訳対象の分野に応じて追加で訓練することである。まず、NMTの訓練自体は、非常に大まかにいえば、「現時点のNMTで原文を翻訳してみて、その結果が参照訳文と異なる度合いに応じて、NMTのパラメタを調整すること」で実施される。この過程を大量の対訳文に対して何回か繰り返すことにより、共通基盤となるNICT汎用NMTが構築される。次に、上記パラメタ調整が完了した汎用NMTに対して、翻訳対象分野の対訳文を利用して、同様なパラメタ調整を追加実施するのがアダプテーションである。このように、アダプテーションでは、すでに学習済みの汎用NMTパラメタを翻訳分野に応じて追加調整するので、比較的少量の対訳データで当該分野に対する高精度な翻訳エンジンを構築できる。また、翻訳バンクに対訳データをご提供いただくことで、NICT汎用NMTの底上げが期待できるが、それに加えて、アダプテーションNMTについては、対訳データご提供者のみが利用できる。そのため、NICT汎用NMTとアダプテーションNMTには、図3の関係が成り立つ。このように、翻訳バンクでは、提供者がNMTの精度向上の恩恵を一番受ける枠組みとなっている。最近の発展NMTの研究は日進月歩で進んでいる。たとえば、これまで、タグを含む文を機械翻訳するのは困難であったが、最近の研究により、タグを含む文の翻訳精度が向上している。たとえば、みんなの自動翻訳では、オプションで「XML翻訳を利用する」と設定することにより、タグを含む文の自動翻訳を精度よく実現することが可能である。タグを含む文章としては、HTMLの文章が考えられるが、みんなの自動翻訳では、次のように翻訳された。【原文】「アダプテーション」というのは、NMTにおいては、既に訓練されたNMTを、翻訳対象の分野に応じて追加で訓練することです。【訳文】 "adaptation" means, in NMT, that an already trained NMT is additionally trained according to the field to be translated.また、みんなの自動翻訳のWordアドインでは、本34図2 分野ごとの対訳データ量図3 NICT汎用NMTとアダプテーションNMTとの関係592-3-1 みんなの自動翻訳@TexTraⓇ
元のページ ../index.html#65