翻訳バンクのコンセプト
翻訳バンクのコンセプト
国立研究開発法人情報通信研究機構(NICT)は、世界の大手製薬会社の日本開発部門責任者の団体であるR&D Head Club(RDHC)と共同で、本年4月よりAI自動翻訳システムの製薬業界向け最適化について取り組んできました。今般、RDHCのメンバー8社から提供された320万文対以上の日英対訳データを用いたシステムの最適化が完了したことを報告します。
最適化のベースとなった「TexTra」(注1)はNICTにより開発された最先端のAI自動翻訳システムで、既に特許等の分野で高く評価されているだけではなく、種々の汎用翻訳ツールにも採用され、広く使われています。
製薬業界においても、複数の国が共同で治験を実施する国際共同治験や新薬承認申請を欧米と同じ資料をベースに実施する世界同時申請が主流となり、高品質・高速・低コストな翻訳へのニーズが高まっています。今回の最適化への取り組みはNICTとアストラゼネカ株式会社が昨年共同して達成した当該システムの最適化を進めたもので、翻訳品質の大幅な改善が確認できました。詳細は本年11月のDrug Information Association(DIA)日本年会で報告されます。
NICTは、今後もAI自動翻訳システムに最先端の技術を導入することでシステムの高性能化を図ると共に、翻訳バンク(注2)を通じてさらにデータ提供者を募り製薬関連の翻訳データを拡張して、本領域における高精度化を推進します。
なお、今回の成果物であるAI自動翻訳システムは、本年度中に事業会社によりサービス提供が開始される予定です。
以上

(注1)TexTraについて

NICTでは、AI技術で多用される深い階層構造を持つニューラルネットワークを用いた自動翻訳技術(AI自動翻訳)の研究開発を推進し、研究成果である高精度自動翻訳システムをTexTraと名付けて公開しています。公開サイト「みんなの自動翻訳@TexTra®」(https://mt-auto-minhon-mlt.ucri.jgn-x.jp/)では、コピー・ペーストしたり、サイト上の翻訳エディタを利用したり、WORDやPPTのファイルを直接翻訳したり、API(Application Programming Interface)を介してプログラムから利用したり、様々な方法で翻訳精度を試すことができます。

(注2)翻訳バンクについて

ニューラル技術による自動翻訳の精度向上には、アルゴリズムの改良に加えて、翻訳データの質と量の影響も大きく、高品質翻訳データの大量の確保が重要となります。NICTは、総務省と共に翻訳データを集積する「翻訳バンク」を運用し、日本語の翻訳技術の多分野化・高精度化に取り組んでいます。
https://h-bank.nict.go.jp/
https://www.nict.go.jp/press/2017/09/08-1.html(NICT)

国立研究開発法人情報通信研究機構(NICT)について

NICTは情報通信分野を専門とする我が国唯一の公的研究機関として、豊かで安心安全な社会の実現や我が国の経済成長の原動力である情報通信技術(ICT)の研究開発について基礎から応用までを推進するとともに、産学官連携や事業振興などに統合的に取り組んでいます。
https://www.nict.go.jp/

R&D Head Clubについて

製薬業界20社の日本開発部門責任者を中心に構成される任意団体です。臨床試験の効率化、薬事行政に対する提言等の種々の活動を通じて、本邦における医薬品開発環境の改革を目指しています。

本件に関する問い合わせ先

国立研究開発法人情報通信研究機構

ASTREC先進的翻訳技術研究室

E-mail: textra-infoアットマークkhn.nict.go.jp