

世界の知識を共有し、活用する未来 | ||
科学技術が発展し、世界中が瞬時に情報を共有できるようになった現在、世の中に存在する様々な知識を活用できるかどうかが、個人の生活の充実を図る上で大きな影響を与えるようになっています。知識の多くは言葉によって表現されており、日本語・英語・中国語といった言語の違いが、知識の流通と利用の大きな妨げになっています。 NICTでは、人間の言葉をコンピュータで処理する自然言語処理技術の高性能化によって、このような言語障壁を克服することを目指してきましたが、今回、科学技術振興機構(JST)、京都大学、東京大学、静岡大学の協力を得て、今年度から5か年計画で科学技術文献を対象とする日中機械翻訳システムを開発することになりました。この研究開発の一部は、科学技術振興調整費・重要課題解決型研究等の推進「日中・中日言語処理技術の開発研究」として実施されます。 | ||
中国、そしてアジアへ | ||
| ||
機械翻訳システム | ||
一方、人間が翻訳をするときには、このような知識を適用しているのではなく、過去に読み聞きしたことのある類似した文の訳を組み合わせて翻訳をしているだろうという考え方から、NICTの長尾理事長(当時 京都大学教授)が用例翻訳手法を1981年に提案しました。当時はコンピュータの能力が十分ではなく、この手法を実用的なシステムに実現することはできなかったのですが、近年、コンピュータの能力が向上したことに加え、文をそのまま例として使うのではなく、文法的に解析した上で入力文と蓄積された用例文の類似性を判定する手法(図3)が開発されたことにより、実用的な用例翻訳システムを開発する基盤が整ってきました。
| ||
実用システムの開発に向けて | ||
このプロジェクトは、5年間の開発期間で、日中の科学技術文献を対象とした実用的な機械翻訳システムを開発します。翻訳手法としては、言語の構造をより深く考慮した用例ベース翻訳を用います。この手法の実現のためには、大量の用例を蓄積する必要がありますが、NICTは1千万文規模の日中対訳コーパスを開発する予定です。基盤となる技術として、日本語や中国語の解析システムの性能向上を図ります。また、用例翻訳の手法を科学技術文献の長く複雑な文にも対応できるように改良を進めます。 プロジェクトの途中段階でも、コーパス等の言語資源は可能な限り研究用に公開したいと考えています。また、アウトリーチ活動として、研究の内容や成果をできるだけ分かりやすく、広く発信していくことを目指します。 | ||
おわりに | ||
科学技術の目的は、あまねく人々に能力や地位にかかわらず平等に快適な生活を提供することにあります。私たちはコンピュータに言語を処理する能力を与えることにより、世界中の人々が言語障壁を意識せずにすむ環境の実現を目指しています。今回の機械翻訳システムの研究開発により、そのような目標の一端が達成できると期待しています。 | ||
| ||
暮らしと技術 Q:機械翻訳システムができると、どのように役立ちますか? A:言語障壁のために中国国内のみで流通している有益な科学技術情報を、我が国の研究者・技術者・事業者が容易に活用することができるようになり、共同研究事業の設立など大きなビジネスチャンスにもつながるでしょう。また、日本が最先端を担う科学技術分野の文献が中国国内で流通することにより、中国における科学技術の発展も期待できます。 さらに、他のアジア言語へも拡張することにより、それらの言語についても比較的容易に母国語で科学技術情報を検索・閲覧できるようになるので、アジア各国の科学技術文献情報がアジア地域全体で流通するようになります。 | ||
今月のキーワード[機械翻訳システム(Machine Translation System)]
[コーパス(Corpus)]
|