NICT NEWS
トップページ
−特集−「MASTARプロジェクト」中村哲
「北京オリンピック音声翻訳モニター実証実験」清水徹/中村哲
「北京観光・北京オリンピックにおけるテキスト翻訳」井佐原均
「量子情報通信の最前線」佐々木雅英
「実写・動画の立体映像をホログラフィで実現」奥井誠人
「小型衛星携帯端末の開発」山本伸一
−研究者紹介− 津川卓也
−トピックス− NICTスーパーイベント2008開催報告
受賞者紹介
−トピックス− ATR/NICTオープンハウス2008開催報告
−トピックス− 来年の元日に、3年ぶりのうるう秒挿入が行われます
特集

巻頭インタビュー MASTARプロジェクト 世界の音声・言語研究の拠点をめざして 上席研究員 中村 哲

音声と言語の研究をするプロジェクト

―MASTARプロジェクトではどのような研究をしているのでしょうか。

中村MASTARプロジェクトは、この2008年4月からスタートした音声と言語の研究をするプロジェクトです。音声と言語の研究といってもいろいろありますが、一番分かりやすい利用例は文章を自動的に翻訳する技術でしょう。現在、ウェブ上にもいろいろな自動翻訳ソフトがありますが、実際に使うとなると十分ではない。私たちのプロジェクトでは、しゃべった言葉を翻訳する音声翻訳の研究をしています。通訳に近い技術ですね。それから、人間が話したことを機械が聞き取り、内容を理解して返事をする音声対話システムといったものも研究しています。しかもこれを多言語で行うことを目指しています。MASTARプロジェクトは、世界的にも規模の大きなプロジェクトである上、多言語を扱うという点で非常に挑戦的なプロジェクトといえるでしょう。NICTを音声・言語に関する技術や資源の世界的な拠点にしたいと思っています。

機械が通訳になるネットワーク音声翻訳

―研究の中身について、お話しください。

中村具体的には4つの研究項目があります。1つ目はネットワーク音声翻訳に関する技術開発です。人間が話した声を機械が認識をして翻訳し、相手の言語で音声として出力するというものです。私たちのプロジェクトでは20年ほど研究を続けてきましたが、最近ではかなり充実したものができています。北京オリンピックの際には、北京に行かれる日本人旅行者や北京に駐在されている日本人の方々にプロトタイプをお貸しして、いろいろ使用体験をしていただきました。

―実験的な装置がもうできているわけですね。

中村そうです。2種類ありまして、1つは小さなPCで、スタンドアローンで動きます。もう1つは携帯電話を使うもので、データをNICTのサーバーに送り、そこで音声認識、翻訳、音声合成をしてから、携帯電話に送ります。処理に時間がかかって使いづらいというご意見もありましたが、普通の携帯電話を持っているだけで、すぐに使えるというメリットもあります。たとえば名古屋などですと、工場で多音声と言語の研究をするプロジェクトくのブラジル人の方が働いています。そのような場合、音声翻訳があれば便利です。ポルトガル語の音声翻訳サービスを24時間電話で受けられるシステムを作っておけば、自治体の窓口にブラジル人の方が来ても十分に対応できるでしょう。この音声翻訳技術に関しては、昨年、内閣府の「イノベーション25」という2025年までの将来の社会を作るために必要な技術の1つに認定されました。この4月からは「社会還元加速プロジェクト」というのが始まり、その1つとして実際に進めています。社会還元加速を目指していくので、あと10年や20年かかる話ではなくて、5年とか6年で社会への展開を進めていきたいと思っています。

―5、6年先にはかなり使えるものができているということですか。

中村できると思います。まず旅行に関して使えるものを作りたい。最初は日・英・中の翻訳ですが、だんだん言語の数を増やしていきます。

大量の文例をもとに機械が自動翻訳

―2つ目は何でしょうか。

中村2つ目は、最初にお話した機械翻訳サービスです。産業的な応用を主に考えており、マニュアルや研究開発論文の翻訳などが、具体的な利用例として考えられます。企業と一緒になってネットワーク上からデータを収集し、辞書を作り、機械翻訳の技術を成長させていきます。その企業に特化したデータの部分はその企業にお渡ししますが、汎用部分については、いろいろな新規ビジネスとして、他の分野で使うことができると思います。

―どのような方法で機械翻訳を行うのですか。

中村NICT前理事長の長尾真氏は日本の機械翻訳のパイオニアであり、長尾氏の提唱された用例ベースの翻訳法の研究をNICTで進めてきたという歴史があります。現在ではさらに確率を考慮した統計翻訳法に発展させ研究開発を進めています。機械翻訳を行うには、まず「対訳コーパス」というものを作ります。日本語の文章とそれに対応する英語文章のペアですね。「私は学校へ行く」と"I go to school"というようなものです。それを大量に集めるんです。私たちは今100万文対以上の対訳コーパスを使っています。これを機械学習にかけると、たとえば「私」が"I"に対応する確率が何パーセントというふうに出てきます。「学校へ」は"to school"が多く出てきて、"to university"はそれよりも低い頻度でしか出てきません。そういう確率を使って翻訳していくわけです。また、言語によって語順の違いもありますが、いろいろな語順の中から目的とする言語の語順への整合性も大量のコーパスから求めて正しい語順に入れ替えていきます。この対訳コーパスを日英だけでなく、中国語とか、インドネシア語、ドイツ語などでも作っていけば、多言語間の翻訳も行えるようになります。もちろん、翻訳の精度の問題は残りますが、この方法には文章の対さえ集めていけば、翻訳ができるという利点があります。

人と機械の自然なコミュニケーション

―3つ目は何でしょう。

音声翻訳システムの利用イメージ中村3つ目は、音声対話システムです。これも先ほど簡単にお話しましたが、ロボットが私の言ったことを認識して、適切な返事をしてくれます。現在作っているシステムは京都の観光案内で、「金閣寺について教えて」と言うと、たとえばウィキペディアからの情報を持ってきてくれます。ウィキペディアにない場合には、検索エンジンが働きます。「どうやって行けばいいですか」と聞くと「バスで行けばいい」という答えが返ってきて、バスの時刻表が表示されます。こういうシステムでは返事は声だけではなくて、ディスプレイにキャラクターが出てきて、ジェスチャーを交えて説明してくれる方がいいですね。今できている京都の観光案内システムはこのタイプです。まだ、簡単なものですが、将来はアニメやSF映画に出てくるような、人間と自然な対話ができる機械を作ることを目指して研究をしています。

―たとえば、ドラえもんのような。

中村そうです。

―このシステムは他にもいろいろ役に立ちそうですね。

中村はい。観光以外にもいろいろなことが考えられます。特にこれを多言語で展開していくと、外国人の方が多く住んでいる自治体などでは非常に役に立つと考えています。企業のコールセンターなどでも使えそうですね。

世の中の言葉を集めて配信する

―次は何でしょう。

中村4つ目は、世界的な言語資源の配信ということです。こういう仕事をするには辞書とか言語のデータベースを使うわけですが、世の中で使われている言葉というのは、どんどん変わっていきます。それをウェブ上やニュースなどから集めてきてデータベース化し、定期的に配信していきたいと考えています。

多様な展開が期待される自然言語処理技術

―これまでお話しいただいたような研究を進めるには、企業との連携も大切ですね。

中村そのとおりです。これまでは外部の企業に委託して研究を進めることが多かったのですが、MASTARプロジェクトでは企業の方に出向していただいて、プロジェクトの中で研究開発をしていただきたいと思っています。また、企業が参加できるフォーラムを作る準備もしており、その中でいろいろ議論していただきたいと思います。

―MASTARプロジェクトの研究は今後、いろいろな方面に発展していきそうですね。

中村私たちが日常話したり、書いたりしている言語を自然言語といいます。自然言語を扱う技術というと、これまでは機械翻訳くらいだったのですが、今やっといろいろな分野で使えるようになってきました。非常に面白い時代になってきたと感じています。

―ありがとうございました。


中村氏と携帯端末
中村氏と携帯端末
中村 哲
上席研究員
(なかむら さとし)

大学卒業後、1981年シャープ研究所、94年奈良先端科学技術大学院大学 助教授、2000年国際電気通信基礎技術研究所 音声言語コミュニケーション研究所長を経て、06年NICT入所。
音声認識、音声翻訳などの音声言語情報処理や多次元信号処理などに関する研究に従事。ドイツカールスルーエ大学客員教授、けいはんな連携大学院大学教授。博士(工学)。



独立行政法人
情報通信研究機構
総合企画部 広報室
広報室メールアドレス
Copylight National Institure of Informationand Communications Technology.All Rights Reserved.
NICT ホームページ 前のページ 次のページ 前のページ 次のページ