NICT NEWS
研究者紹介
コンピュータと人間をつなぐ息の合ったインターフェースを構築する 音声言語と、身振り・手振りなど非言語表現を融合する研究 知識創成コミュニケーション研究センター MASTARプロジェクト 音声コミュニケーショングループ 研究マネージャー 柏岡 秀紀

言語の壁を越える未来の対話システム

長い間SFの世界の物語だった、人とロボットの間でのスムーズな会話。その実現に向けて着実に歩みを続けているのが、けいはんな研究所 知識創成コミュニケーション研究センターのMASTARプロジェクトです。プロジェクトを構成するグループの一つである音声コミュニケーショングループでは、人間とコンピュータとの円滑なコミュニケーションを実現する、ナチュラル言語コミュニケーションの研究開発を進めています。
 音声認識、音声合成、対話システム、システム統合の4チームによる先端的研究が進められている中、対話システムを取りまとめているのが柏岡秀紀研究マネージャー(以下:RMとする)です。誰が、いつ、どこで、どのような表現で、何語で話そうとも通じ合える、未来の対話システムづくりを進めています。
 「人と人が対話する場合、イントネーション、身振り、手振り、発話タイミングなどを活用すると、すべてを言葉にしなくても、割と簡単に意味が通じてしまいますよね。こうした非言語を、音声言語と組み合わせることにより、コンピュータと人間とのスムーズな対話を実現させようというのが、我々の目指すところなのです」
 息の合った対話をするには、相づち・うなずきなどの動作タイミングによる同調性、言い換え・敬語など表層表現による同調性、情報提示の順序・確認など対話制御による同調性、そして話題の共有・知識の共有など信念共有による同調性が欠かせません。こうしたことは人間の対話から学習(模倣)するのが近道です。

京都観光案内を教科書に

「我々は京都の観光案内をモデルとし、プロの観光ガイドとユーザが対話をしながら、半日〜1日くらいの観光計画を立てることでデータを集めました。対面による30分単位の対話を100対話、それから非対面によるケースなども約60対話収録しました。ここから得られたデータを基に、システムへの入出力特徴により状態を遷移し、対話を制御するのです」
 人に近い自然さを持つ同調的対話システムの構築には、もう一つ、統計に基づく対話制御、すなわち大規模なタグつき対話コーパスの作成が必要です。コーパスとは、言語研究などの目的で収集された電子データの言語資料のことで、単語ごとにタグ(標識)が付与されています。
 「コーパスに付与するのは2種類のタグです。発話単位の機能を多面的に記述可能なのが発話行為(speech act)タグ。表現が異なる発話を可能な限り一様に記述するのが意味内容(semantic act)タグです。自然な対話の流れを記述するためには、両方の観点が必要になるのです」
 人手で作られた対話シナリオとコーパスから学習された対話シナリオが相互補完して、より“人間対人間”の対話に近づけようとしているのです。

2種類のプロトタイプで実験

柏岡RMたちは現在、モバイル型と大画面型の2種類の対話システムで実験を続けています。システムに向かって「金閣寺はどこ?」と問いかけると、たちどころに鹿苑寺金閣の歴史やアクセス地図が表示されます。特に50インチ大画面対話システムは、自動追従型マイクカメラ3台と指向性マイクがユーザの音声・視線・動作を追い、ユーザがどんな情報に興味を持ったかを瞬時に判断し、それに関連した情報を表示してくれるというスグレモノです。
 「機械との対話で必要となるのは、音声を中心としたマルチモーダルな同調的対話技術、誰がどのような表現で話しても理解する音声認識・合成技術、特定の人の話し言葉などを覚えさせる利用者個人化技術、多言語音声の言語処理技術など様々です。2つのプロトタイプを使って、こうした技術をどう活かしていけるか、実験を続けているところです」
 柏岡RMは、大学卒業のときの研究テーマが音声対話で、以来研究者となってからも、一貫して自然言語処理、音声言語処理の研究、特に統計的解析処理、音声翻訳に関する研究に従事してきました。その原点は、「人と機械がうまく対話できれば、すごくいろんなことができるに違いない」という期待だったそうです。ところがご本人は、「私自身は今でも対話するのが苦手で、同窓会に出席しても同級生に『おまえはいつも聞いてばかり、もっと喋れ』と言われる (笑)」のだとか。

人を“超える”のではなく“カバーする”システム

柏岡RMの自己分析によると、「研究者という人種は、自分がネガティブに思っていることを研究対象にしていることが多いのです。翻訳を研究している人は英語にコンプレックスがあったりとか…。私が対話を研究対象に選んだのもそれが原因かもしれませんね」
 そんな柏岡RMの将来の夢は、あるテーマに関して、システムとシステムを対話させることだといいます。
 「現在のコンピュータ間のネットワークでは、人には判らないプロトコルで情報をやりとりしていますね。そうではなくて、人が聞いていてある程度理解できる喋り方をしてもらう。そうした対話を聞きながら、計算機が苦手とする自然な発想みたいなものをインプットしてやることで、機械同士では絶対出てこない発想が出てくれば面白いなと思いますね」
 そして、やがてやってくる人とロボット(コンピュータ)が会話する時代に、人と人の対話が希薄になるのではないかという危惧について柏岡RMは、
 「究極的に人間に必要な対話システムとは、“人を超える”ものではなくて、“人をカバーする”システムだと思うのです。たとえば、自分に都合が悪いことを、人は避けて通りがちで、敢えて見ようとしないところがありますね。特に研究の世界などではこれは困ること。そんなときにコンピュータが『見なきゃだめだよ』と強制的に仲立ちする、つまり人と人のコミュニケーションを下支えするシステムこそが理想のシステムではないでしょうか」
 人間同士よりもっと人間的な、人と機械の究極の音声対話システムの研究が、ここ「けいはんな」の地で着実に進んでいるのです。

Profile

柏岡 秀紀
柏岡 秀紀(かしおか ひでき)
知識創成コミュニケーション研究センター MASTARプロジェクト
音声コミュニケーショングループ 研究マネージャー
1993年大阪大学基礎工学研究科博士課程修了後、ATR(国際電気通信基礎技術研究所)に入社。2006年4月よりNICTに出向、2009年3月ATRを退社、同年4月より現職。奈良先端科学技術大学院大学客員准教授。博士(工学)。

独立行政法人
情報通信研究機構
総合企画部 広報室
広報室メールアドレス
Copyright: National Institute of Information and Communications Technology. All Rights Reserved.
NICT ホームページ 前のページ 次のページ 前のページ 次のページ