ブックタイトル情報通信研究機構年報

ページ
56/318

このページは 情報通信研究機構年報 の電子ブックに掲載されている56ページの概要です。
秒後に電子ブックの対象ページへ移動します。
「ブックを開く」ボタンをクリックすると今すぐブックを開きます。

概要

情報通信研究機構年報

48■概要データ駆動知能システム研究センターは、平成27年度末までは情報分析研究室と呼称していた研究グループを、平成28年度から改称したものである。研究内容は、大規模なテキストデータを対象とする自然言語処理を中心とし、ネット等にテキストとして流布している、社会における知、すなわち社会知を意味的に深く分析し、有効活用できる技術を開発することである。具体的には、前身である情報分析研究室が開発、一般公開した大規Web模情報分析システムWISDOM X、耐災害ICT研究センターと共同で開発した対災害情報分析システムDISAANA等で使われている技術を発展させ、システムがより自律的に分析を行える枠組みを開発し、また、その分析の結果を、一般市民を含め多くのユーザにわかりやすく提供できる技術の開発を目指す。平成28年度は、社会知の有効活用を目指し、Web上における大量の知識を活用して、多様なトピックに関する対話を行う対話システムプロトタイプ「WISDOMくん」や、社会知における重要な要素である、社会において発生している問題をWeb上のテキスト等から広く認識できる技術を開発した。また、WISDOM Xの質問応答技術の精度向上を近年、注目を集めている深層学習を用いて行ったほか、耐災害ICT研究センターと共同でDISAANAの拡張版である災害状況要約システムD-SUMMを開発、試験公開を実施した。また、大規模クラスタで大規模な自然言語処理システムを稼働させるためのミドルウェアRaSCの改良等を行った。D-SUMMについては、3.13耐災害ICT研究センターの項で詳述し、本稿では対話システムプロトタイプを中心に説明する。■平成28年度の成果図1 に平成28年度に開発した対話システムのプロトタイプ「WISDOMくん」での対話例を示す。現在、実用化が進められている対話システムは、その多くが、あらかじめ人手によって記述した何らかのルールに基づいて対話を行うシステムであり、特定のタイプの命令を入力されるとその命令を実行するといった動作は容易であるが、システム開発時に想定していないタイプの入力が来た場合には、対応が難しい。一方で、近年注目を集めている深層学習をベースとする対話システムは、大量の対話データから先述の対話のルールに相当するものを学習し、入力に対して適切と思われる出力をユーザに返すものである。しかしながら、学習に用いた対話データ中にない入力、単語等が与えられた際には、不適切な対応をしてしまうことが多く、幅広いトピックに関して対話を行うことはやはり難しい。我々の開発した対話システム「WISDOMくん」では図2 に示すように、ユーザに返す出力を直接生成するのではなく、WISDOM Xへの質問をいったん生成し、その質問をWISDOMくんがWISDOM Xに自動的に入力して、WISDOM Xよりその回答が返される。「WISDOMくん」はその回答を基にシステムの発話を生成する(ユーザの発話が「iPS細胞で何をするの?」といった直接的な質問の場合は、その質問を直接WISDOM Xに入力し、データ駆動知能システム研究センターセンター長  鳥澤 健太郎 ほか16名3.4.1社会知の深い分析と有効活用図1 開発した対話システムプロトタイプ「WISDOMくん」の対話例