HTML5 Webook
152/194

2.4雑談的応答の生成MICSUSの雑談機能では、複数の応答生成エンジンを組み合わせることができる。現時点ではWeb上の情報を基に雑談的応答を生成するWEKDAと、Webニュースから生成するするKACTUS [3]が利用可能である。本節で、NICT DIRECTで開発中の雑談対話システムWEKDAについて詳しく述べる。WEKDAは、ユーザ発話に対して、収集済みのWeb文書を元に、ユーザ発話に関係していて、ユーザにとって有用と思われる情報を含む応答文を生成するよう設計されている。既存の対話システムには、相あい槌づちやそれに近い表現を応答として返すだけで、新規な情報は提供しないものも多いが、対話システムが新規な情報を定常的に提供しないかぎり、いずれユーザには飽きられ、使われなくなるだろうと考えており、新規な情報の提供は必須であると考えている。ユーザにとって有用な情報についてより正確に言うと、応答文は、例えばユーザ発話の話題が「料理」であれば、「料理をすると脳が活性化する」のような、ユーザ発話の話題に関する広い意味でのチャンス(この場合は「脳が活性化する」)やリスクに関する情報を含む文が中心となるように設計されている。例えばユーザが「トマトが好きです」と発話すると、まずその話題に関するチャンスやリスクなどを問う質問を深層学習技術やパターンを用いて生成する。例えば「トマトが好きだとどうなる」「どうやってトマトを使うといい?」といった質問が生成される(「どうやって」、つまり、How-toを問う質問の回答は、何らかの目的をより適切に達成するための知識であり、目的を適切に達成するチャンスを増やすという意味でチャンスに関する知識だと考えることができる)。次に、同じくNICT DIRECTで開発し、試験公開中の大規模Web情報分析システムWISDOM X*5(本特集号3-3[5]参照)を利用して質問の答えとそれを含む文章を多数取得する。その中からユーザ発話に対する応答として適したものを選択し、それに基づいて雑談的応答を生成する。先の例では、「リコピンを効率よく摂るためにはトマトを加熱することがポイントといった情報がありましたよ。」のような応答を生成する。応答は、その情報源となったURLとともに画面に表示され、必要に応じて元のページが閲覧できるようになっている。チャンスやリスクを記述した応答を雑談的応答の基本としているのは、雑談といえど、高齢者が将来参考にしたり、実際に活用したりできる情報を提供するべきであり、また、そうした情報とは基本的に将来におけるチャンスやリスクに関するものであるという発想、また、さらに押し進めて、雑談の本質とはそうした活用可能で有用な情報を話者間で共有することにあるという発想がある。ユーザ発話に対する雑談的応答の適切さはBERTを利用したスコア付けによって判定される。このBERTの学習データ作成に際しては、作業者が書き下ろしたユーザ発話のサンプルに対してWISDOM X等を使って雑談的応答の候補を収集し、雑談的応答候補の自然さ(例えば、日本語として理解可能か、ユーザ発話と無関係な話題になっていないかなど)、面白さ(誰でも知っている当たり前の内容になっていないかなど)といった観点に基づき、作業者がラベル付けを行った。MICSUSで現在実際に利用しているWEKDAは、これを更に簡略化、高速化したものである。高速化版を作成する準備として、Web上の高頻度名詞100万件に対して、上記のアルゴリズムによって雑談的応答の候補を大量に作成し、雑談的応答の大規模なデータベースを構築した。ユーザ発話が入力されたら、まず、発話中で話題の中心となる単語(トピックワード)をBERTで選択し、先に構築したデータベースからそのトピックワードを含む雑談的応答の候補を抽出する。次に、ユーザ発話との類似性等に基づいて候補を選択し、最終的な雑談的応答として出力する。雑談的応答のデータベースを使うことにより、WISDOM Xの呼び出し等の処理が不要となったため、雑談的応答の生成を大幅に高速化することができ、同時に多数のユーザが対話している状況であっても雑談を自然なタイミングで行うことが可能となった。また、WEKDAの雑談的応答に対して、ユーザである高齢者が「教えてくれてありがとう」「面白いねえ、知らなかった」「今度、試してみます」等の応答をすることがある。こうした応答に対してもBERTを用いた意味解釈を行い、その結果に基づいて「どういたしまして」「お話しできてよかったです」「ネットには信頼の置けない情報もあるので、ほかの人にも聞くとかしてくださいね」といった応答を返すようにした。また、「料理をすると脳が活性化する」というWEKDAの情報提供に対して、「脳が活性化すると囲碁が強くなるかも」等のユーザ応答が返ってきた場合に、新たに発話に現れたキーワード「囲碁」に関して更に雑談を継続するといった機能も備えている。ユーザ発話意味解釈モジュールのための深層学習技術の開発         Yes/No質問に対するユーザの応答を6種類に分類3*5https://wisdom-nict.jp で試験公開中、どなたでも利用可能。146   情報通信研究機構研究報告 Vol.68 No.2 (2022)3 社会知コミュニケーション技術

元のページ  ../index.html#152

このブックを見る