「AIはどうしたらCO2回収の技術の開発に貢献できる?」のような「どうやって/どうしたら(How-to)」型の質問(ある目的/目標を達成するための方法・手続き・ノウハウ等を問う質問)についても回答できる新規の質問応答技術を導入している。これらの改良により、Web60億ページから抽出した大量の情報を用いて「チャーハンをパラパラにするにはどうしたらいい?」、「伊豆のB級グルメをおしえて」、「奈良観光はどうしたらいい?」、「有名なピアニストのホロヴィッツのおすすめの演奏は?」、「なぜギリシャで哲学が発展した?」、「花がきれいで、食べられる実をつける木で庭に植えるのに良いのは何?」等の多様な話題に関する質問に回答可能となっている。本稿では、WISDOM X深層学習版に使われている深層学習技術、特に一般に難しいと知られているノンファクトイド型の質問(「なぜ/どうやって/どうなる」型の質問)に対する質問応答技術について説明する。2 では「なぜ/どうやって」型質問に対する質問応答技術について紹介し、3 で「どうなる」型質問応答とその関連技術について紹介する。「なぜ/どうやって」型質問応答「なぜ」型質問や「どうやって」型質問の質問応答は、名詞等の単語レベルの回答を出力する「なに」型質問応答、いわゆるファクトイド型質問応答とは異なり、1文もしくはより長いテキストで回答を出力する必要があるノンファクトイド型の質問応答である。本節では、WISDOM X深層学習版で利用されている「なぜ/どうやって」型質問の質問応答技術について説明する。2.1質問応答機構の構成WISDOM Xにおける「なぜ/どうやって」型の質問応答では、図3に示すように質問解析、回答候補パッセージ検索、回答パッセージ特定、回答パッセージ中の重要文特定という4つの処理を行う。まず、入力された質問に対して質問解析と呼ばれる、質問からの検索キーワードの抽出処理を行う。ついで、回答候補パッセージ検索として、事前にWeb60億ページから抽出しておいたテキストパッセージ(連続する最大7文から成る文の集まり、以降回答候補パッセージと呼ぶ)を対象に、質問解析の結果得られた検索キーワードを用いて検索し、回答を含む可能性があるパッセージを取得する。次に、回答パッセージ特定用のニューラルネットを用いて回答候補パッセージが質問の回答を含むか否かを判定し、その判定スコアの上位N件を回答パッセージとして選択する。最後に、回答パッセージ中で特に回答とみなせる内容を含む重要文(1文)を同様にニューラルネットで特定し、特定した重要文全体と回答パッセージの残りの部分(ただし、重要文以外のテキストについては名詞、動詞、形容詞などの内容語のみを表示)を、回答パッセージのダウンロード元のURLと共に、最終回答として出力する。WISDOM Xの従来版と比較して、深層学習版は回答の情報源をWeb40億ページからWeb60億ページに増強しており、さらに、回答パッセージ特定部に我々が独自に研究開発した深層学習のニューラルネットを導入したことでより高い精度で多様な回答を提示可能である。以降では、まず2.2で我々が「なぜ/どうやって」型質問応答の性能向上のために独自に研究開発した回答パッセージ特定技術[5][6]を紹介し、次に2.3でその性能評価の結果について示す。2.2回答パッセージ特定技術質問応答の回答パッセージ特定において、入力である質問や回答の候補(ここではテキストパッセージ)だけでなく、その質問と回答のつながりを表す「背景知識」が高品質な回答パッセージ特定のための重要な手がかりとなることが広く知られている。一例をあげると、質問「なぜ地球温暖化が起きる?」に対して、地球温暖化の原因を表す「温室効果ガスが増える」(原因)→「地球温暖化を加速させる」(帰結)という因果関係知識は、帰結部分が質問に対応し、原因部分がその質問の回答とみなせるため、回答パッセージ特定のための重要な手がかりとして使える背景知識といえる。我々はこのような背景知識を有効に活用する点に焦点を当て、深層学習を用いた新規の回答パッセージ特定技術を研究開発した。関連する技術としてBERT [3]のような大規模言語モデルの事前学習時に特定の背景知識を学習させ、学習した言語モデルを回答抽出用に利用する従来研究[7]–[11]は存在するが、自然言語処理の個々の問題に応2図3 WISDOM X深層学習版における「なぜ/どうやって」型質問応答の処理手順1213-3 大規模Web情報分析システムWISDOM X深層学習版
元のページ ../index.html#127