我々の質問応答技術と関連する技術で一般に利用可能なものとしては検索エンジンによる情報検索があるが、既存の検索エンジンでは多くの場合、検索キーワードを含む文書を一度に十件程度ユーザに提示するだけであり、ユーザが探したい情報を網羅的に把握するためには検索で得られた文書を大量に読む必要があった。これに対し、WISDOM Xではユーザが入力した質問の端的な回答のリストを瞬時に提示することが可能であり、これによりユーザが求める情報の全体像を迅速かつ容易に把握することが可能である。さらには、得られた回答に関して、更に深堀りする質問を入力することで価値ある想定外の情報を発見することも容易になる。例えば、「地球温暖化が進むとどうなる」という質問に対してWISDOM Xは「海水温が上昇する」や「ホッキョクグマは2030年に絶滅する」のような可能な出来事を回答し、さらに、ユーザが「海水温が上昇するとどうなる」といった深堀りをする質問を繰り返すことで、「地球温暖化が進む」→「海水温が上昇する」→「腸炎ビブリオ菌が増殖する」→「食中毒が発生する」のような情報を容易に得ることができる。この情報は、「海水温が上昇する」→「腸炎ビブリオ菌が増殖する」のような、因果関係をつないだ、出来事の連鎖を含むシナリオのようなものであり、「風が置けば桶屋が儲かる」式に解釈すれば「地球温暖化が進む」→「食中毒が発生する」という仮説を示すものと考えることができ、また多くの人にとっては想定外な情報であろう。この仮説は実際に2007年に収集したWebデータをもとにWISDOM Xを用いて発見されたものだが、その時点ではこの仮説を直接記述したページは収集したWebページには含まれていなかった。ところが、その後2013年のNature Climate Changeに掲載された論文[1]でバルト海における人為的な気候変動による海水温上昇とその周辺での食中毒増加の相関が科学的に確認された。つまり、我々の地球温暖化と食中毒の発生に関する仮説はたかだか一般のWebデータにある情報を組み合わせて作ったものであるが、その後、有力なジャーナルで科学的に確認された価値ある情報、更に言えば、価値ある想定外であったということになる。今後、例えば、新たに海水魚に関する養殖ビジネスを始めるとしたら、上述の地球温暖化によるビブリオ菌の増加が食中毒の上昇につながるといったWeb由来の仮説的な将来シナリオを意識して、本物の海水を使った養殖ではなく、人工的な海水を使った陸上養殖を選ぶといった意思決定を行う時代も来るかもしれない。近年、イノベーションのための知識探索やリスク管理のための問題発見などの重要度が増しており、その際にはユーザが知りたい情報の全体像の把握や、上で例示したような価値ある想定外の発見が重要である。我々はそうした高度に知的な作業をWISDOM Xによって支援可能であると考えている。2015年から試験公開したWISDOM X(以降、従来版と呼ぶ)はSVM [2]等、深層学習以前の機械学習技術を使ったシステムであったが、新たに深層学習技術を導入し改良した深層学習版についても、2021年3月31日に試験公開を開始した。我々は近年注目を集めているBERT [3]という巨大ニューラルネットを、約350GBという大量のWebテキストやDIRECTで構築した高品質かつ大量の学習データで学習し、さらに必要に応じてBERTを敵対的学習[4]と組み合わせた独自の改良版[5][6]も導入することで「深層学習版」WISDOM Xを開発した。この深層学習版は従来版のWISDOM Xと比較してより広範な質問に回答可能であり、また質問応答の精度も大幅に向上している。具体的には、従来版でも回答可能であった「なに」型質問(「AIって、どんな社会問題の解決に使えるのかな?」、「高齢者のケアができるAIを使った技術には何がある?」のように「何/どこ/いつ/誰/どんな」等に対する回答を求める質問)や、「なぜ」型質問(「高齢者介護でコミュニケーションロボットが必要なのはなぜ?」のようにある事象を起こす原因や理由の説明を求める質問)、「どうなる」型質問(「量子コンピュータが実用化されるとどうなる」のようにある事象が招きうる出来事の説明を求めるタイプの質問)のそれぞれに関して、従来版と比較して大幅に高い精度で回答が可能である。例えば、図2で示している質問「AIが解決できそうな高齢化の問題は何がある?」は従来版では1つも回答を出力することができなかったが、深層学習版では「介護問題」、「孤独社会」を含む合計132件の回答を出力することが可能である。さらに深層学習版では、従来版では対象外であった図2 質問「AIが解決できそうな高齢化の問題は何がある?」に対するWISDOM X深層学習版の回答120 情報通信研究機構研究報告 Vol.68 No.2 (2022)3 社会知コミュニケーション技術
元のページ ../index.html#126