513創つくる●データ利活用基盤分野ワードを含む文書を一度に十件程度提示するだけであり、質問の回答を網羅的に集めるためにはユーザが提示された文書を大量に読む必要があった。一方で、WISDOM Xのような質問応答システムは質問の端的な回答のリストを提示することができ、関連する情報の全体像を迅速かつ容易に把握可能にし、さらには価値ある想定外の発見を容易にする。近年重要性を増しているイノベーションやリスク管理といった不確実性に対処する作業では、こうした情報の全体像や価値ある想定外の把握が必須であり、WISDOM Xはこのような把握を容易にし、価値ある考えるヒントを提供できると考えている。また、WISDOM Xで使われている深層学習技術、さらにはBERTを用いた質問応答技術は、次世代音声対話システムWEKDAやSIP(第二期)で開発しているマルチモーダル音声対話システムMICSUS(図3)でも一部活用が始まっている。MICSUSは在宅高齢者の健康状態、生活習慣のチェックの一部をAIで代替することで、介護職の作業負担を軽減しようとするものであるが、高齢者に飽きずに使っていただくことや高齢者の健康状態維持にコミュニケーションの頻度が重要であることがわかっていることから、単に健康状態チェックに関する対話だけでなく、幅広い話題に関する雑談を行えることを目的として開発が進んでいる。今年度は、この雑談に先述したWISDOM Xの技術を活用したWEKDAや、KDDIが開発し雑談エンジンであるKACTUSの対話機能を用いることを可能とし、健康状態チェックの合間に、幅広い話題に関して実際に雑談的応答を行ったり、高齢者の質問にシステムが大量のWebページの情報を基に回答を行うことが可能となった(図4)。これは、https://www.youtube.com/watch?v=gCUrC3f9-Goでもデモ動画を視聴することができる。 また、健康状態チェックに関する高齢者とのやりとりについても引き続き改善を行い、コロナの影響で高齢者対象の実証実験はできていないが、NICTで雇用したデータ作成者を対象とする対話の実験では、先述したBERT等も用いて90%以上の精度で様々な健康状態に関してユーザの発話を正しく解釈、取得できることが確認された。今後は、システムが高齢者の発話を誤って解釈した場合などに訂正を行える機能等を高度化していく予定である。以上の一連のシステムはいずれもBERTと呼ばれる巨大なニューラルネットを活用しているが、このニューラルネットを更に巨大化し、より大量なテキストデータで学習させることでさらに各種処理の精度が向上することが期待できる。一方で、こうした巨大なニューラルネットを学習させるためには、ニューラルネットを複数の断片に分割し、複数のGPUと呼ばれる演算装置を使い並列で学習させることが必要となるが、この並列化作業は専門家でなければできない極めて難しいものであった。我々はこの並列化作業を自動化し、より巨大なニューラルネットの学習を可能とする自動並列化深層学習ミドルウェアRaNNCを開発し、今年度フリーソフトウエアとして一般公開した(公開サイトは https://github.com/nict-wisdom/rannc)。また、RaNNCを用いて50億個のパラメータからなる拡大版BERTの学習も実施し、良好な結果を得ている。今後、RaNNCを用いて学習した更に強力なBERT等のネットワークを用い、MICSUS等のシステムの能力を強化していく予定である。図2 WISDOM X深層学習版による日常的な言い回しの質問への回答質問「チーズとネギがあるけど、つまみになにをつくったらいいかな?」図3 マルチモーダル音声対話システムMICSUS図3カメラ⾼齢者の表情から感情を推定。うなづき等のジェスチャーも認識マイク対話時の⾳声を取得液晶パネル対話内容の確認Web閲覧が可能端末AI⽤計算機クラスタ携帯電話回線300GB超のテキストで事前学習したBERT等、最先端の深層学習技術が稼働ケアマネジメント標準に基づく対話シナリオ、200万件超の学習データ、40億件以上のWebページスピーカー応答を発話図4 MICSUSがWebページを用いた雑談を行っている様子3.4 ユニバーサルコミュニケーション研究所
元のページ ../index.html#59