94■概要実世界の様々な状況を随時把握し最適化された行動支援を行うことを目的として、実世界の様々なイベントデータを収集し、それらの分野横断的な相関を発見・学習・予測するデータ連携分析技術の研究開発を行うとともに、個々のプライベートデータを共有することなく状況把握や行動支援のための共通の予測モデルを構築する分散連合AI技術を行っている。また、これらの基盤技術を実装したxDataプラットフォーム*1を構築し、APIやユーザ開発環境を提供するとともに、自治体やサービス事業者らのデータやノウハウを活用した共創型の課題解決を推進している。令和3年度は、データ連携分析の連合学習方式の基本設計と応用性能の改善を行うとともに、これまで開発してきた予測モデルやプログラム等を応用分野ごとに情報資産化して共用利用できるようにし、環境モニタリングや行動ナビゲーションなどへの社会実装の取組を推進した。■主な記事従来のパブリックデータを中心としたデータ連携分析による種々のリスク予測をユーザの行動支援に活用するため、ユーザ側に蓄積されたプライベートデータを用いて共通の予測モデルを学習し、プライベートデータを保護したまま予測の性能改善を図るための連合型データ連携分析の基本設計を行った(図1)。ローカルに収集されるプライベートデータの分布の偏り(場所や事象ごとの発生データ量)を考慮した連合学習方式を設計し、xDataプラットフォームとローカルサーバ(xData Edge)上に実装して基礎検証を行った。その結果、ローカルサーバにデータを保持したままでも、xDataプラットフォームに全データを集中させる従来方式と同等性能の予測モデルを作成できることを確認し、基本方式の有効性を示した。また、連合回数とローカル学習回数のバランスを調整し、学習の途中経過を集約するタイミングを最適化することで、ローカルサーバ上のデータを用いた予測モデルの適応化と、xDataプラットフォーム側での予測モデルの全体最適化の両方で学習効率を改善できることを確認し、その最適化手法の検討を進めた。一方、時空間3Dラスター画像を用いたマルチモーダルイベント予測(Fusion-3DCNN)と、イベントの周期的頻出パターン(PFP)を高速に発見するデータマイニング手法を組み合わせた複合イベント予測手法(3DCNN-PFP)を開発し、異常気象等による混雑の時系列発生パターンを予測できるように拡張するとともに、予測精度を6~21%、処理速度を平均56%改善した(図2)。さらに、画像ログから周辺の交通障害イベントを発見するMMセンシング技術を開発し、事前学習モデル(EfficientNet)の転移学習によるイベント予測精度の改善(平均4%)に加え、発見したイベントの画像検索クエリログから画像のキャプションを生成し予測モデルに追加学習することで、例えば“混雑”から“交差点での混雑”や“列車による混雑”などの派生イベントを90%以上の高い精度で発見できるようにした。これらの研究成果は、国際ジャーナルやICONIP, IEEE BigData等の難関国際会議に論文採択された。これまでに開発したデータ連携分析の予測モデルや図1 データ連携分析の連合学習方式の開発④全体最適化②適応化①モデル転送③差分集約xxDDaattaaププララッットトフフォォーームムxxDDaattaaEEddggeeエッジ間のデータの偏りに応じた、集約の重み付け(④)や、学習データの補正(②)、更新回数の調整(①③)連合回数x 学習回数予測精度連合回数とローカル学習回数を調整し学習効率を改善パパブブリリッッククデデーータタププラライイベベーートトデデーータタ•更新回数の調整(①③)に応じた連合学習の性能評価•複合イベント予測の精度を従来手法に比べ6~21%改善(MAE比)•周期的頻出パターン発見の処理速度を平均56%削減(mmaaxxPPFFPP--ggrroowwtthh方方式式)気象混雑SNSトランザクション異常気象等による混雑の時時系系列列発発生生パパタターーンンを予測33DDCCNNNNPPFFPPMinimum support(%)生成パターン数(10^9)実行時間(秒)~1.231 bil(~8.6h)図 2 移動環境リスク予測の性能改善3.4.3統合ビッグデータ研究センター研究センター長 是津 耕司
元のページ ../index.html#102