している。スマートデータとは、政府、産業界、市民が効率的かつ効果的にインテリジェンス、計画、制御、意思決定に利用できる“価値あるデータ”を生成するために処理されたIoTデータのことを指す。モビリティ、ウェルビーイング、都市環境の管理(大気、水、廃棄物など)などのイノベーションを促進するためには、横断的なデータの収集と解析が不可欠である。例えば、自動車、気象、交通、宿泊、個人の健康など多様なセンシングデータをAIで解析し、移動中の危険を回避したり個々の状況を合わせた最適な移動ルートや旅程プランを提案することで、旅行や観光を快適にしたり、渋滞を避けた快適な移動や運転中の事故を減らすことが可能となる。これは、アプリケーションの目的に応じて、様々なセンシングデータの横断的な関連性を発見し予測することで実現される。こうした、スマートデータの利活用を促進するために、我々は、実世界の様々な状況を随時把握し最適化された行動支援を行うことを目的として、実世界の様々なイベントデータを収集し、それらの分野横断的な相関を発見・学習・予測するデータ連携分析技術と、これに基づき地域の環境問題を考慮した安全・快適な移動や健康的な生活等を支援するスマートサービスを開発するためのプラットフォームの研究開発に取り組んでいる。本稿では、こうした我々の取組について、概要を説明する。データ連携分析技術2.1異分野センシングデータの相関発見様々な情報源からデータを収集・統合し、それらの相関関係を発見する際に、これまでは、主にビジネスデータを対象に、データウェアハウスシステムやビジネスインテリジェンス(BI)ツールなどが用いられてきた。これらは、様々な項目(アイテム)のデータを結合したトランザクションデータを生成し、その中で高い頻度で共起するアイテムの組合せ(頻出アイテム集合)から成る相関ルールを発見することを行う。しかし、従来のビジネスデータとは異なり、センシングデータを対象としたデータマイニングでは、時空間的に偏ったデータから局所的に相関の高い頻出アイテム集合や、災害や事故などの稀まれなケースにおいて相関の高い頻出アイテム集合を、膨大なデータからいかに効率よく発見するかが大きな課題となる。頻出アイテム集合発見の処理は、候補となるアイテム集合を多く生成するが、それらのほとんどはアプリケーションにとって興味のないものである可能性が高い。そのため、アイテムの内部効用(トランザクション内でのアイテムの出現頻度)と外部効用(アプリケーションにとってのアイテムの重要度)を同時に考慮する高効用アイテム集合マイニング(High Utility Item-set Mining, HUIM)により、この問題の解決を図る。HUIMは、トランザクションデータが与えられたとき、ユーザが指定した最小効用(minUtil)制約より大きい効用を持つアイテム集合を発見する。我々は、従来のHUIMを更に拡張し、センシングデータなどの時空間データに対し、あるアイテム集合の効用が最小効用より大きく、かつそのアイテム集合内の任意の2つのアイテム間の距離が指定された最大距離より小さくなるようなアイテム集合を効率的に発見する手法(Spatial HUIM, SHUIM)[3]を開発した。これにより、局所的に頻出する効用が高い頻出アイテム集合を高速に発見することが可能になる。この特長を生かした応用とし2①地域メッシュ単位の相関ルール発⾒②渋滞集中箇所の予測(utility score: 隣接道路の渋滞⻑合計)降⾬レーダデータ渋滞データ発⽣頻度発⽣箇所偏りが⽣じ相関ルール発⾒に影響事例データ(トランザクションデータ)(Ex.) Congested roads in Kobe at Typhoon Nangka (17-July-2015)•39,873 data points, 2,412 items•Accuracy 81%,Precision 79%リスクを回避する安全なルート探索の例•異常気象時の交通障害リスク予測等に応用図1 SHUIMを応用した移動環境リスク予測に基づく適応型ナビゲーション152 情報通信研究機構研究報告 Vol.68 No.2 (2022)4 スマートデータ利活用基盤技術
元のページ ../index.html#158