1373 ●ソーシャルイノベーションユニット地における人出の変化を予測するために、2種類の予測モデルを考案し、東京都及び神奈川県のイベント発生地において実証実験を行った(図1)。1つ目のモデルは、イベントの発生回数やツイート数の少ないイベント発生地でも少数のサンプルから学習が可能な勾配ブースティング回帰(GBR)を用いたモデルである。2つ目のモデルは、ニューラルネットワークを用いた予測モデルで、機械翻訳において用いられるTransformerと、データの集合を入力として順序非依存な学習を行えるSet Transformerとを組み合わせることで、ノイズの多いツイートの集合から、イベントに関する情報を抽出可能とすることを狙っている。大規模なイベント会場など多くのイベントとツイートが利用可能な場合に良い精度を示すことが期待できる。この2種類のモデルについて、携帯電話のGPSデータに基づく実際の人出統計とTwitterデータを用い、東京・神奈川のスポーツ会場・コンサート会場・展示会場・公園・デモ会場・観光地、16カ所の人出予測を行う実証実験を行った。本実験では2014年12月~2018年11月までの人口統計データ及びツイートデータを用い、最初の3年分のデータで学習を行い、最後の1年分でテストを実施した。ベースラインとしては人出時系列の履歴のみを用いた自己回帰モデル(AR)及びニューラルネットワークを用いた時系列予測モデル(LSTM)を用いて比較を行ったところ、デモ会場を除くすべての種別において提案手法のどちらかが良い性能を示した。特にスポーツ会場においては大きな誤差の減少が見られるがこれはスポーツイベントに関するツイートの数が多く、試合を行うチームの種類も比較的少ないことから、他のイベント発生地よりも予測が容易であったものと考えられる。本手法は予測にツイートを用いているため、予測に貢献したツイート及び語を示すことにより、混雑が発生することだけでなく、発生するイベントに関する詳細な情報をユーザに与えることが可能となる。図2に上野恩賜公園をイベント発生地とした予測結果の例を示す。この日は4月4日で花見が多く行われていた日であり、提案手法はツイートに含まれる「満開」「開花」「花見」などの語を手掛かりに人出の増加を予測できている。これらのツイートをユーザに提示することにより、人出増加がどのようなイベントにより発生するかを分かりやすく示すことが可能となる。図2 上野恩賜公園における花見による人口増加の予測結果3.10.7 統合ビッグデータ研究センター
元のページ ../index.html#145