ブックタイトル情報通信研究機構年報

ページ
130/318

このページは 情報通信研究機構年報 の電子ブックに掲載されている130ページの概要です。
秒後に電子ブックの対象ページへ移動します。
「ブックを開く」ボタンをクリックすると今すぐブックを開きます。

概要

情報通信研究機構年報

122ソーシャルビッグデータ研究連携センターでは、ソーシャルビッグデータのリアルタイム蓄積・解析基盤の開発を目指し、1 .ソーシャルメディアにおけるユーザ間のつながりを表すソーシャルグラフや、2 .時刻情報を含むトランザクションデータ等の非テキストデータに関する高度データマイニング技術に関して研究開発を行った。また、3 .ソーシャルメディアが人々の行動に与える影響分析技術及び4 .ソーシャルメディアにおける時空間情報に着目した大規模情報統合可視化技術の研究開発を推進している。さらに、ビッグデータ利活用研究室と連携し、ソーシャルビッグデータ連携による環境リスク分析と行動支援技術の開発・実証を推進している。■平成28年度の成果1 .ソーシャルグラフに対する高度マイニング技術開発グラフデータマイニングに関しては、クラウド環境に適したスケーラブルな分散グラフデータベースエンジンの開発を行った。多くのグラフデータは次数分布に偏りがあり、通常の分散グラフデータベースエンジンでは効率的な処理が難しい。平成28年度は、前年度までに開発したGraphSlice手法に対して、分散計算における通信コストを最小化することによる処理最適化の検討を行った。図1 に示すように最適化問題を2 部グラフの最大マッチング問題と同等に考えることで、最適な処理を提供する。提案手法をApache Sparkで実装し、通信コストが平均で12%削減されることを確認した。2 . 希少なアイテムに関する周期的頻出パターンマイニング技術開発ビッグデータから希少なアイテムに関する知識を獲得することは重要な課題の1 つである。従来の頻出パターンマイニング手法では、アイテムの希少性が考慮されていないため、無用なパターンが多数抽出されてしまうという問題が存在する。平成28年度は、この問題を解決するための周期的頻出パターンモデルを提案した。提案モデルは、periodicall-confidenceという新たな指標に基づき、アイテム間の周期の相関性が高いパターンを選択することで、無用なパターンが出力されることを防ぐ。さらに、周期的頻出パターンの効率的なマイニングアルゴリズムであるEnhanced Periodic-Frequent Pattern-growth(EPF) を開発した。EPFはトランザクションデータから変換された木構造データを再帰的に探索することで提案モデルの要件を満たすすべてのパターンを列挙する(図2 )。人工データ及び現実データの双方において、提案手法が既存の最新手法と同等あるいはそれ以下の実行時間で希少なアイテムに関する周期的頻出パターンを発見可能であることを確認した(図3 )。3 .ソーシャルメディア影響分析技術開発ソーシャルメディア上での他者との対話や投稿の閲覧は、オンラインだけでなく実世界にも影響を与える。ソーシャルメディアの影響範囲の解明及び社会生活における意思決定や行動選択の支援を目的として、実世界での人々の行動を変化させるソーシャルメディア情報の検索及び分析技術を研究開発している。平成28年度は、実世界での主要な人間行動の1 つでソーシャルビッグデータ研究連携センター連携センター長(兼務)  木俵 豊 ほか5名3.11.5.3ソーシャルビッグデータのリアルタイム蓄積・解析基盤の開発図1  GraphSliceにおける通信コストを最小化することによる処理最適化(a) ソーシャルグラフ(b) 2部グラフへの変換(c) 通信メッセージ数の最小化図2 データ構造の変換に基づく効率的な周期的頻出パターンの発見(a) トランザクションデータ(b) 木構造データ