HTML5 Webook
60/344

52■概要令和2年度は、観光画像コーパス構築技術の一つとして、画像セット中に高頻度に出現する建造物の位置を推定する手法の研究に取り組んだ。加えて災害対応向け画像解析技術のため米国国立標準技術研究所(NIST)主催で映像検索分野の技術的評価を毎年実施しているTRECVIDに参加し、災害関連の映像識別を目的とするDSDIタスクに取り組みトップレベルの識別精度を達成した。また、収集及び記述された画像情報を効果的に利用者が扱えるようにするための可視化技術として、従来からの立体表示技術について実用化を高めるために、プロジェクタ台数を仮想的に増加させ、従来と同じ台数にもかかわらず画質を向上させる研究開発を推進した。■令和2年度の成果1.画像認識AIによる観光支援我々が目指しているサービスの一つは、画像認識AIによる観光者の支援である。図1は当研究室で開発した観光支援アプリである。スマホで観光地の建造物を撮影するとAIが解説や人気度を提示したり、近くの他の著名な建造物へ誘導したりしてくれる。図1のような物体検出はFaster-RCNNやYOLOといった多層ニューラルネットワークを大量の観光画像を用いてトレーニングすることにより実現されるが、事前に学習用画像に教師データを人手で付与する必要があり、特に注目物体位置のアノテーションには多大な労力を要する。そこで大規模な観光画像セットが与えられた時に、その画像セット中頻繁に出現する物体の位置を教師なしで推定する手法を昨年度に続き研究した(図2)。昨年度開発した手法は画像セット中の各画像に必ず一つの注目物体があることが前提となっていたが、実際にインターネットなどから観光画像を収集すると、各画像に複数の注目物体が存在したり、注目物体が含まれないノイズ画像も多数存在したりする。そこで今年度は昨年開発した手法を拡張し、各画像から複数の注目物体を検出したり、ノイズ画像は除去したりするようにした。本分野のベンチマーク画像セットであるRevisiting Oxford and Parisで評価した結果、従来手法より精度が22.4%高いことを確認した。これらの技術をけいはんなR&Dフェア 2020で発表するとともに、IEEEのフラグシップカンファレンスICASSP 2021に論文投稿し採択された(採択率48.0%)。また、民間企業へのライセンス提供を1件行った。2.画像解析による災害対応支援次に画像解析を災害対応支援に活いかすための研究テーマを紹介する。広域災害が発生した際、速やかに被害発生地域やその状況を把握することは災害対応の観点から年々重要となっており、戦略的イノベーション創造プログラム(SIP)の研究内容としても取り上げられるほどである。今回、国立情報学研究所及び株式会社日立製作所とで共同で臨んだDSDIタスクは、画像解析技術を駆使して低空から地上を空撮した映像中にどのような類いの災害被害が捉えられているかを自動識別しようとする課題である。本課題に対し深層学習手法を用い、特にラベルエンコーディングやクラスインバランス学習、自動機械学習、モデルアンサンブルといったテクニックを組み図1 観光支援アプリ3.4.2情報利活用基盤総合研究室室長(兼務)  内元 清貴ほか4名画像ソーシャルデータを解析する情報利活用基盤技術

元のページ  ../index.html#60

このブックを見る