まえがき情報通信研究機構NICTでは、脳情報通信、サイバーセキュリティ、リモートセンシング分野の人工知能応用技術の研究開発と、翻訳バンクプロジェクト等の各種ビッグデータの取得や利活用を意識したオープンイノベーションを推進している。現在、様々な分野で活用が進められている人工知能技術はコア技術として大規模な学習データが必要となる深層学習と呼ばれる機械学習技術が活用されているが、NICTでは人工知能技術が注目される前からデータの重要性に着目し、多くの研究分野で様々な種類のデータを集積し、研究開発に活用してきた。そのためNICTが保有するデータの中には人工知能技術に活用できるデータも数多く存在している。そこで、人工知能技術の開発に利用可能と考えられる8カテゴリのデータをNICT内外の研究者・技術者がダウンロードして活用できるWebサイトとして、AIデータテストベッド公開基盤を構築して2019年5月末から運用を開始した。現在までに上記8カテゴリ50件のデータセットが公開され、オープンイノベーションのためのデータの利活用が始まっている。AIデータテストベッドの全体構成2.1三つの基盤AIデータテストベッドは図1に示すように、次の三つの基盤から構成されている。AIデータ管理基盤は、AIや機械学習等に利用可能なデータセットまたは学習済みのモデルを保存・管理する基盤で、ファイルシステム及びデータベース管理システム(Relational DataBase Management System)から成り立っている。AIデータ公開基盤は、AIデータ管理基盤に格納されているデータセットや各種情報を発信するためのWebサイトである。本基盤については、3にて紹介する。AIデータ利活用基盤は、ディープラーニングの学習または研究を実施するための基盤で一般には開放されておらず、NICT職員や共同研究者による利用を目的としている。こちらについては、4にて紹介する。2.2計算機基盤上記三つの基盤は、全32台のサーバで構成されるクラスタ上に構築されている。各サーバにはGPGPU(General-Purpose computing on Graphics Processing Units)が2枚ずつ搭載されており、約450TBの共有ストレージにアクセス可能である。公開基盤本節では、インターネット上で広く一般向けにデータセットを公開している公開基盤のWebサイトについて紹介する。なお、Webサイトへは以下のURLにてアクセス可能である。https://ai-data.nict.go.jp/123NICTでは、オープンイノベーション型のAI(artificial intelligence)研究開発及びその成果を社会実装するため、多様なAI関連データセットを格納・管理・検索及び共有・公開する「AI研究開発環境(AIデータテストベッド)」を提供している。本稿では、AIデータテストベッドの概要と運用状況を紹介する。NICT provides R&D environment for AI: AI Data Testbed, which storages / manages / retrieves and shares / publishes a variety of datasets for AI in order to promote Open Innovation styled R&D for AI and implement the results into our society. In this paper, we show a brief overview and opera-tional status of AI Data Testbed.4-1-2 AI研究開発環境「AIデータテストベッド」の取組4-1-2Efforts on R&D Environment for AI:‘AI Data Testbed’藤井秀明 岩爪道昭FUJII Hideaki and IWAZUME Michiaki454 NICT総合テストベッドの新たな可能性に向けた研究開発
元のページ ../index.html#49