メータ1.6億個)[5]は、他機関から公開済みの日本語BERTよりも高性能であると評価され、専門知識が要求されるにもかかわらず、公開後約10か月で2,743件のダウンロードを達成しており、社会におけるAIデータテストベッドへの注目と期待の大きさが分かる成果を得ている。また、政府のAI戦略2019を踏まえ、人工知能(AI)の研究開発に関する統合的・統一的な情報発信や、AI研究者間の意見交換推進等を行い、AI研究開発の活性化を図ることを目的として2019年12月に設置された人工知能研究開発ネットワークの公式Webサイト「AI Japan」 [6]においても本サービスへのリンクを掲載していただいている。利活用基盤利活用基盤としては、AIに習熟しており自らAIを利用できる研究者をターゲットとする「共用計算サーバ」と、逆にAIについての知識を持たない初学者向けのサービスを目指す取組について紹介する。4.1共用計算サーバについて共用計算サーバは2.2に記載のクラスタのうち27台のサーバ(GPGPU54枚)で構成される。ユーザーは、同クラスタ上で稼働するスケジューラ経由で、ディープラーニングの学習や推論を実行し研究することができる。4.2eラーニング環境について前項の共有計算サーバがAI中・上級者向けのサービスである一方、こちらはAI初学者でもディープラーニング等のAI技術を享受できることを目的としている。具体的には、Webベースのアプリケーションとしてノンプログラミングでディープラーニングの学習や推論が実行できることを目指すものである。広く一般に知られている画像認識モデル(Convolu-tional Neural Network: CNN)や画像生成モデル(Gen-erative Adversarial Network: GAN)等のモデルに対して条件を指定して学習(図4)し、学習したモデルを利用した推論ができる。また、マウスによるドラッグ&ドロップで自らのモデルを作成することもでき(図5)、これを用いて学習及び推論できる機能を研究開発している。まだプロトタイプ段階であり、操作性や利用容易性の点で改善の余地があるが、今後はモニターによるPoC(Proof of Concept)等の概念実証評価を行い、更なる改善を目指している。おわりにAIデータテストベッドは今後もデータの拡充と品質向上、検索機能の充実などの利便性向上を図り、NICTのデータ指向型オープンイノベーションの中核基盤に発展させていきたい。その一環として、DCCS(Data Centric Cloud Service)と連携することで、DCCSが提供するAPI(Application Programming In-terface)を経由したデータ提供を計画している。参考文献】【1“量子インスパイア正準相関分析(qiCCA),” https://ai-data.nict.go.jp/dataset/detail/?id=522N. Koide-Majima, and K. Majima, “Quantum-inspired canonical correla-tion analysis for exponentially large dimensional data,” Neural Networks, vol.135, pp.55-67, March 2021.3“異表記対データベース,” https://ai-data.nict.go.jp/dataset/detail/?id=74“基本的意味関係の事例ベース,” https://ai-data.nict.go.jp/dataset/detail/?id=95“NICT BERT 日本語 Pre-trained モデル,” https://ai-data.nict.go.jp/dataset/detail/?id=466AI Japan公式サイト, https://www.ai-japan.go.jp/藤井秀明 (ふじい ひであき)ソーシャルイノベーションユニット総合テストベッド研究開発推進センターテストベッド研究開発運用室有期研究技術員 岩爪道昭 (いわづめ みちあき)業務企画部DX企画推進室室長/ソーシャルイノベーションユニット総合テストベッド研究開発推進センターテストベッド連携企画室マネージャー(兼務)博士(工学)人工知能、知識工学45494-1-2 AI研究開発環境「AIデータテストベッド」の取組
元のページ ../index.html#53