ラムの開発効率や再利用性が向上し、第3の手法は加速した。21世紀に入り、これら3つの研究手法に加えて、第4の手法としてインフォマティックスが提言された。インフォマティクスとは、広義には「コンピュータシステムにおける構造、行動、自然的または人工的な相互作用」と説明されているが、科学研究分野では「人間よりも計算機が有利な処理・計算機にしかできないデータ処理を行う手法」と解釈されることが多い[16][17]。インフォマティクスが研究手法として提言されてきた背景には、19世紀末に科学研究で扱うデータのほとんどがデジタル化された(すなわち、ネットワーク上で流通し、コンピュータ上で処理できる)ことと、データサイズや種類が大規模化・多様化したことが挙げられる。第2、第3の研究手法の発展により、我々の持つ科学データは量・種類とも増え続け、多くの研究者は、「一生かけても解析できない程の量と種類のデータ」に埋もれつつある。いわゆる、科学研究分野におけるビッグデータ問題である。インフォマティクスへの期待は、コンピュータのデータ処理能力を存分に活用して、これらのビッグデータ問題を解決することである。表1は、4つの科学研究手法をまとめたものである。第1の手法が机上で行うものであるのに対して、第2の手法の研究基盤は観測装置群となる。第3の手法の基盤は、もちろんスーパーコンピュータやクラスタ計算機群である。さて、インフォマティクス研究手法の研究基盤は何であろうか。筆者らは、クラウド(クラウドコンピューティング環境)こそがインフォマティクス研究手法の基盤であると考えてきた。したがって、第4の研究手法を実現するためには科学研究用クラウドが必要となる。これが2.3のNICTサイエンスクラウド発想の原点となった。第3の手法である大規模数値シミュレーション分野においても、類似のパラダイムシフトが起こった。High Performance Computing(HPC)は計算指向型(Compute-Intensive)アプローチであり、上記の第3のパラダイム(数値シミュレーション科学)としてスーパーコンピュータやCPU、メモリバンド幅の高機能化を主体とした計算機科学の高度化に特化してきた。しかし、出力される大規模データ処理のためにデータ指向型ともいえる第4のパラダイムが登場した。ここでは、広域に分散する多数の異種リソースを組み合わせて計算を行うMany-Task Computing(MTC)という概念や、データ分散、並列処理及びローカルディスクアクセスに着目した総合的計算を行うData Intensive Computing (DIC)という概念が中心となる。数値シミュレーション分野での第4のパラダイムは着実に実用化されており、筆者らもGfarm(GRID Datafarm)による大規模データの並列分散処理技法[18]–[22]、遠隔通信技法[23]、システム安定化技術[24]、セキュアデータ管理手法[25]–[28]を様々に開発し、これらは科学衛星データ処理[29]–[31]や後述のひまわりリアルタイム(4.1)で実用化されている。2.3NICTサイエンスクラウドクラウド(またはクラウドコンピューティングシステム)は2005年頃にビジネスを中心として急速に広がった情報通信インフラの集合形態であり、先端的情報通信技術を基盤とした多目的型のデータ処理環境である。クラウドとは何かという問いに対して明確な定義はなくバズワードの一つであり、別のバズワードであるビッグデータと融合して、実態が不明瞭なまま数年間で世界中に広まった。しかし当時、大規模データの重要性と問題点を認識していた筆者ら研究者にとっては、むしろ「問題点がビッグデータと言う言葉で明確になった」という喜びが大きかった[32][33]。筆者らは地球惑星科学の気象系、惑星系、超高層大気系、岩石・火山系などの諸分野の研究者と協力し、日本最大の地球惑星学会である日本地球惑星科学連合大会において「情報地球惑星科学と大量データ処理」セッションを主宰している。これは、ビッグデータというバズワード登場後の2013年から始まったものであり、当時から地球惑星科学研究分野においてビッグデータ問題意識を持つ研究者がいたことを意味している。近年では、このセッションは発表数も増加し、自然科学分野においても時代が追いついてきたという思いが強い。これらを背景に、筆者らは2010年頃に図4に示すNICTサイエンスクラウドを提唱した[32]–[37]。図4は、NICTサイエンスクラウドの概念図である。NICT表1 4つの科学研究手法のまとめ研究手法研究基盤(宇宙科学の場合)第1の手法理論研究机、紙と鉛筆第2の手法観測・実験衛星観測・地上観測・室内実験第3の手法計算機シミュレーションスーパーコンピュータ第4の手法インフォマティクス科学研究クラウド654-3 時空間データGISプラットフォーム
元のページ ../index.html#69