機械学習手法である。宇宙天気予報と機械学習の専門家で連携チームを結成し、音声翻訳に用いられる技法の応用を試みた[22]。活性化関数(ReLU)やバッチ正規化、スキップ接続といった深層学習技法を組み込み、多層化と精度向上を可能にした。またフレア予測問題は発生自身が稀まれでインバランス問題であり、損失関数に重みをかけることで予測漏らしを減らすなど、数多くの工夫を盛り込むことで予測精度向上に取り組んだ。3.2 予測評価と特徴量の重要度ランキング予測精度評価では、予報運用モデルとして適正な評価ができるよう注意した。我々は特徴量データベースを時系列で分割し、2010–2014年分を学習用、2015年分をテスト用に用いた。別の手法として、ランダムにデータ分割して学習を行う方法もある[17][23]が、時系列のフレア予測の場合、数時間だと磁場構造のような特徴量はほとんど変化しないため、学習用とテスト用の両方にほぼ同じデータが分配されてしまうため、今回は用いなかった。また時系列分割の場合、未来のデータを使って過去イベントを予測することもない。さらに汎化性能を高めるため、我々は時系列分割したデータセットを基に、学習用データとテスト用データを変えながら精度検証を行う時系列交差検証も提案した[24]。フレア予測の評価指標としては、スキルスコアの1つTrue Skill Statistics(TSS)[25]が多く用いられている。TSSはフレア発生時の的中率からフレア非発生時の非的中率を差し引いたもので、データのイベント率に依存しないため、インバランス問題の評価に適している[26]。予測結果を表1に示す。24時間以内に発生するM(C)クラス以上フレアの予測に対し、TSS= 0.80 (0.63)を達成した。人手予報ではMクラス以上フレアの予測精度はTSS=0.50であり、「Deep Flare Net」を用いることで大きく精度向上することに成功した。機械学習では予報に有効な特徴量の重要度ランキングの分析もできる。ここでは予測分類時のジニ不純度の減少量で評価した。ジニ不純度とはデータが一種類だと最小で、複数種が均等に混ざった状態で最大になる。したがって一種類に特定できるような特徴量の予測では、ジニ不純度の減少量は大きく重要度も大きい[27]。この手法を用いて分析した結果、フレア履歴、1日前のX線最大値、磁気中性線の長さと本数、磁束密度、彩層底部発光、平均磁場強度、ベクトル磁場特徴量という順で重要度が大きい傾向にあることが明らかになった[21]。3.3Deep Flare Netの予報運用 3.1で説明したDeep Flare Netモデルを基に、我々は2019年から予報運用を開始した。6時間ごとにインターネットを通じて観測データを取得するよう設定し、リアルタイムで取得した磁場画像から黒点群を検出、79個の特徴量を抽出して深層学習モデルに入力する。そして予測された24時間以内に発生する最大規模のフレアを黒点群ごとに可視化してウェブで表示公開する[24]。リアルタイム運用では、ノイズを多く含んだデータや観測データの欠損でエラーが生じることがあり、それらを回避するよう運用システムならではの改図4 Deep Flare Netの概略図(Nishizuka et al. 2018 ApJ[20]より引用改訂)表1Deep Flare NetによるMクラス以上フレア、Cクラス以上フレアの予測結果152 情報通信研究機構研究報告 Vol.67 No.1 (2021)4 太陽・太陽風研究
元のページ ../index.html#158