HTML5 Webook
11/102
で、各々のモデルやモデル内の個別特徴が脳のどの部位における活動をどれだけ説明するかを解析することで、脳のどこでどのような情報が表現されているかを定量的に評価することができる。また脳内における特徴空間の構造を調べることで、脳が多様な体験内容をどのように構造化して表現しているかを推定することができる。さらには、逆符号化モデルを用いることで、脳活動から該当する特徴空間に関連した体験内容を推定することも可能になる。次項では、これらの脳情報のモデル構築と解読の枠組みを用いた具体的な研究成果について紹介する。意味認知の定量的理解とその応用2.1脳内意味情報のモデル化この世界にあふれる様々な情報に対し、ヒトは意味という単位でまとまりを見いだし、言語を割り当てて理解する。意味及び言語により情報を表現することで、世界に存在する情報を体系的に解釈及び操作することが可能となる。ヒト脳内における意味情報の表現を理解することは、言語を扱う地球上唯一の生物であるヒトの知性を理解するためにひときわ重要であろう。しかし、ヒト脳内の意味情報表現は、心理学や神経科学において長く研究されてきたが、いまだ不明な点が多い [8]。上述の符号化・逆符号化モデリングは、そのような脳内の意味情報表現を理解するうえで、非常に強力な方法論を提供する。私たちは、脳内意味情報を定量化するため、言語特徴を用いた符号化・逆符号化モデリングに取り組んだ。言語特徴は、自然言語処理アルゴリズムの1つであるword2vec [9]により生成した。Word2vecはWikipe-diaコーパスのような大規模テキストデータから、単語と単語の意味的関係性を適切に表現する多次元のベクター空間を学習する。この空間では数万から数十万個の単語がベクターとして表現され、単語同士の意味的な近さが、対応する単語ベクターの空間内の距離として表現される。また、単語間のアナロジー(類似)関係が適切に表現され、単語ベクターを用いて「王−男性+女性=女王」のような仮想的な加算・減算も行える。このような意味認知における私たちの直観と合致するベクター空間を言語特徴としてモデル化に用いることで、効果的に脳内意味情報を定量化できると考えた。私たちは脳内意味表現を定量的に理解するために、word2vecベクター空間を用いた符号化モデルを構築した(図2)。まず、自然動画により誘発される大脳皮質のfMRI応答を計測した。さらに、動画から言語特徴を抽出するため、各動画シーンに対して、複数名の記述者から文章によるシーン記述を取得した。シーン記述に含まれる単語を学習済みのword2vecベクター空間に投射して、各シーンに対応するword2vecベクター(以降、シーンベクターと呼ぶ)を算出し、それらの時系列を説明変数としてfMRI応答の時系列を予測するモデルを線形回帰により学習した。こうして学習したモデルを用いて、新規の動画に対応するシーンベクターから予測したfMRI応答と、同じ動画が誘発した計測fMRI応答のピアソン相関により、各ボクセルの予測精度を評価した。その結果、視覚皮質をはじめとする広い皮質領域で高い予測精度を示すことが分かった[10]。また、同じく脳内意味表現の定量化を行った先行研究の符号化モデル[11]と比較しても、私たちのモデルの方がより高い予測精度を示したことから、word2vecベクター空間を用いた符号化モデルが脳内意味表現を上手く定量化することが分かった。2図2 Word2vecベクター空間を用いた符号化モデル72-1 視覚と認知をつかさどる脳機能の定量的理解とその応用に関する研究
元のページ
../index.html#11