2.3階層的運動学習機構これまでの多くの運動学習研究[13][16]–[18]は、運動適応を内部モデルの変化として説明してきた。一方、上述した2つの現象は内部モデルの変化だけで説明することは困難である。内部モデル学習は、力場の物理特性に関する知識を徐々に獲得する過程として記述される[19][20]。例えば、LIPFの場合、手先にかかる力は0100xxyyFPKFPとして記述される。このとき、Fは力(N)、Pはスタート地点からの手先の位置(m)、Kは係数(60 N/m)。この場合、学習によって獲得された力場の知識は、予測される手先の力ˆFF として記述される。このとき、αは学習係数であり、α=0は力場を全く学習していないことを、α=1は力場を完全に学習したことを意味する。よって、αを0から任意の値まで増加させることによって適応過程を、αを減少させることによって脱適応過程を説明することができる。実際に、このモデルはVDCFの運動適応を上手く説明する[19]。しかし、このモデルはαの単調な増減のみを示すため、我々が確認した手先軌道の非単調的変化は説明できない。また、脱適応後、αは0となり、学習前の軌道に収束する。つまり、このモデルでは曲がったままの脱適応軌道も説明できない。よって、我々の実験結果は、内部モデルの学習以外の学習過程の必要性を強く示唆する。そこで、我々は、階層運動学習モデルを新たに提案した(図4)。このモデルの特徴として、内部モデル学習(図4A、シアンbox)の階層的上位に、失敗によって変調する運動計画の学習(図4A、マジェンタbox)が位置づけられている。この運動計画の学習は、課題の失敗時に活性化し、ターゲットエラーと逆方向に“方向バイアス”を変化させ、運動方向を調整する(図4B)。課題が成功すると、運動計画の学習は不活性化し、方向バイアスは適応前の方向(前方)にゆっくりと減衰する。さらに、この方向バイアスの減衰は、内部モデルの完全な脱適応後(α=0)に停止する。これらの仮定の下、階層運動学習モデルは、我々の実験で得られた2つの特徴を上手く再現した(モデルの詳細は[9]を参照)。LIPFの適応時に大きなターゲットエラーが左に生じると、右方向に方向バイアスが生じる。課題が成功するまで、方向バイアスの時計回り方向の角度が増加する。その後、方向バイアスはターゲット方向に徐々に減衰する。同時に進行する内部モデルと方向バイアスの学習の相互作用の結果、手先軌道が試行ごとに生じる。結果的に、方向バイアスの非単調な変化が主な要因となり、手先軌道の非単調的な変化が上手く説明された。この方向バイアスは、LIPFの脱適応で生じるターゲットエラーを素早く減少させるように働く。結果として、脱適応過程においても手先軌道の非単調な変化が生じる。一方、内部モデルは10~30試行で素早く図4階層運動学習モデルの概念図 (A): このモデルは2つの学習モデルから構成される。階層的上位に、運動方向に関する運動計画の学習が位置する。この学習はターゲットエラーによって駆動される。階層的下位に、内部モデルの学習が位置する。この学習は軌道誤差によって駆動される。本研究で定義した軌道誤差は、一般的に“感覚予測誤差”と呼ばれている[9][25]。課題が失敗した場合(ターゲットエラーがターゲット幅より大きい)、運動計画の学習が活性化し、運動方向を変更する。課題が成功した場合、計画される運動方向は、適応前の運動方向(ターゲット方向)へゆるやかに減衰する。(B): 計画される手先の運動方向は、運動方向バイアス(マジェンタの矢印)によって表現される。課題が失敗した場合、方向バイアスはターゲットエラーを打ち消す方向に素早く修正される。図3適応前と脱適応後の手先軌道: VDCFとLIPFにおける、適応前の最後20試行(シアン)と脱適応の最後20試行(マジェンタ)の手先軌道の比較。実線は実験協力者間平均値を、周りの影付き領域は標準誤差を示している。x軸とy軸のスケールが異なることに注意。適応前と脱適応では、力場がかかっていない同一環境であるにもかかわらず、LIPFグループでは2つの軌道の間に有意な差が認められた。62 情報通信研究機構研究報告 Vol.68 No.1 (2022)4 いつまでも健康で幸せな生活のために:ヒトの脳機能を補助・拡張するための研究・技術開発
元のページ ../index.html#66