ポイント

  • Twitterの情報から、IQや外向性など個人のパーソナリティを推定することに成功
  • ネットワーク情報が社会性関連の、言語情報がメンタルヘルスのパーソナリティをそれぞれ推定
  • この推定方法は、メンタルヘルスの分析や個性に応じた働きかけへの応用に期待
国立研究開発法人情報通信研究機構(NICT、理事長: 徳田 英幸)脳情報通信融合研究センター(CiNet)の森数馬研究員と春野雅彦研究マネージャーの研究グループは、ソーシャルネットワーキングサービス(SNS)の情報から、どの程度個人のパーソナリティが推定可能かを調べた結果、外向性やIQといった幅広いパーソナリティを推定することに成功しました。
今回、研究グループは、SNSの一つであるTwitterの情報と被験者が答えたパーソナリティの情報に、データへの過度の適応を避けやすいという特徴を持つAIの一手法であるcomponent-wise gradient boostingを適用し、学習を行いました。その結果、例えば、ツイート数や'いいね'をした人数など、Twitterのネットワークに関する情報は外向性など社会性に関するパーソナリティを推定すること、また、ツイートに使用される言語の情報はメンタルヘルスに関するパーソナリティを推定することが分かりました。本手法は今後、倫理的な検討のもと、メンタルヘルスの分析や、対象の個性に応じた働きかけへの応用が期待されます。
本成果は、2020年8月20日(木)18時(日本時間)に、米国科学雑誌「Journal of Personality」にオンライン掲載されます。

背景

SNSは現代社会の重要なツールとなっています。先行研究において、FacebookやTwitterの情報から基本的で粗いパーソナリティ特性であるBig5を推定できることが示されていますが、推定可能なパーソナリティの範囲、推定に有効な情報の詳細は知られていません。
SNSのどのような情報から、どのような種類のパーソナリティが、どの程度の精度で推定できるかを明らかにする必要性が高まっており、今回の研究を行いました。

今回の成果

図1
図1 今回の研究のイメージ
今回の実験で、我々はSNSの情報から幅広いパーソナリティが推定可能であること、また、SNSの情報に応じて推定可能なパーソナリティが異なることを明らかにしました。
一方で、推定可能なパーソナリティにおける実測値と推定値の相関係数は0.25程度であることが分かりました。この相関係数の値は、SNSからのパーソナリティの推定が、個人のパーソナリティを正確に特定するには不十分ですが、ある程度の人数の集団に適用し、統計的な結果を得るには有効であることを示唆します。
今回、研究グループは、239名(男性156名、女性83名、平均年齢22.4歳)のTwitterユーザーに実験に参加してもらい、24種類(下位区分52種類)のパーソナリティテストに答えてもらいました(実験の詳細は補足資料参照)。
その結果、52種類の下位区分のうち23種類のパーソナリティが推定可能でした。図2AはBig5の外向性の推定結果を示し、個々の被験者に対し、横軸に示す実測値と縦軸に示す推定値の相関係数は0.44と、正の相関が見られます(推定は10-分割交差検証を10回反復、p<0.05/52; Bonferroni補正にて検定)。
結果を詳細に分析すると、ネットワーク情報が、Big5の外向性、共感性、自閉傾向など社会性に関するパーソナリティをよく推定し(図2B)、言語統計情報と使用単語に関する言語情報が、不安傾向、うつ傾向、統合失調傾向などメンタルヘルスや社会経済的地位、喫煙/飲酒に関係するパーソナリティを推定しました(図2Cと図2D)。一方で、時間情報による推定はこれらの情報に比べると困難でしたが、IQは4種類全ての情報から推定できました。
 
図2
図2 Twitter情報から幅広いパーソナリティを推定  
A: 被験者のBig5外向性に関する実際の得点と推定値、B: ネットワーク情報からの推定結果、
C: 言語統計情報からの推定結果、D: 使用単語情報からの推定結果
推定精度の評価は実際のスコアと推定値の相関係数で行い、図中の実線、破線、点線はそれぞれp=0.05/52、p=0.01/52、p=0.001/52の基準を示す
[画像クリックで拡大表示]

今後の展望

今後は数千名の被験者のデータを用いて今回の手法を発展させるとともに、メンタルヘルスの分析や、ユーザーに個別化したナッジなど対象の個性に応じた働きかけへの応用、パーソナリティの脳内機構の解明を倫理的検討とともに進めます。

掲載論文

掲載誌: Journal of Personality
DOI: 10.1111/jopy.12578 
掲載論文名: Differential ability of network and natural language information on social media to predict interpersonal and mental health traits
著者名: Kazuma Mori, Masahiko Haruno
 
<プロジェクト>
本研究の一部は、JST戦略的創造研究推進事業チーム型研究(CREST)「人間と調和した創造的協働を実現する知的情報処理システムの構築」研究領域における研究課題「社会脳科学と自然言語処理による社会的態度とストレスの予測」(研究代表者: 春野雅彦)、科学研究費補助金 新学術領域研究「脳情報動態を規定する多領野連関と並列処理」の一環として行われました。

補足資料

今回の実験と結果の詳細

今回の研究では、239名(男性156名、女性83名、平均年齢22.4歳、標準偏差3.70)のTwitterユーザーに参加してもらい、24種類(下位区分52種類)のパーソナリティテストに答えてもらいました。参加者は、既に100以上のツイートをしており、botや広告のアカウントを避けるため、リツイート、リンク、ハッシュタグ、イメージの割合が50%以下という条件を満たしました。
図4のように、各ユーザーのTwitter情報のうち、
1)ネットワーク情報(ツイート数、リプライ数、リツイート数など15種類)
2)時間情報(時間、曜日、月あたりのツイートやリプライ数の平均、分散など)
3)言語統計情報(ツイートの単語数の平均、分散、1文の文字数の平均、分散、ポジティブ語とネガティブ語の相対頻度など)
4)使用単語情報(ツイートで用いられた単語の出現ベクトル)
のそれぞれから、どれくらいのパーソナリティを推定できるか調べました。
 
図4
図4 パーソナリティ推定に用いたTwitter情報
推定には、逐次的にスパース回帰モデルを作成し、最終的な推定にはこれらを組み合わせるcomponent-wise gradient boosting (CGB)アルゴリズムを用いました。CGBは、データへの過度の適応を避けやすいという特徴を持ち、現実世界の多くの問題に適用されて良好な推定成績を示すことが知られています。本研究では、データを10分割してそのうちの9割でモデルを推定し、残り1割でテストを10回繰り返す10-分割交差検証を、標本データの分割をランダムに10回行って平均精度を調べました。この手続きにより、モデルの推定に用いたデータとそれをテストするデータを分け、さらに結果が特定の分割のしかたに依存しないようにしました。以下に、対象としたパーソナリティと結果の詳細を説明します。

[対象としたパーソナリティ]

本研究では、以下に示すように意思決定やメンタルヘルスの個人差に深く関与する、メンタルヘルス、行動経済、社会性、行動抑制/賦活、Big5、知性、人生の満足度、飲酒喫煙に分類される24種類(下位区分52種類)のパーソナリティテストを行いました。()内は下位区分数を示します。
また、パーソナリティテストのデータ収集は当機構で開発したオンラインデータ収集システムを用いて行いました(図5)。
図5
図5 オンラインデータ収集システムの画面
[画像クリックで拡大表示]
メンタルヘルス
 統合失調症傾向(3) 妄想症傾向(4) 強迫性障害傾向(6) サイコパス傾向(2) 
 マキャベリアニズム傾向(1) うつ病傾向1(1) うつ病傾向2(1) 不安傾向(2) ストレス(1)

行動経済
 社会経済的地位(1) リーダーシップ(1) 社会価値志向性(3) リスク回避(1) 時間割引(1)

社会性
 共感性(4) 自閉症傾向(5)

行動抑制/賦活
 行動抑制(1)/行動賦活(3)

Big5
 Big5(5)

知性
 言語性IQ(1) 流動性IQ(1)

人生の満足度
 幸福感(1) 自尊心(1)

飲酒喫煙 
 飲酒(1) 喫煙(1)

[1)ネットワーク情報からの推定]

ネットワーク情報は、共感性、自閉症傾向、外向性など社会性に関するパーソナリティを推定することが分かります(図6A)。図6BにBig5の外向性における計測された値と推定値の関係を示します。相関係数は0.44と、正の相関が見られます。
さらに、図6Cは、それぞれのパーソナリティ(下位区分)の推定にネットワークのどんな情報が影響したかを示します。その結果、いいねされる頻度(被いいね頻度)は言語性IQの推定に正の寄与、外向性の推定に負の寄与をしました。一方、リプライする相手の数(リプライネットワーク)が外向性や共感性の推定に正の寄与を、自閉症傾向や統合失調症傾向などの推定に負の寄与をしました。
図6
図6 ネットワーク情報からの推定結果
[画像クリックで拡大表示]

[2)時間情報からの推定]

図7に時間情報からの推定結果を示します。社会価値志向性と言語性IQが推定されています。今回、時間情報から推定できるパーソナリティが少なかった理由として、被験者の多くが大学生であり、生活時間のパターンが似ていたことが考えられます。
図7
図7 時間情報からの推定結果
[画像クリックで拡大表示]

[3)言語統計情報からの推定]

図8に言語統計情報からの推定結果を示します。統合失調症傾向、うつ傾向、不安傾向などメンタルヘルスとIQに関する推定ができていることが分かります(図8A)。図8Bはそれぞれのパーソナリティの推定に言語統計情報の中のどの情報がどう寄与したかを示します。その結果、1文の文字数のばらつき(文章の長さ_ばらつき)が統合失調症傾向などの推定に正の寄与をすることが分かります。Twitterにおける表現の長さのばらつきがメンタルヘルスの状態を反映するのが興味深い点です。またポジティブな意味の単語の頻度(ポジティブ語の頻度)とネガティブな意味の単語の頻度(ネガティブ語の頻度)も多くのパーソナリティの推定に寄与しました。
 
図8
図8 言語統計情報からの推定結果
[画像クリックで拡大表示]
ここでポジティブな単語、ネガティブな単語の分類は英語の情動研究に広く利用されているAffective Norms for English Wordsという辞書の単語を用いました。この辞書に含まれる単語を、日本語版ワードネットという辞書を用いて日本語に訳し、さらに、訳された単語を、10人の日本人評価者に評価してもらい、9人以上がポジティブ、あるいはネガティブと判断した単語を採用することで行いました。

[4)使用単語情報からの推定]

使用単語情報からの推定では、少なくとも25%の被験者で一度は使われた単語、あるいは隣接する2単語のリストに対し(全部で4,585項目ありました)、ある被験者がその表現を使ったか、使ってないかを1と0で表した入力データを用いて推定を行いました。
 
図9に使用単語情報からの推定結果を示します。単語統計情報と類似してメンタルヘルス及びIQとともに、知性と飲酒喫煙を推定しました(図9A)。図9Bにどのような単語が飲酒、強迫神経症傾向の推定に寄与したかを示します。前者では飲む、終電、歩く、時刻表といった単語が、後者では時間、優先度といった単語が寄与していることが分かります。
図9
図9 使用単語情報からの推定結果
[画像クリックで拡大表示]

[どの情報がどのパーソナリティを推定するか]

図10にこれまでの結果をまとめ、Twitterのどの情報が各カテゴリのパーソナリティの下位区分をどれだけ推定できたかを示します。この図から、ネットワーク情報は社会性、人生の満足度を推定し、単語情報(単語統計情報と単語使用情報を合わせたもの)は、メンタルヘルス、知性、飲酒喫煙を推定することが確認できます。一方で、現段階では行動抑制/賦活や行動経済に関する推定は難しいことも見て取れます。
図10
図10 Twitter情報と推定可能なパーソナリティのカテゴリ
本研究はソーシャルネットワーキングサービス(SNS)の一つであるTwitterのユーザーから幅広いパーソナリティの指標を収集し、AIの学習技術により分析することで、Twitterの情報から個人のパーソナリティを幅広く推定できることを明らかにしました。また、ネットワークに関する情報が社会性に関するパーソナリティを、ツイートに使用される言語の情報がメンタルヘルス、飲酒喫煙に関するパーソナリティを推定すること、知性は幅広い情報に反映されること等を見出しました。 同時に個人のパーソナリティを正確に特定するための推定精度は得られないという手法の限界点も明らかにしました。
 
付記
本研究の実施に当たり、事前に被験者全員に対して実験内容を説明し、同意を得ました。また、実験計画については情報通信研究機構の倫理委員会の承認を受けています。

用語解説

Twitter
ソーシャルネットワーキングサービスの一種。ツイートと呼ばれる半角280文字以内のメッセージ、リツイートと呼ばれる他のユーザーの投稿の再投稿、リプライと呼ばれる他のユーザーに宛てた投稿や、画像、動画、URLを投稿できる。他のユーザーのツイートを自分のタイムラインに表示できるようにすることをフォロー(follow)、フォローする人をフォロワーという。他のユーザーの投稿にいいね(Like)する機能も持つ。
Big5
性格・特性の分類法である主要5因子モデル。開放性、誠実性、外向性、協調性、神経症傾向の5因子からなる。これらの包括的要因の下には、より具体的な要因が存在すると考えられる。例えば、メンタルヘルスに関する多くの要因は神経症傾向の下に位置すると考えられるが、神経症傾向のスコアからこれらの値を推定することは難しく、より詳細なテストが必要である。Big5の各因子のスコアはNEO-PI-Rや主要五因子性格検査の質問項目に答えることで計算される。
相関係数
図3
図3 相関係数と相関の強さ
[画像クリックで拡大表示]
相関係数は、2種類のデータの関係を示す指標であり、-1から1までの値を取る。相関係数は、共分散をそれぞれの変数の標準偏差で割ることで計算する。図3に正の関係を示す相関係数が0から0.9となるようにコンピュータで生成したデータを示す(-1から0は負の関係)。相関係数が0のとき2つのデータは無関係、逆に0.9のときはほぼ直線に近い強い相関関係となり、1になれば完全に直線上に乗る。本研究で得られる実際のパーソナリティテストの値と推定値の相関係数は0.2と0.5の間の値であり、これらの値は両者の間に弱い相関関係が存在することを示す。
10-分割交差検証
交差検証は統計学において推定したモデルが推定に用いたデータ以外にも当てはまることを検証する方法。標本データを分割し、その一部からモデルを推定し、残る部分でモデルのテストを行う。本研究ではデータを10分割してそのうちの9割でモデルを推定し、残り1割でテストを10回繰り返す10-分割交差検証を、標本データの分割をランダムに10回行って平均精度を調べた。この手続きによりモデルの推定に用いたデータとそれをテストするデータを分け、さらに結果が特定の分割のしかたに依存しないようにした。
Bonferroni補正
1回のテストである結果(本研究では回帰直線の傾きが正)が偶然生じる確率が5%でも、同種のテストを何回も繰り返せば、どこかのテストでその結果が偶然生じる確率はずっと高くなる。このテスト回数の効果を補正する手法の一つがBonferroni補正という方法で、通常の有意水準をα(普通は5%)、実施するテストの数をNとする場合に各テストの有意水準をα/Nにする。本研究では52種類のパーソナリティを扱うので有意水準は0.05/52となる。
ナッジ
ナッジ(Nudge)とはヒトの意思決定がもつ様々なバイアスに働きかけることで、選択の自由は確保した上で行動をより良いものに変えていく手法である。既に環境行政や医療行政など幅広い分野で応用されている。対象となるバイアスとしては社会規範、互恵性、損失回避に関するもの等がある。ナッジでは全ての対象者に同じ情報とメッセージを提示することを暗黙に仮定するが、これらのバイアスには大きな個人差が存在する。したがって、本研究のようなパーソナリティの推定を用いることで個別化したナッジを行える可能性がある。

本件に関する問合せ先

脳情報通信融合研究センター
脳情報工学研究室

春野 雅彦

Tel: 080-9098-3239

E-mail: mharunoアットマークnict.go.jp

広報(取材受付)

広報部 報道室

廣田 幸子

Tel: 042-327-6923

E-mail: publicityアットマークnict.go.jp