本記事は、坂上雅道氏の著書『世界最先端の研究が教える すごい脳科学』(総合法令出版)の中から一部を抜粋・編集しています。

優しさ,ビジネスマン
(画像=78art/stock.adobe.com)

電車ですぐに席を譲る人はいい人ではない!?

ここであなたに質問です。あなたは帰りの通勤電車の座席に座っています。あなたの目の前に立っているのも辛そうな人がやってきました。あなたは席をすぐさま譲るでしょうか? それとも譲らないでしょうか?

そのまま席に座っていれば、自宅の最寄駅まで楽に帰れます。しかし、席を譲ってしまえば、自分は立っていなくてはならなくます。脳が一種のジレンマ状態に陥ります。このような場合に、私たちの脳のどのような部分が反応しているのでしょうか?

社会心理学者の山岸俊男博士と玉川大学脳科学研究所の坂上雅道博士らの研究では、20代から50代までの男女443人を対象に、協力行動と意思決定の早さの関係を調査しました。

この実験は2012年から2017年までの間に複数回行われた実験です。協力行動を測定する複数の経済ゲーム実験に参加し、その意思決定にかかった時間を測定しました。経済ゲームは、利益を相手と自分で分けるときに、自分にすべての分配権があるとする独裁者ゲームなどです。自分勝手な人は自分の取り分を多くするでしょうし、利他的な人は、相手の取り分を多くするでしょう。その他にも他人と協力すると最大の利益が得られる囚人のジレンマゲーム、公共財ゲーム、信頼ゲームなどを使って、協力行動を数値化しました。

さらにこの研究では、利他傾向を測定する社会的価値志向性尺度や他人から搾取されたくないと思う傾向(社会的リスク回避)も測定しました。

ゲームの結果は、社会的価値志向性尺度で一貫して利他主義者と分類された人は、素早く意思決定を行うときには協力的に振る舞いました。一方、意思決定に時間をかけると非協力的に振る舞うことが明らかになりました。

また、利他主義者の意思決定の時間は、社会的リスク回避傾向が高まるほど長くなっていました。これは、素早い意思決定では協力する人々も、他者から搾取される恐れについて考えることに時間を費やすと協力的に振る舞うのをためらうようになることを表しています。

これに対して、時間をかけて協力する利己主義者は、短期的な利益ではなく、自身の評判などを含めた長期的な利益を考慮して協力することが示されました。

つまり、この実験結果から考えると、すぐに席を譲る人も最終的に自分の利益がどれだけもたらされるかを考えているということなのです。さらに言えば、席を譲ることによって、巡り巡って自分のところに社会的な報酬があると考えるから、すぐに席を譲る、ということなのです。

脳には2つの学習方法がある

私たちは普段何気なく、いろんなものを決めて、行動をしています。例えば通勤のために朝起きて、決まった時間に決まった電車に乗る。何も考えずボーッとしていたら、会社に着いたということを経験したことがある人もいるかもしれません。

一方、1週間ぐらいの休暇をもらって、どこかに旅行に行こうということになれば、一生懸命に旅行先の宿を調べたり、周辺の観光地を調べたり、おいしい料理を調べたりする人もいるかもしれません。もちろん、調べない人もいますが、ある行動を選択するのに、何も考えずに行動できるパターンと、いろいろ考えて行動するパターンの2つの行動パターンがあるように思えます。

行動選択にはさまざまな脳の器官が関わっています。前頭前野ぜんとうぜんや線条体せんじょうたいは、神経伝達物質のドーパミンが活躍する報酬系という神経回路です。以前から前頭前野での行動の選択と、線条体を中心とした報酬系での行動選択の2つの選択が脳には存在することが知られていました。

ロンドン大学のダウ博士らの研究では、この2つの選択の動機には、「強化学習」が関わっているのではないかと考えて研究を行いました。強化学習では選択する行動は、最終的にもたらされる報酬によって決まるとされています。

強化学習では大きく分けて2つのパターンがあります。

1つは、時間差学習などの「モデルフリー」なアプローチです。ドーパミンに反応するニューロンとその線条体せんじょうたい(特に背外側)の神経活動によって行われます。もう1つは「モデルベース」のアプローチ方法です。これは前頭前野ぜんとうぜんやにあるニューロンの活動によって行われます。

モデルフリーのアプローチとは、簡単に言えば習慣のことです。例えばレバーを押せば餌(報酬)が出てくるというような動物実験では、「レバーを押すと餌が出る」ということを脳が学習した場合、同じ行動を繰り返すことによって、餌を獲得できる確率が上がります。

習慣に基づく行動選択は、例えば、私たち人間でいえば通勤も1つの習慣行動です。同じ場所には何も考えずに移動できるのは、脳の中で思考の順序や行動の方法などがパターン化されているからです。この習慣に基づく行動選択を習慣行動といいます。すぐに行動に移すことができますが、状況が変化すると柔軟に対応ができません。

もう1つの学習がモデルベースと呼ばれるものです。このモデルベースは前頭前野ぜんとうぜんやで行われます。これは長期的な結果の予測を、短期的な記憶を通して結論づけるのではなくて、いくつかの記憶を組み合わせて、結果を推論するようなしくみです。この方法では、将来起こりうる状況をまるで枝分かれした状態で選択肢を探るため、「ツリーリサーチ」とも呼ばれています。ツリーリサーチで行動を選んでいると、時間もかかりますし、間違ってしまうこともあります。しかし、状況が変化しても柔軟に対応できるというメリットがあります。こちらは目標志向行動といいます。

ダウ博士らは、マウスにレバーを押すと餌が出るというしくみを使って、この2つの学習方法がどのように作用するのかを研究しました。餌に動物の死臭などを混ぜて餌の報酬価値を下げたり、事前に餌を与えたりして餌の報酬価値を変化させたのです。

すると、習慣行動と目標志向行動の2つのシステムは相互に作用し、トレードオフ(両立できない関係性)の関係になっていることがわかりました。

また、目標志向行動だと得られる期待値の計算にコストがかかる、つまり、報酬を得るために思考するのが大変になってくると、習慣行動を取ったりすることが示されたのです。

2つの行動選択のうち、習慣行動には報酬系の神経伝達物質ドーパミンが深く関わっていることが示されましたが、目標志向行動には、ドーパミンがどれだけ関わっているのかは明らかになっていません。私たちが何か行動を起こすときには、目の前に餌をチラつかせるだけでは、行動が継続できないということもあるのです。例えば、ダイエットで目標体重を設定すると、これは目標志向行動です。ダイエットを成功させるには、報酬を決める(成功したら旅行に行ける)だけでなく、体験に基づいて、ダイエット教室を開く、などの高い目標を設定すると、成功しやすくなるのです。

=世界最先端の研究が教える すごい脳科学
坂上雅道
玉川大学脳科学研究所教授。玉川井大学脳科学研究所所長。1985年東京大学文学部心理学科卒業。専門研究領域は思考と創造の神経メカニズムの解明。2000年順天堂大学医学部講師、2002年玉川大学学術研究所教授。2007年より玉川大学脳科学研究所教授。2021年同研究所所長に就任。

※画像をクリックするとAmazonに飛びます
ZUU online library
(※画像をクリックするとZUU online libraryに飛びます)