【定説を覆すか】大きな報酬は学習を「加速」させる

「あの人は覚えが早い」

私たちはつい、学習の速さを“才能”や“努力量”の違いとして考えがちです。

しかし、学習を速めるカギは、経験回数だけではなく、「報酬の大きさ」や「課題にどれだけ集中し続けられるか」にあるのかもしれません。

米国ハワード・ヒューズ医学研究所（HHMI:Howard Hughes Medical Institute）の研究チームは今回、マウスを用いた実験によって、報酬が大きいほど学習スピードが向上することを示しました。

これは、神経科学で長く前提とされてきた「学習は経験回数によって進む」という考え方に見直しを迫る成果です。

研究の詳細は、2026年5月21日付で学術誌『Science』に掲載されました。

「大きな報酬」がマウスの学習スピードを向上させる
大きな報酬はドーパミンを長く働かせ、学習への没入を高める

「大きな報酬」がマウスの学習スピードを向上させる

動物に課題を覚えさせる実験では、これまで「小さな報酬を何度も与える」方法が一般的でした。

例えば、喉が渇いたマウスに課題を行わせ、成功したら少量の水を与えるという方法です。

なぜ報酬を小さくするのかというと、1回あたりの報酬が大きすぎると、動物がすぐに満足してしまい、たくさんの試行回数をこなせなくなるからです。

そのため神経科学の実験では、マウスの1日の必要量から見るとかなり小さな報酬を使い、何百回、何千回と反復させる設計が当たり前になっていました。

この背景には、「学習速度は主に経験の量で決まる」という考えがあります。

何回成功したか、何回報酬を得たかが重要であり、報酬の大きさそのものは学習速度を大きく変えないと見なされていたのです。

しかし研究チームは、この前提を改めて検証しました。

実験では、従来よりも1桁から2桁大きい報酬をマウスに与え、学習の進み方を調べました。

対象となったのは、隠された目標地点を探すナビゲーション課題、力を使って引く運動スキル課題、感覚情報に基づいて判断する意思決定課題などです。

すると結果は、研究者たちの予想を大きく超えるものでした。

通常の小さな報酬では、課題の習得に何百回、何千回もの報酬経験が必要になる場合があります。

ところが大きな報酬を与えられたマウスは、はるかに少ない経験で課題を学習し、なかには数回の報酬経験だけで隠された目標地点を覚えた個体もいました。

つまり、従来の標準的な報酬サイズでは、マウスが本来発揮できる学習効率を十分に引き出せていなかった可能性があるのです。

さらに興味深いのは、個体差が小さくなった点です。

通常、あるマウスはすぐ課題を覚える一方で、別のマウスは長く訓練してもなかなか上達しないことがあります。

しかし大きな報酬を使うと、多くのマウスが短期間で学習するようになりました。

これは、少なくとも今回の課題では、マウスごとの成績差の一部が、学習能力そのものではなく、課題に取り組み続ける力の違いだった可能性を示しています。

では、なぜ大きな報酬は学習を速めたのでしょうか。

大きな報酬はドーパミンを長く働かせ、学習への没入を高める

研究チームが注目したのが、脳内のドーパミンです。

ドーパミンは、報酬、意欲、学習に関わる神経伝達物質として知られています。

従来、ドーパミンは「予想より良い結果が得られたとき」に強く働くと考えられてきました。

これは簡単に言えば、「思ったより良いことが起きた」ときに脳が強く反応する仕組みです。

今回の研究では、大きな報酬を与えるほど、腹側線条体でのドーパミン放出が強くなり、しかも長く続くことが分かりました。

つまり、腹側線条体のドーパミン反応は、「成功したかどうか」だけでなく、得られた報酬の大きさにも応じて変化していたのです。

さらに研究チームは、小さな報酬を使ったまま、光遺伝学によってドーパミン活動を人工的に長く続かせる実験も行いました。

その結果、1回ごとの学習量が増え、課題から離れにくくなる効果は再現されました。

一方で、前日に学んだことを翌日に持ち越す効果までは完全には再現されませんでした。

ここで重要なのは、「報酬を大きくすると、ただ成績がよくなる」という単純な話ではない点です。

論文では、学習効率を主に3つの要素に分けて考えています。

1つ目は、1回の試行からどれだけ学ぶかです。

大きな報酬を得たマウスは、少ない経験からより多くを学んでいました。

2つ目は、前のセッションで得た学習内容を次の日以降にどれだけ持ち越せるかです。

大きな報酬は、この学習の持ち越しにも良い影響を与えていました。

3つ目は、課題へのエンゲージメント（集中して取り組み続ける状態）です。

研究では、このエンゲージメントの違いが、個体差を左右する大きな要因だったと考えられています。

大きな報酬は、マウスを「課題に夢中な状態」にし、結果として学習のばらつきを小さくしたのです。

とはいえ、この研究は「報酬を大きくすれば何でも学習が良くなる」と言っているわけではありません。

むしろ重要なのは、従来の動物学習実験が、小さな報酬を標準にしていたことで、動物の本来の学習効率を過小評価していたかもしれないという点です。

マウスは学習が遅いのではなく、十分に魅力的な報酬があると、少ない経験からでも素早く学べる可能性があります。

この発見は、神経科学における実験設計を変えるだけでなく、学習とは単なる反復ではなく、「価値ある成功体験」と「課題への没入」によって大きく左右されるものだと示しています。

学習の速さを決めていたのは、経験の回数だけではなく、脳がその経験をどれほど重要なものとして受け取ったかだったのかもしれません。

参考文献

The Bigger the Reward, the Faster We Learn
https://www.hhmi.org/news/bigger-rewards-speed-up-learning-dopamine-study

元論文

Reward magnitude determines reinforcement learning efficiency
https://doi.org/10.1126/science.aeb0813

ライター

矢黒尚人: ロボットやドローンといった未来技術に強い関心あり。材料工学の観点から新しい可能性を探ることが好きです。趣味は筋トレで、日々のトレーニングを通じて心身のバランスを整えています。

編集者

ナゾロジー編集部

【定説を覆すか】大きな報酬は学習を「加速」させる

「大きな報酬」がマウスの学習スピードを向上させる

大きな報酬はドーパミンを長く働かせ、学習への没入を高める

提供元

ナゾロジー

あなたにおすすめ