少量遗忘有助于提高学习动力
学习、动机和奖励都是复杂的神经实体。近期研究有了些进步,但还有很多问题没有解决。反常地,根据最新研究,忘记对奖励的期盼实际上可能会让人在某些情况下,学习效果更好。
我们是如何目的明确地找到奖励似乎在一定程度上依赖于健忘。虽然学习、经历和动机发生的机制还不太明确,神经递质多巴胺参与的程度很大。
现在的研究补充了我们对于多巴胺如何转化为奖励,这种信息在大脑中的处理过程的了解,有可能还可以回答一些复杂的问题。
这些工作时基于以前的工作的,前期研究展示了健忘实际上是如何帮助某些形式的学习。
近期的发现是又一重要的解释动机和奖励的神经科学的模块。
该领域一项重要的理论就是奖励-预测-误差(RPE)。RPE出现的目的是形成大脑评估奖励和促进组织完成目标的神经基础。
大脑中某些多巴胺能的神经元在完成任务和奖励不容易拿到时会产生反应。如果期望得到已经收到的奖励,这些神经元就不会有反应,然而,如果不期望得到奖励,神经元就会有反应。这些神经元不会通过奖励是否得到来编码,而是区分期望与实际,这就是RPE。
简单来说,如果一只大鼠随机握住一个杠杆,不会期望有奖励,但是,如果得到一个奖励,这些神经元就会开火,多巴胺将会提高。如果大鼠握住一个杠杆,并期望得到奖励,它们就不会开火。因此,如果期望得到奖励,多巴胺就会减少。
然而,其他近期研究显示,这种多巴胺反应可能有时会一直保持在很高的水平,即使在某些类型的任务中,是朝着预定的奖励目标努力的,多巴胺水平一直很高,研究人员认为这种长期保持的信号可能会代表动机。
人们认为,多巴胺释放的方式可以帮助在两种模式之间转换:多巴胺脉冲影响奖励的RPE方面,然而,一种更长期的更持续的多巴胺信号会创造并保持一种达到目标的动机。
本研究发表在本周的《PLOS 计算生物学》上,开始更好地了解这种多巴胺的双面效应的作用形式。
为了研究这种奇怪的难题,东京大学的Ayaka Kato和Kenji Morita运用了计算机建模的研究能力。两人创建了一种模型,这种某些通过一系列决策来解决一个难题,类似于计算机迷宫;为了加入一定程度的遗忘因素,研究人员将神经元之间与奖励相关的联系编程为随时间的推移而减弱。
模型设计出来以后,他们就开始运行试验几百次,并对结果进行分析。与一般的预期相反,内置的遗忘实际上会加强动机,并提高目标实现的速度。
总地来说,一点遗忘可以帮助保持动机的强度,并提高模型实现目标的速度。
作者得出结论,少量的遗忘可以帮助让很小的奖励出入意料,帮助保持达到目标的动机活跃。遗忘可以有效地降低期望的水平。
Morita表示,尼采曾说过,遗忘是幸福的。我们的计算研究显示,实际真的是这样,即使原因不同。
以前,科学家发现神经递质多巴胺水平的下降可以降低动机。这些发现帮助人们理解以前让研究人员困惑的发现。
作者希望,这些结果最终可能帮助治疗一下多巴胺相关的神经性疾病:这可能与神经病学异常有关,尤其是帕金森综合症,这些疾病的特征是动力和动机损害,可以与多巴胺水平有关。
对生物学价值学习系统的动力学更深入的了解可能会对这些疾病的临床策略有关。
这些结果需要在实验室环境中重现,才能确证。未来,研究团队希恩能够研究其他内在因子的效应,如年龄、情绪和健康。这些因素如何影响遗忘的速率,是否可以调节来改善动机,这些研究将非常引人入胜。