ISSN 1671-3710
CN 11-4766/R
主办:中国科学院心理研究所
出版:科学出版社

心理科学进展, 2020, 28(2): 230-239 doi: 10.3724/SP.J.1042.2020.00230

研究前沿

反馈间隔影响反馈加工:整合行为和电生理研究的视角

万楠, 朱树青, 贾世伟,

山东师范大学心理学院, 济南 250358

The effect of feedback interval on feedback processing: A perspective of integrating behavioral and electrophysiological researches

WAN Nan, ZHU Shuqing, JIA Shiwei,

School of Psychology, Shandong Normal University, Jinan 250358, China

通讯作者: 贾世伟, E-mail:jiashiwei82@126.com

收稿日期: 2018-12-3   网络出版日期: 2020-02-15

基金资助: * 国家自然科学基金青年项目(NSFC31200784)

Received: 2018-12-3   Online: 2020-02-15

摘要

反馈在现实生活中扮演着重要角色, 通过反馈信息进行学习是人类获取知识和技能的有效手段。反馈间隔是指个体行为发生到反馈刺激呈现之间的时间间隔。在反馈加工过程中, 反馈间隔是一个重要影响因素, 但反馈间隔影响反馈加工的研究结果不一。对反馈间隔影响反馈加工的行为和电生理研究分别做了介绍, 对结果出现差异的原因进行了分析。未来的研究应考虑结合行为研究与电生理研究, 并统一反馈间隔的操作定义。

关键词: 反馈间隔; 反馈加工; 反馈相关负波; 延迟反馈; 立即反馈

Abstract

Feedback plays a crucial role in real life. Learning from the informative feedback, human being could master general skills and knowledge for adapting to the environment. As an important factor of feedback processing, feedback interval means the duration between initiation of behavior and the appearance of feedback stimulus. However, the prior research about how the feedback interval modulated feedback processing did not reach consistent viewpoint. Introduced both the behavioral and ERP studies about how feedback interval affects feedback processing, and analyzed the reasons for the results discrepancies among these studies. Finally, we propose the necessity to standardize the definition of feedback interval and the combination of the behavioral and electrophysiological methods in further research.

Keywords: feedback interval; feedback processing; feedback-related negativity; delayed feedback; immediate feedback

PDF (573KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

万楠, 朱树青, 贾世伟. 反馈间隔影响反馈加工:整合行为和电生理研究的视角. 心理科学进展, 2020, 28(2): 230-239 doi:10.3724/SP.J.1042.2020.00230

WAN Nan, ZHU Shuqing, JIA Shiwei. The effect of feedback interval on feedback processing: A perspective of integrating behavioral and electrophysiological researches. Advances in Psychological Science, 2020, 28(2): 230-239 doi:10.3724/SP.J.1042.2020.00230

反馈加工是心理学上的一个重要概念, 通过反馈加工人们可以习得知识和技能(Luft, 2014)。反馈加工包含任务要求、反馈和调整行为三个方面(Kulhavy & Stock, 1989; Mory, 2004)。具体来说, 当学习者面对一个学习任务时, 需要根据要求作出相应的行为反应。在接收到反馈后, 学习者将评估反馈信息, 并将反馈信息与自己的反应相联系。最后在后续的测试或学习过程中, 可以调整自己的行为, 达到学习任务的要求。在反馈加工过程中, 三个方面相互作用, 相互影响, 而反馈是这个过程中的一个重要组成部分。反馈可以被看作为启动一个过程的刺激(Mory, 2004), 也可以被概念化为一种能被感官觉察的行动的结果(Luft, 2014)。

在反馈加工过程中, 任何反馈方面的细微变化都会影响最终的学习效果, 例如学习任务的复杂程度(冯霞, 冯文锋, 冯成志, 2018), 反馈信息的类型(Pashler, Cepeda, Wixted, & Rohrer, 2005)和详细程度(Luft, 2014), 学习者对反馈结果的预期水平(Walsh & Anderson, 2012; Weismuller & Bellebaum, 2016), 反馈间隔的长短(Carpenter & Vul, 2011; Yin, Wang, Zhang, & Li, 2018)等。其中, 反馈间隔的长短对反馈加工过程的影响一直是研究者关注的问题。然而, 不论是在行为研究还是电生理研究中, 反馈间隔对反馈加工的影响目前都没有得出一致的结论。有些研究者认为延迟反馈会阻碍从反馈中获取信息进行学习(Opitz, Ferdinand, & Mecklinger, 2011; Yin et al., 2018); 有些研究者持相反的意见, 认为延迟反馈可以帮助保留原有的记忆, 从而提高后续测试的成绩(Butler, Karpicke, & Roediger, 2007; Smith & Kimball, 2010)。

在本文中, 我们列举了相关行为研究与电生理研究, 分析了研究结果出现不一致的原因。期望通过原因分析, 为将来对“反馈间隔影响反馈加工”这一问题的研究提供一些思路, 促进该方面的研究。

1 反馈间隔影响反馈加工的行为研究

反馈间隔影响反馈加工的行为研究已经进行了半个多世纪, 积累了丰富的研究成果。在行为研究中, 研究者使用的学习任务多样。而反馈加工过程中任务要求、反馈和后续的行为调整三个方面相互影响, 相互作用, 不同的任务会影响反馈加工和学习的效果。因此, 区分不同学习任务类型对于探讨反馈间隔对反馈加工的影响是有必要的。本节将行为研究中的学习任务分为三种:类别学习任务、事实信息学习任务以及动作技能学习任务, 分别探讨了不同学习任务中, 反馈间隔对反馈加工的影响。

1.1 反馈间隔影响类别学习

类别学习是有机体把环境中的事物分成各种类别, 并根据所形成的类别知识来采取相应的反应(刘志雅, 莫雷, 张娟, 2007)。在对类别学习的研究中, Ashby, Alfonso-Reese, Turken和Waldron (1998)设计了两种类别结构, 一种是基于规则的类别结构(Rule-based category structure), 一种是信息整合的类别结构(Information-integration category structure)。实验材料由空间频率和方向不同的光栅图组成, 基于规则的类别结构其分类规则只考虑空间频率或者方向一个维度, 而信息整合的类别结构其分类规则需考虑空间频率和方向两个维度的整合 (Maddox, Ashby, & Bohil, 2003; Maddox & Ashby, 2004; 张奇, 刘万伦, 2007; 孙海龙, 邢强, 2014)。

研究者认为, 对基于规则的类别结构和信息整合的类别结构的学习是由不同的系统调节的(Maddox et al., 2003; Maddox & Ashby, 2004; 孙海龙, 邢强, 2014)。基于规则的类别结构是由外显假设检验系统所控制的, 受工作记忆和执行注意的影响(刘志雅 等, 2007)。人们甚至可以在没有反馈情况下习得基于规则的类别结构(Ashby, Queller, & Berretty, 1999), 因此反馈间隔对基于规则的类别结构的学习没有影响(Maddox et al., 2003)。但信息整合的类别结构的学习是由一种由内隐系统所控制的, 受多巴胺调节的学习。由于多巴胺调节的学习要求刺激反应和反馈之间有紧密的连接, 因此延迟反馈会对信息整合的类别学习产生不利影响(Maddox et al., 2003; 孙海龙, 邢强, 2014)。

Maddox等人(2003)研究了反馈间隔对于基于规则的类别结构学习和信息整合的类别结构学习的影响。实验条件分为延迟反馈和立即反馈两种, 立即反馈组是在反应终止后500 ms给予反馈, 而延迟反馈组是在反应终止后2500 ms、5000 ms和10000 ms给予反馈。实验结果表明, 反馈间隔对基于规则的类别学习没有影响, 但却会对信息整合类别结构的学习产生不利影响。延迟反馈条件下信息整合类别结构的学习正确率显著低于立即反馈条件下。

由于信息整合的类别学习受多巴胺水平调节, 而多巴胺和钙浓度的峰值出现在反应后500 ms, 因此Worthy, Markman和Maddox (2013)认为, 反应后500 ms给与反馈, 学习效果应该是最好的。Worthy等人采用相同的光栅图实验材料, 将反馈间隔设置为0 ms、500 ms和1000 ms三种条件, 研究不同的反馈间隔对类别结构学习的影响。实验结果表明, 延迟反馈对基于规则的类别结构学习没有影响, 但是信息整合的类别结构的学习成绩, 500 ms的延迟要比0 ms和1000 ms的延迟条件更好。

邢强、王家慰和黄秀青(2018)通过天气预报任务研究反馈间隔对概率类别学习的影响。天气预报任务呈现给被试一些卡片, 每张卡片上有一个独特的几何图形, 要求被试根据卡片图形判断其属于“晴天”还是“雨天”。被试预测卡片代表晴天或雨天后, 间隔一段时间后进行反馈, 反馈间隔分为立即反馈(500 ms)和延迟反馈(5000 ms)两种。任务中的答案是由每张卡片已经被设置好的概率决定。完成该任务, 被试需同时使用外显和内隐系统进行学习, 但更倾向于内隐学习。实验结果发现立即反馈的学习效果优于延迟反馈, 延迟反馈不利于概率类别学习。

由此可见, 在类别学习的反馈加工中, 反馈间隔的作用是不同的。反馈间隔对外显假设检验系统所控制的学习过程没有影响, 但延长反馈间隔对内隐系统所控制的学习过程产生不利影响。

1.2 反馈间隔影响事实信息任务的学习

在事实信息学习的研究中, 研究者试图揭示学习的机制到底是强化正确反应(Smith & Kimball, 2010; Butler et al., 2007)还是纠正错误反应(Pashler et al., 2005), 这些研究同时也提供了反馈间隔对学习效果影响的结果。早期研究者假设反馈的作用是强化正确的反应, 因此认为反应和反馈之间的间隔越小, 越有利于强化已出现的正确行为, 信息的延迟会减弱反应与正确反馈之间的联系, 不利于学习。例如Saltzman (1951)采用“言语迷宫” (verbal maze)任务, Bourne (1957)采用概念识别任务探究延迟反馈对学习的影响。研究结果都发现延迟反馈将增加错误次数, 降低学习成绩。

随着研究的深入, 研究者发现延迟反馈也可以提高学习效果, 并认为延迟反馈的学习效果需要长时间后的测试才能显现出来。例如Butler等人(2007)发现延迟反馈对长时记忆具有积极的作用。实验材料选用了12篇文章, 从每篇文章中选取事实信息作为测试题目, 题目采用选择题的方式呈现, 每个题目由一个问题、一个正确答案和五个错误答案组成。立即反馈组是在完成多项选择后立即给出反馈, 而延迟反馈组是在完成多项选择一天后的第二次学习期间给予反馈。一周后, 被试进行最后的线索回忆测试。实验结果发现, 延迟反馈比立即反馈更有利于长时记忆, 且反馈间隔并不影响错误的纠正。该结果表明延迟反馈比立即反馈更有利于强化正确的反应。

同样, Smith和Kimball (2010)通过考查立即反馈和延迟反馈对事实信息学习的影响, 发现反馈的作用在于强化最初的正确反应。研究者选择76个事实信息作为实验材料, 将实验分为两个阶段:60分钟的学习阶段(学习+初次测试)和一周后同一时间30分钟的延时测试阶段。立即反馈组在初次测试后立即给予反馈, 延迟反馈组在初次测试8分钟后给予反馈。研究结果表明, 延迟反馈组在一周后的测试成绩要比立即反馈组更好, 并且相对于立即反馈, 延迟反馈增加了重复正确反应的概率。研究者认为对于正确反应后的延迟反馈, 反馈的作用是让被试间隔一段时间后再次学习, 因此有利于重复正确反应; 而错误反应后的延迟反馈, 其作用是减少错误反应与正确反应之间的竞争, 从而也有利于正确反应的重复(Kulhavy, 1977; Smith & Kimball, 2010; Butler et al., 2007)。

Pashler等人(2005)在研究外语学习的过程中发现, 当学习者作出错误回答后, 只有提供正确答案, 被试在测试中的成绩才能提高。当学习者做出正确回答时, 反馈形式对测试成绩的影响并不大。因此研究者认为反馈的功能是纠正错误。延迟反馈之所以会提高成绩是因为在延迟的时间间隔内, 错误反应往往会被遗忘, 从而减少了对从反馈中学习正确反应的干扰。而收到立即反馈的学习者, 由于他们的回答不正确, 就会受到错误反应的干扰(Guthrie, 1971)。

综上, 在事实信息学习研究中发现, 反馈间隔对学习效果的影响也不一致, 研究者试图从强化正确反应和纠正错误两个学习机制进行解释。此外, 反馈间隔的操作定义不统一, 也是导致研究结果之间不一致的重要原因(Smith & Kimball, 2010), 这一点在事实信息学习任务的研究中尤为突出。在教学研究中, 立即反馈被定义为在学生回答问题后立即给予答案, 延迟反馈被定义为在学生回答完几个额外的问题后再给予答案(Sinha & Glass, 2015)。在实际的操作过程中, 立即反馈和延迟反馈又被细分为许多的类型, 如立即反馈可以在每一次回答问题后、每一个模块结束时或每一次测试后立即给予答案, 延迟反馈也可以是延迟几秒、几小时、隔天或1周内给予答案。因此, 在以后的研究中, 统一反馈间隔的操作定义, 使之满足绝大多数研究的需求, 是一个必需要解决的问题。另外, 在延迟反馈过程中, 被试对答案的预期、好奇等都会对研究结果产生影响(Mullaney, Carpenter, Grotenhuis, & Burianek, 2014)。

1.3 反馈间隔影响动作技能学习

在早期对动作技能学习的研究中, 研究者认为延迟反馈会破坏结果与动作之间的连接, 从而影响对动作技能的学习, 因此认为立即给予反馈更有利于动作技能的学习(Salmoni, Schmidt, & Walter, 1984)。后来的研究发现, 动作技能的学习过程可随着学习时间的变化分为获得阶段、保持阶段及迁移阶段, 在不同的阶段设置延迟反馈对最终的学习效果有不同的影响(Lee, Swinnen, & Serrien, 1994; 金亚虹, 章建成, 孙耀华, 任杰, 2001)。此外, 动作技能的复杂程度也对学习效果有一定的影响(冯霞 等, 2018)。

金亚虹等人(2001)要求被试用瞄准器瞄准目标进行目标追踪, 随后给予立即反馈或延迟2000 ms的反馈, 并在实验后的第二天进行无反馈的保持测试, 第三天进行迁移测试, 探讨反馈间隔对动作技能学习的影响。研究结果发现, 在获得阶段, 立即提供反馈要比延迟2000 ms提供反馈更有利于提高追踪的准确性。但获得阶段延迟2000 ms给予反馈, 能够改进保持阶段的测试成绩; 迁移阶段中, 反馈间隔对动作技能的迁移没有影响。

在动作技能获得阶段, 冯霞等人(2018)做了进一步的研究, 测试了不同任务难度下反馈间隔对动作技能学习的影响。复杂任务为二维追踪运动任务, 被试需在电脑屏幕上追踪小球的运动轨迹, 反馈分为立即反馈或延迟4000 ms反馈, 结果表明, 反馈间隔对动作技能的学习没有影响。简单任务为操纵小球使其停止位置与目标位置接近, 反馈同样是立即提供或延迟4000 ms提供。结果发现立即反馈条件下学习效果好于延迟反馈条件下。因此, 在动作技能获得阶段, 任务难度能调节反馈间隔对动作技能学习的影响。在复杂任务中, 反馈间隔对动作技能的学习没有影响, 在简单任务中, 立即反馈有利于动作技能的获得。

1.4 小结

上面通过三种实验任务介绍了反馈间隔影响反馈加工的行为研究, 但研究结果很难达到一致, 下面尝试分析结果不一致的原因。

研究中使用的实验任务所属的记忆类型不一致。实验任务所属记忆类型不同可能是造成研究结果不一致的原因之一。如类别学习任务更多涉及到工作记忆(Maddox et al., 2003; Maddox & Ashby, 2004), 事实信息学习任务多涉及陈述性记忆(Butler et al., 2007; Mullaney et al., 2014), 动作技能任务多涉及程序性记忆(金亚虹 等, 2001)。在将来的研究中, 详细区分不同的实验任务所属的记忆类型, 并对更为精细的实验任务进行总结分析, 有利于研究反馈间隔影响反馈加工的认知机制。

反馈间隔的操作定义不一致。Smith (2007)认为在行为研究中, 反馈间隔大致可以分为4类:Item-by-item immediate (IBI-I) feedback (每个测试试次后立即提供反馈); Item-by-item delayed (IBI-D) feedback (每个测试试次后延迟提供反馈); End-of-test immediate (EOT-I) feedback (在所有测试项目完成之后立即提供反馈); End-of-test delayed (EOT-D) feedback (完成所有测试项目, 并间隔一段时间后提供反馈)。但这依然无法涵盖有关反馈间隔研究中的所有的实验任务。研究者根据自己的研究目的、研究任务等将立即反馈和延迟反馈进行定义, 通常延迟反馈是相对于立即反馈而言的。因此, 反馈间隔的操作定义不一致也是造成研究结果不统一的原因。

随着认知神经科学的兴起, 研究者开始探索反馈间隔影响反馈加工的神经生理机制。事件相关电位(event-related potential, ERP)研究发现的反馈相关负波(feedback related negativity, FRN)与反馈加工紧密相关, 下面详细介绍这个成分, 以及应用这个成分研究反馈间隔影响反馈加工方面取得的成果。

2 反馈间隔影响反馈加工的电生理研究

2.1 反馈相关负波介绍

对于反馈间隔影响反馈加工与学习这一研究问题, 事件相关电位技术有独特的优势, 因为这种技术有精确到毫秒的时间分辨率(Kim & Arble, 2019)。而在事件相关电位的众多成分中, FRN是用来研究反馈加工与学习最常见的成分(Luft, 2014)。

FRN是由反馈刺激诱发的一种脑电成分, 通常在反馈后250~350 ms达到峰值(Miltner, Braun, & Coles, 1997), 研究发现FRN对反馈效价敏感, 负性反馈诱发的FRN 显著负于正反馈引发的FRN (Gehring & Willoughby, 2002; Hajcak, Moser, Holroyd, & Simons, 2006; Walsh & Anderson, 2012; Sambrook & Goslin, 2015)。最近研究者认为, 正负反馈诱发的FRN波幅差异来自于正反馈诱发的更正的奖赏正波, 而不是负反馈诱发的更负的负成分(Proudfit, 2015)。此外, FRN也对预期违背敏感, 当实际结果与自身预测不匹配时, 不论是正反馈还是负反馈, 都会诱发FRN, FRN波幅大小与期望和反馈的不匹配程度有关(Oliveira, Mcdonal, & Goodman, 2007; Ferdinand, Mecklinger, Kray, & Gehring, 2012)。近年来学者通过研究反馈间隔对FRN波幅的影响, 来探讨反馈间隔影响反馈加工的脑机制(Foerde, Race, Verfaellie, & Shohamy, 2013; Foerde & Shohamy, 2011; Weinberg, Luhmann, Bress, & Hajcak, 2012; Weismuller & Bellebaum, 2016)。

以FRN为指标对反馈加工进行的研究大致可以分为两类, 反馈评估类和反馈学习类。反馈评估类研究中, 实验任务大多采用简单赌博任务。在赌博任务中, 正负性反馈的概率通常各为50%, 且随机呈现。也就是说被试的行为反应与反馈之间没有必然联系, 被试无法从反馈中学习到规律并调整之后的行为。因此, 被试的成绩不会逐渐提高。上述任务中, 参加者在实验中只停留在反馈评估阶段, 而没有进行学习。而与反馈评估类相比, 反馈学习类关注的不是反馈评估本身, 而是反馈评估之后, 根据反馈信息对下一次行为的调整(Luft, 2014)。反馈学习类任务中(例如概率学习任务), 任务可习得, 被试可以根据反馈逐渐提高行为表现。近年来, 一些研究开始关注反馈间隔对以上两类研究的影响, 下面分别介绍。

2.2 反馈间隔影响反馈评估的电生理研究

Weinberg等人(2012)较早通过FRN研究了延迟反馈对反馈评估的影响。研究采用赌博任务的变式, 反馈分为延迟1000 ms (短延迟)和6000 ms (长延迟)两种条件。结果表明, 在短延迟情况下, 输钱反馈比赢钱反馈引发更大的FRN, 但长延迟情况下赢钱和输钱反馈引发的FRN差异不显著。结果可能表明从做出反应到收到反馈之间设置延迟会干扰行为-结果联系的形成, 使得人们无法将行为与延迟几秒之后的结果联系起来, 也可能说明处理立即奖赏的系统与处理延迟奖赏的系统是不同的。

Wang, Chen, Lei和Li (2014)的研究得到不一样的研究结果。他们同样采用简单赌博任务, 不同的是在每个试次开始的时候, 被试做出选择之前出示五角星或三角形以提示延迟时间的长短, 600~1000 ms的延迟为短延迟, 4000~5000 ms的延迟为长延迟, 最后反馈笑脸或哭脸代表赢钱或输钱。研究发现长延迟和短延迟反馈条件下同样引发了FRN效应, 且FRN效应之间没有显著的差异。这表明, 等待时间的长短对被试的反应没有影响。以上两个实验中使用的程序和延迟间隔设定的不同可能是研究结果产生差异的原因(Weismuller & Bellebaum, 2016)。Wang等人(2014)的研究, 每个试次开始有对反馈延迟时间的提示, 这种提示让被试对反馈间隔有了心理预期, 降低了反馈间隔的效应。Holroyd, Krigolson, Baker, Lee和Gibson (2009)认为FRN反映了预期错误信号, 而预期错误信号是用来强化学习的, 因此应该在可习得的任务中研究反馈间隔影响反馈加工的FRN效应。但在上述两个实验中, 反馈结果是随机呈现的, 与被试的选择没有必然联系, 被试无法根据反馈信息找到规律进行学习(Peterburs, Kobza, & Bellebaum, 2016)。下面介绍在可习得的任务中, 反馈间隔影响反馈加工的电生理研究。

2.3 反馈间隔影响反馈学习的电生理研究

与反馈评估不同, 反馈学习指通过反馈结果进行学习, 进而调整下一试次的行为。反馈间隔影响反馈学习的研究多采用概率学习任务和配对关联学习任务。研究中通过调整反馈间隔, 观察学习效果和FRN效应的变化。

Peterburs等人(2016)Weinberg等人(2012)研究的基础上, 改进了实验, 用3种延迟时间下的概率学习任务, 研究了反馈间隔的逐步增加对反馈学习的影响。实验材料为6个日文字符, 每次呈现一个, 被试用左右两个按键做出选择, 选择后屏幕上与之相对应的按钮变为绿色, 经过短暂的延迟后, 给予对错反馈, 要求被试学习“刺激-反应-结果”之间的关联, 延迟时间有500 ms (短延迟)、3500 ms (中等延迟)和6500 ms (长延迟)三种。行为结果发现, 正确率不受反馈延迟时间的影响。但是, 随着反馈间隔的增加, FRN差异波波幅呈现线性下降, 即在短延迟条件下FRN差异波波幅最大, 在长延迟条件下FRN差异波波幅最小。

这一研究结果得到另一个研究的支持。2016年Weismuller和Bellebaum同样使用概率学习任务, 研究在延迟反馈情况下, FRN是否受主观报酬期望的影响。实验材料为5个日本字符, 每个字符有不同的赢钱概率, 每次同时呈现两个字符, 被试猜测并选择其中一个以获得更多的奖励, 随后经过一段时间的延迟, 给予赢钱或输钱的反馈。反馈间隔分为1000 ms (立即反馈)和7000 ms (延迟反馈)两种。在被试进行选择时, 屏幕上符号之间还显示从0到100%的标度, 要求被试在进行选择的同时评估主观报酬期望。结果发现随着不断地学习, 正确率提高, 第3、4、5组块的正确率要显著大于第1组块, 但反馈间隔长短没有对学习产生影响。脑电结果显示, 在立即反馈情况下FRN差异波波幅显著大于延迟反馈情况下。且不管是立即反馈, 还是延迟反馈, 在意外情况下的FRN差异波波幅要大于意料内情况下的。

除了概率学习任务外, Arbel, Hong, Baker和Holroyd (2017)通过配对关联学习任务, 也发现了立即反馈会比延迟反馈引发更大的FRN效应。任务是学习56个新意物体的名称(非单词)。材料分为四组, 每组由14个试次, 每个试次呈现给被试一个新意物体的图片和两个可能的名称(非单词)。被试通过按键选择新意物体的名称, 经过一段时间的延迟, 呈现正确或错误的反馈。四组中两组使用立即反馈(被试按键后500 ms给予反馈), 两组使用延迟反馈(被试按键后6500 ms给予反馈)。完成实验一天后进行一次后期测试, 测试不给予反馈。实验结果发现, 无论反馈间隔长短, 学习成绩都随着实验进程有了显著的提高, 反馈间隔对学习效果没有影响。此外, 相比于延迟反馈, 立即反馈引发更大的FRN效应。

上述研究中没有发现反馈间隔对学习效果的影响, 后来有研究发现随着延迟时间的增加, 学习效果下降。Opitz等人(2011)研究了立即反馈和延迟反馈对人工语法学习的影响。该研究使用人工语法学习任务, 实验材料是主动宾句子结构的长句。在学习阶段, 被试观察一些句子, 学习基本的语法规则; 在测试阶段呈现一些全新的句子, 其中一半句子符合语法规则, 另一半有语法错误, 让被试判断这些句子是否符合语法规则, 随后给予对错反馈。反馈分为立即反馈(0 ms)和延迟反馈(1000 ms)两种。结果发现, 相比于立即反馈(正确率82.6%), 延迟反馈(正确率68.3%)不利于人工语法规则的学习, 并且反馈间隔显著影响FRN效应和P300效应。

Yin等人(2018)使用时间估计任务研究延迟反馈对强化学习的影响。实验采用时间估计任务。被试在听觉信号后开始估计1000 ms的时间, 并按键确定, 随后给予反馈。反馈分为立即反馈和延迟反馈两种, 立即反馈是在反应后的600~1000 ms收到“√”或“×”的反馈, 在延迟反馈条件下, 被试在间隔5个试次后收到反馈。实验结果发现, 在立即反馈条件下, 被试在负反馈后能根据反馈调节自己的错误行为。在延迟反馈条件下没有出现这种根据错误调节行为的现象。此外, 延迟反馈条件下的FRN效应(用主成分分析法得到的FRN成分)明显小于立即反馈条件下的FRN效应。该研究表明, 在立即反馈条件下, 反馈促进了强化学习中正确答案的保留以及错误答案的调整, 而延迟反馈减少了结果与之前行为的联系, 从而有损于强化学习。

2.4 小结

第2节探讨了反馈间隔影响反馈加工的电生理研究。该小节将研究分为反馈评估类和反馈学习类, 同时关注反馈间隔对学习效果的影响, 以及反馈间隔对FRN波幅的影响。

在反馈间隔对学习效果影响的研究中, 延迟反馈对学习效果的影响受到多方面因素的调节。一是实验任务的设置。例如, 在概率学习任务中, 多数研究发现反馈间隔对学习没有影响(Weismuller & Bellebaum, 2016; Arbel et al., 2017)。研究者认为在概率学习任务中, 不同的刺激所对应的反馈类型的概率是一成不变的, 学习者很可能在第一个组块就已经学会了刺激-反应-结果之间的联系, 因此在后续组块中, 是否延迟给予反馈对结果没有影响(Peterburs et al., 2016)。但在Yin等人(2018)的研究中发现了延迟反馈对学习效果的影响, 原因可能是延迟反馈间隔设定为间隔5个试次后给予反馈, 延迟期间的5个试次相当于设置了干扰项, 阻碍了被试从反馈中学习, 从而影响结果。

二是在学习任务中, 工作记忆负荷不同。如Opitz等人(2011)的人工语法学习任务中, 被试需在延迟过程中同时记忆多个语法规则, 难度较大, 工作记忆负荷高, 因此短暂的延迟会损害人工语法的学习效果。而Weismuller和Bellebaum (2016)的研究中, 被试只需记忆两种刺激物的选择, 因而工作记忆负荷较小, 反馈间隔对学习效果没有太大的影响。

三是反馈间隔时间的设定。在电生理研究中, 有的研究将反馈间隔设置在一段范围内随机呈现(Wang et al., 2014), 有的研究者将反馈间隔设置为固定的时间间隔(Weinberg et al., 2012; Weismuller & Bellebaum, 2016)。此外, 对立即反馈和延迟反馈所涉及的具体标准也不一致, 如Arbel等人(2017)将立即反馈设定为500 ms, Weismuller和Bellebaum (2016)将立即反馈设置为1000 ms, 还有研究者将500 ms和1000 ms当做短延迟(Weinberg et al., 2012; Peterburs et al., 2016)。对延迟反馈的时间间隔设定也从6000 ms到7000 ms不等(Weinberg et al., 2012; Weismuller & Bellebaum, 2016; Arbel et al., 2017)。因而反馈间隔时间设定不一致, 也是造成结果不一致的原因之一。

在反馈间隔对FRN效应的影响方面, 研究结果也出现差异, 大部分研究认同延迟反馈会减小FRN效应(Weinberg et al., 2012; Weismuller & Bellebaum, 2016; Arbel et al., 2017), 少数研究发现反馈间隔对FRN效应没有影响(Wang et al., 2014)。结果出现差异的原因可能是实验中使用的任务和延迟间隔设定不同(Weismuller & Bellebaum, 2016)以及个体差异(Zhang, Lei, Yin, Li, & Li, 2018)。因此在将来的研究中, 可严格控制实验流程等因素, 探讨单纯反馈间隔时间对FRN效应的影响。

此外, 当反馈间隔对FRN效应具有影响时, 可能说明处理延迟奖赏的系统与处理立即奖赏的系统是分开的(Weinberg et al., 2012), 延迟反馈和立即反馈下FRN效应可能来自不同的反馈加工系统。在学习过程中, 处理立即反馈和延迟反馈分别属于纹状体和海马两个不同的神经机制(Foerde & Shohamy, 2011)。纹状体被认为支持基于反馈的学习, 以促进刺激反应之间的关联(Gabrieli, 1998), 而内侧颞叶中的海马可以跨时间绑定相关元素, 将时间或空间上不连续的经验元素联系在一起(Davachi, 2006; Staresina & Davachi, 2009), 为大脑在延迟反馈环境中学习提供了条件。当学习需要付出更多努力或包含相互冲突的信息时, 这些区域可能以一种协同的方式并行运行, 并且相互作用。随着等待时间的增加, 反馈处理中的纹状体活动逐渐减少, 并且更多地依赖海马进行陈述性记忆(Dickerson & Delgado, 2015; Foerde et al., 2013; Foerde & Shohamy, 2011)。

3 研究展望

在前文中, 我们围绕“反馈间隔影响反馈加工”这一问题, 介绍了行为和电生理两方面的研究。对行为研究的总结中, 我们将学习任务分为三种, 分别介绍了反馈间隔对学习效果的影响, 并对结果差异的原因进行分析。类别学习研究发现, 延长反馈间隔对外显学习没有影响, 但会降低内隐学习的效果(Maddox et al., 2003; Maddox & Ashby, 2004; 邢强 等, 2018)。当反馈间隔为500 ms时, 内隐学习效果最佳(Worthy et al., 2013)。事实信息学习多数研究发现, 相比于立即反馈, 延迟反馈有利于让被试在测试中表现更好(Butler et al., 2007; Smith & Kimball, 2010; Mullaney et al., 2014)。动作技能学习研究发现, 在动作技能获得阶段, 当实验任务简单时, 立即反馈的学习效果好于延迟反馈; 但任务复杂程度较高时, 反馈间隔对学习效果的影响不显著(冯霞 等, 2018)。在学习后的保持阶段, 延迟反馈反而更有利于动作技能的保持(金亚虹 等, 2001)。我们推测研究中实验任务所属的记忆类型不同, 以及反馈间隔的操作定义不一致可能导致研究结果的不一致。

在对电生理研究的介绍中, 我们以FRN为指标, 将实验任务分为了反馈评估和反馈学习两类。在反馈评估研究中, 相比于立即反馈, 延迟反馈条件下引发的FRN波幅更小(Weinberg et al., 2012), 但任务前的线索提示(Wang et al., 2014)或个体之间的差异(Zhang et al., 2018)可能会影响实验结果。在反馈学习研究中, 立即反馈引发的FRN波幅显著大于延迟反馈条件下的。行为结果表明, 反馈间隔对概率学习任务和关联配对学习任务的学习效果没有影响(Weismuller & Bellebaum, 2016; Arbel et al., 2017), 但是延迟反馈会损害强化学习和人工语法学习(Yin et al., 2018; Opitz et al., 2011)。结果的不一致可能是由实验任务的设置、工作记忆的负荷以及反馈间隔的设定等多方面的因素造成的。

基于以上因素, 在未来的研究中, 研究者需要规范反馈间隔的定义和操作方法, 以得到不同延迟时间的反馈间隔对反馈加工的影响。并且明确学习任务涉及的记忆类型, 以便更好地研究反馈间隔对不同类型的学习任务的影响。

对比行为研究和电生理研究, 我们认为两种研究所关注的加工阶段不一致和学习任务不同可能是造成两个领域无法直接对比的原因。在行为研究中, 研究者更多关注的是反馈间隔对学习效果的影响。而体现学习效果的测试, 可能在实验当天完成, 也可能在多天后进行记忆保持测试(Smith & Kimball, 2010), 通过被试在最后测试阶段的成绩, 来估测在学习阶段延迟反馈是否会影响学习(Butler et al., 2007; Mullaney et al., 2014)。但是在电生理研究中, 研究者更多关注的是反馈间隔对反馈评估本身的影响。目前研究者主要是通过反馈间隔对FRN波幅的影响, 研究反馈间隔对反馈评估的影响(Weinberg et al., 2012; Wang et al., 2014)。当然, 也有一些研究通过电生理手段, 研究反馈间隔对反馈学习的调节, 但是常见学习任务是时间估计任务和概率学习任务(Yin et al., 2018; Weismuller & Bellebaum, 2016; Peterburs et al., 2016)。电生理研究与行为研究用到的学习任务还有很大差异。

在将来的研究中, 研究者可以根据行为研究和电生理研究的侧重点, 整合两方面的研究。要用行为研究的成果, 指导电生理研究, 尤其是反馈间隔影响反馈学习的研究。例如行为研究中的关注点多为在学习阶段或练习阶段延迟提供反馈是否会对后期的测试阶段产生影响。在电生理研究中, 我们可以增加相应的测试阶段, 对比学习阶段不同反馈间隔条件下FRN波幅的大小与后期测试阶段正确率之间的关联, 研究FRN效应与学习之间的关系。同样地, 在行为研究中, Carpenter和Vul (2011)认为, 延迟间隔增加了被试对答案的好奇心, 将注意力集中于正确答案上, 或利用间隔时间思考答案的方方面面, 对其进一步的猜测, 从而促进了学习。因而在电生理研究中, 也应该考查注意资源投入程度对反馈评估的影响。

同时我们也要发挥电生理研究在揭示神经机制和认知时程方面的优势, 结合功能性磁共振成像、近红外成像等手段验证行为研究的结果, 进一步阐明反馈间隔影响反馈评估和学习的认知机制和神经机制。例如通过探究在不同学习阶段设置延迟反馈对学习的影响所对应的神经机制是否不同, 来验证或解释动作技能学习中的一些研究结果。也可以从划分不同记忆类型的学习任务入手, 探索不同反馈间隔影响学习的神经机制是否存有区别。

参考文献

冯霞, 冯文锋, 冯成志 . ( 2018).

反馈类型和反馈时间对动作技能获得的影响

心理科学, 41( 3), 533-539.

[本文引用: 4]

金亚虹, 章建成, 孙耀华, 任杰 . ( 2001).

延迟结果反馈对追踪任务技能学习的影响

心理科学, 24( 6), 739-740.

[本文引用: 4]

刘志雅, 莫雷, 张娟 . ( 2007).

基于规则的类别学习和信息整合的类别学习

心理科学, 30( 6), 1429-1432.

[本文引用: 2]

孙海龙, 邢强 . ( 2014).

反馈对知觉类别学习的影响及其认知神经生理机制

心理科学进展, 22( 1), 67-74.

[本文引用: 3]

邢强, 王家慰, 黄秀青 . ( 2018).

反馈时间、反馈类型和掩蔽类型对概率类别学习的影响

心理学探新, 38( 5), 26-32.

[本文引用: 2]

张奇, 刘万伦 . ( 2007).

类别学习多重系统理论的研究与展望

心理科学进展, 15( 1), 78-87.

[本文引用: 1]

Arbel, Y., Hong, L., Baker, T. E., & Holroyd, C. B . ( 2017).

It's all about timing: An electrophysiological examination of feedback-based learning with immediate and delayed feedback

Neuropsychologia, 99, 179-186.

[本文引用: 6]

Ashby, F. G., Alfonso-Reese, L. A., Turken, A. U., & Waldron, E. M . ( 1998).

A neuropsychological theory of multiple systems in category learning

Psychological Review, 105( 3), 442-481.

[本文引用: 1]

Ashby, F. G., Queller, S., & Berretty, P. M . ( 1999).

On the dominance of unidimensional rules in unsupervised categorization

Perception & Psychophysics, 61( 6), 1178-99.

[本文引用: 1]

Bourne, L. E . ( 1957).

Effects of delay of information feedback and task complexity on the identification of concepts

Journal of Experimental Psychology, 54( 3), 201-207.

[本文引用: 1]

Butler, A. C., Karpicke, J. D., & Roediger, H. L . ( 2007).

The effect of type and timing of feedback on learning from multiple-choice tests

Journal of Experimental Psychology: Applied, 13( 4), 273-281.

[本文引用: 7]

Carpenter, S. K., & Vul, E . ( 2011).

Delaying feedback by three seconds benefits retention of face-name pairs: The role of active anticipatory processing

Memory & Cognition, 39( 7), 1211-1221.

[本文引用: 2]

Davachi, L . ( 2006).

Item, context and relational episodic encoding in humans

Current Opinion in Neurobiology, 16( 6), 693-700.

[本文引用: 1]

Dickerson, K. C., & Delgado, M. R . ( 2015).

Contributions of the hippocampus to feedback learning

Cognitive Affective & Behavioral Neuroscience, 15( 4), 861-877.

[本文引用: 1]

Ferdinand, N. K., Mecklinger, A., Kray, J., & Gehring, W. J . ( 2012).

The processing of unexpected positive response outcomes in the mediofrontal cortex

Journal of Neuroscience, 32( 35), 12087-12092.

[本文引用: 1]

Foerde, K., Race, E., Verfaellie, M., & Shohamy, D . ( 2013).

A role for the medial temporal lobe in feedback-driven learning: Evidence from amnesia

Journal of Neuroscience, 33( 13), 5698-5704.

[本文引用: 2]

Foerde, K., & Shohamy, D . ( 2011).

Feedback timing modulates brain systems for learning in humans

Journal of Neuroscience, 31( 37), 13157-13167.

[本文引用: 3]

Gabrieli, J. D . ( 1998).

Cognitive neuroscience of human memory

Annual Review of Psychology, 49( 49), 87-115.

[本文引用: 1]

Gehring, W. J., & Willoughby, A. R . ( 2002).

The medial frontal cortex and the rapid processing of monetary gains and losses

Science, 295( 5563), 2279-2282.

[本文引用: 1]

Guthrie, J. T . ( 1971).

Feedback and sentence learning

Journal of Verbal Learning and Verbal Behavior, 10( 1), 23-28.

[本文引用: 1]

Hajcak, G., Moser, J. S., Holroyd, C. B., & Simons, R. F . ( 2006).

The feedback-related negativity reflects the binary evaluation of good versus bad outcomes

Biological Psychology, 71( 2), 148-154.

[本文引用: 1]

Holroyd, C. B., Krigolson, O. E., Baker, R., Lee, S., & Gibson, J . ( 2009).

When is an error not a prediction error? An electrophysiological investigation

Cognitive, Affective & Behavioral Neuroscience, 9( 1), 59-70.

[本文引用: 1]

Kim, S., & Arbel, Y . ( 2019).

Immediate and delayed auditory feedback in declarative learning: An examination of the feedback related event related potentials

Neuropsychologia, 129, 255-262.

[本文引用: 1]

Kulhavy, R. W . ( 1977).

Feedback in written instruction

Review of Educational Research, 47( 2), 211-232.

[本文引用: 1]

Kulhavy, R. W., & Stock, W. A . ( 1989).

Feedback in written instruction: The place of response certitude

Educational Psychology Review, 1( 4), 279-308.

[本文引用: 1]

Lee, T. D., Swinnen, S. P., & Serrien, D. J . ( 1994).

Cognitive effort and motor learning

Quest, 46( 3), 328-344.

[本文引用: 1]

Luft, C. D . ( 2014).

Learning from feedback: The neural mechanisms of feedback processing facilitating better performance

. Behavioural Brain Research, 261( 6), 356-368.

[本文引用: 5]

Maddox, W. T., & Ashby, F. G . ( 2004).

Dissociating explicit and procedural-learning based systems of perceptual category learning

Behavioral Processes, 66( 3), 309-332.

[本文引用: 4]

Maddox, W. T., Ashby, F. G., & Bohil, C. J . ( 2003).

Delayed feedback effects on rule-based and information-integration category learning

Journal of Experimental Psychology: Learning, Memory, and Cognition, 29( 4), 650-662.

[本文引用: 7]

Miltner, W. H., Braun, C. H., & Coles, M. G . ( 1997).

Event-related brain potentials following incorrect feedback in a time-estimation task: Evidence for a ‘‘generic’’ neural system for error detection

Journal of Cognitive Neuroscience, 9, 788-798.

[本文引用: 1]

Mory, E. H . ( 2004). Feedback research revisited. Mahwah, NJ, US: Lawrence Erlbaum Associates Publishers.

[本文引用: 2]

Mullaney, K. M., Carpenter, S. K., Grotenhuis, C., & Burianek, S . ( 2014).

Waiting for feedback helps if you want to know the answer: The role of curiosity in the delay-of-feedback benefit

Memory & Cognition, 42( 8), 1273-1284.

[本文引用: 4]

Oliveira, F. T., Mcdonald, J. J., & Goodman, D . ( 2007).

Performance monitoring in the anterior cingulate is not all error related: Expectancy deviation and the representation of action-outcome associations

Journal of Cognitive Neuroscience, 19, 1994-2004.

[本文引用: 1]

Opitz, B., Ferdinand, N. K., & Mecklinger, A . ( 2011).

Timing matters: The impact of immediate and delayed feedback on artificial language learning

Frontiers in Human Neuroscience, 5, 8.

[本文引用: 4]

Pashler, H., Cepeda, N. J., Wixted, J. T., & Rohrer, D . ( 2005).

When does feedback facilitate learning of words?

Journal of Experimental Psychology: Learning, Memory, and Cognition, 31( 1), 3-8.

[本文引用: 3]

Peterburs, J., Kobza, S., & Bellebaum, C . ( 2016).

Feedback delay gradually affects amplitude and valence specificity of the feedback-related negativity (FRN)

Psychophysiology, 53( 2), 209-215.

[本文引用: 5]

Proudfit, G. H . ( 2015).

The reward positivity: From basic research on reward to a biomarker for depression

Psychophysiology, 52( 4), 449-459.

[本文引用: 1]

Salmoni, A. W., Schmidt, R. A., & Walter, C. B . ( 1984).

Knowledge of results and motor learning: A review and critical reappraisal

Psychological Bulletin, 95( 3), 355-386.

[本文引用: 1]

Saltzman, I. J . ( 1951).

Delay of reward and human verbal learning

Journal of Experimental Psychology, 41( 6), 437-439.

[本文引用: 1]

Sambrook, T. D., & Goslin, J . ( 2015).

A neural reward prediction error revealed by a meta-analysis of ERPs using great grand averages

Psychological Bulletin, 141( 1), 213-235.

[本文引用: 1]

Sinha, N., & Glass, A. L . ( 2015).

Delayed, but not immediate, feedback after multiple-choice questions increases performance on a subsequent short-answer, but not multiple-choice, exam: Evidence for the dual-process theory of memory

The Journal of General Psychology, 142( 2), 118-134.

[本文引用: 1]

Smith, T. A . ( 2007).

Spacing and the delay-retention effect: An alternative explanation of the effects of feedback timing on semantic learning (Unpublished master’s thesis)

University of Texas at Arlington.

[本文引用: 1]

Smith, T. A., & Kimball, D. R . ( 2010).

Learning from feedback: Spacing and the delay-retention effect

Journal of Experimental Psychology: Learning, Memory, and Cognition, 36( 1), 80-95.

[本文引用: 7]

Staresina, B. P., & Davachi, L . ( 2009).

Mind the gap: Binding experiences across space and time in the human hippocampus

Neuron, 63( 2), 267-276.

[本文引用: 1]

Walsh, M. M., & Anderson, J. R . ( 2012).

Learning from experience: Event-related potential correlates of reward processing, neural adaptation, and behavioral choice

Neuroscience & Biobehavioral Reviews, 36( 8), 1870-1884.

[本文引用: 2]

Wang, J., Chen, J., Lei, Y., & Li, P . ( 2014).

P300, not feedback error-related negativity, manifests the waiting cost of receiving reward information

Neuroreport, 25( 13), 1044-1048.

[本文引用: 6]

Weinberg, A., Luhmann, C. C., Bress, J. N., & Hajcak, G . ( 2012).

Better late than never? The effect of feedback delay on ERP indices of reward processing

Cognitive Affective & Behavioral Neuroscience, 12( 4), 671-677.

[本文引用: 10]

Weismuller, B., & Bellebaum, C . ( 2016).

Expectancy affects the feedback-related negativity (FRN) for delayed feedback in probabilistic learning

Psychophysiology, 53( 11), 1739-1750.

[本文引用: 12]

Worthy, D. A., Markman, A. B., & Maddox, W. T . ( 2013).

Feedback and stimulus-offset timing effects in perceptual category learning

Brain and Cognition, 81( 2), 283-293.

[本文引用: 2]

Zhang, X., Lei, Y., Yin, H., Li, P., & Li, H . ( 2018).

Slow is also fast: Feedback delay affects anxiety and outcome evaluation

Frontiers in Human Neuroscience, 12, 20.

[本文引用: 2]

Yin, H., Wang, Y., Zhang, X., & Li, P . ( 2018).

Feedback delay impaired reinforcement learning: Principal components analysis of reward positivity

Neuroscience Letters, 685, 179-184.

[本文引用: 6]

/


版权所有 © 《心理科学进展》编辑部
地址:北京市朝阳区林萃路16号院 
邮编:100101 
电话:010-64850861 
E-mail:jinzhan@psych.ac.cn
备案编号:京ICP备10049795号-1 京公网安备110402500018号

本系统由北京玛格泰克科技发展有限公司设计开发