惩罚强化 黑脸红脸

惩罚强化 黑脸红脸

  • 文献黑话中的强化、惩罚

中文可以区分行为的「习」得与认知的「学」懂,但在英文中,学/习都是一个词—— Learn。英语国家心理学系 Learn打头的课程主要有这两种:Learning & CognitionLearning & Behavior。两种课程的干货重叠部分甚至多于不同部分。

如果想在术语中译对二者作出微妙的区分,可以考虑这么翻译:《学习与认知》;《行为与习得。后者有两处与直译有出入:词序交换、主动语态译为被动语态,其中或可窥见认知主义(Cognitivism) 与 行为主义 (Behaviorism) 的微妙分野。同一个动词 Learn,认知主义学派的研究旨趣在于主语「学习者内部认知能力与认知过程」;行为主义学派的研究旨趣在于宾语「被习得的行为」,最极端的行为主义者「观其行」而目中无人、无鼠、无狗、无鸽。


具体比如行为学应用最广泛的术语「强化/Reinforce」、「惩罚/Punish」,非专业的研究者想当然认为这两个动词的宾语是被试个体,其实专业文献行文总是刻意限定强化、惩罚的对象是行为的频率、而非行为的个体。比如「惩罚」,操作化定义为「降低个体特定行为频率的干预措施」,并没有任何字面上的褒贬意味。奶爸们可以体会一下两种措辞的差别:「惩罚吵闹的孩子」;「采取干预措施降低孩子的吵闹频率」。 Learning & Behavior 课程可以有这样一道习题——

如果关灯降低孩子的吵闹频率,行为习得的文献将表述为:
【A】关灯惩罚孩子;
【B】关灯惩罚吵闹;
【C】关灯不是惩罚。
  • 幼儿行为强化、惩罚

有一位选我课的同学在知乎提了这样一个好问题——「按照埃里克森心理发展观,0-2岁幼儿需要建立对外界的信任感,而斯金纳看来,矫正幼儿行为应该漠视,这是否不利于幼儿建立对外界的信任感?

我的回答是——

埃里克森的假说「0-2岁幼儿需要建立对外界的信任感」没有明确的操作化实证,没有说明什么时间周期多少次漠视啼哭儿童会有怎样后果;斯金纳学说有充分的实验证据和实践支持,有明确的短周期效果 (Wiki: Parent management training)。长周期的后果难检验,用研究法的黑话就是可证伪性比较差,所以埃里克森的假说在这个意义上难以证伪。

斯金纳的学说并不认为必须对婴儿的啼哭漠视,如果兼顾埃里克森假说的长周期后果,可以施以充分关怀的、安全的、但是仍然相对负面的刺激。比如,有三款奶瓶,婴儿喜欢程度可以测评出来(通常与奶嘴开口大小有关);有三款奶粉,婴儿对口味的喜欢程度也可以测评出来。在啼哭开始或加剧的时候「惩罚」,用婴儿最不喜欢的那款奶瓶和最不喜欢的那款奶粉。在啼哭中止或减退的时候「强化」,用婴儿最喜欢的那款奶瓶和最喜欢的那款奶粉。

我头像的熊孩子已经十岁了,他作错事比如撒谎、发脾气,我们尝试停供正餐替换为麦片牛奶水果,效果比直接体罚更好。娃以食为天。其中只有 麦片-正餐 一个因素,因为家里牛奶、水果日常已经敞开供给。说实话,麦片的味道真就是「味同爵蜡」,如果象美国孩子那样天天早餐吃麦片,这一招就未必有效。据说在美国家长用的是西兰花,因为他们的孩子更讨厌西兰花,家长们又普遍相(mí)信西兰花最有营养。于是美剧中娃吃西兰花都成了「家教好」的剧本语言。

  • 黑脸红脸与阻断 (Blocking) 效应

不少家长奖惩孩子的时候会分工,一个唱黑脸一个唱红脸。做错事的时候,那个讨厌的家伙也在就会受惩罚;做对事的时候,那个喜欢的家伙也在就会有奖励。家长希望孩子习得对错与奖惩的联结;孩子实际习得红脸黑脸与奖励惩罚的联结。虎妈猫爸的黑脸红脸削弱了强化与惩罚的效果,不过话说回来,也许家长发现察言观色的习得在某些学校更有用也未可知。


*《虎妈猫爸》是女儿。儿子估计剧本就写熊爸猫妈,不过我们家儿子是熊爸熊妈加熊姐

熟悉《行为与习得》教科书内容的读者应该发现,这个例子中的红脸黑脸并不是孩子发起的操作 (Operant) 行为,红脸黑脸与奖励惩罚的联结属于经典条件作用,不能归到操作条件作用。操作条件作用与经典条件作用的区别是很多行为学课程强调的重点,然而这个例子中,两类条件作用的共同之处比不同之处更值得强调。它们都是联结习得 (Associative Learning),与明白做对做错的认知学习 (Cognitive Learning) 相比,都不需要诉诸「快思慢想」中的「慢想」。

于是这个例子让我想起通常只在经典条件作用章节提及的阻断效应(Blocking Effect) 实验。如下图所示——

实验阶段 1:实验动物首先习得 灯亮(条件作用) 与 奶酪的联结。习得之后,即使只有灯亮没有奶酪,动物条件反射流口水;

实验阶段 2:灯亮+铃响 与 奶酪 同时呈现。学过经典条件作用但没有学过 Blocking Effect 的同学,可能会有一个悬念,动物能习得铃响与奶酪的联结么?

实验阶段 3:只有铃响没有灯亮,也没有奶酪,动物不流口水。对照组的动物没有第一阶段只有第二阶段,在第三阶段流口水。
最初的实验设计 (Kamin, 1969) 不是用奶酪而是用电击。在正式实验之前,两组动物都首先习得压杠杆中止电击。正式实验中,统计动物压杠杆的行为次数。可别以为电击不人道,巴甫洛夫的狗都是唾液腺上开了一刀才能接试管量口水。巴甫洛夫研究唾液的消化作用得了诺贝尔生理医学奖,这才有条件研究狗的口水偶然发现条件反射。
  • Blocking Effect vs. 2nd-Order Conditioning

行为学文献中有挺多彼此貌似冲突的实验结果。比如,时间上略迟于奶酪的灯亮是不是能让动物流口水,就有两种情况。如果两种结果只是因为实验设计的微妙出入,心理学家就得为可证伪性而头疼。Blocking Effect 也有一个写在教科书里的CP:次级条件作用 (Second-order Conditioning) ,说的是原先的条件刺激(灯亮)在习得条件反射之后在下一轮实验当作无条件刺激(奶酪)。如下图——


实验阶段 1:与 Blocking Effect 实验相同,动物习得条件反射(灯亮流口水)。

实验阶段 2:灯亮+铃响 同时呈现,但不呈现奶酪。动物流口水。

实验阶段 3:只有铃响没有灯亮,也没有奶酪,动物流口水。
两个实验的差别仅仅在于第二阶段有没有奶酪。推广到我们的操作条件作用例子,家长的奖惩 = 奶酪,红脸黑脸 = 灯亮,孩子的行为对错 = 铃响,这结论就真有点意外:如果家长总是在施加奖惩的同时唱红脸黑脸 (Blocking Effect Stage 1),在孩子新尝试的行为上家长唱红脸黑脸、同时施加奖惩 (Blocking Effect Stage 2),孩子习得红脸黑脸与奖惩的联结——学会了察言观色,新尝试的行为对错与奖励惩罚的联结反而被阻断 (Blocking Effect Stage 3)。如果家长在孩子行为对错的时候唱红脸黑脸,在现场就不应该再施加奖惩 (2nd-Order Conditioning Stage 2),这样反而有助于孩子习得行为对错与奖惩的联结。
  • 最近的一个悬念

Blocking Effect 在六十年代末就已确立,成为后续大量行为习得研究的基础,写入几乎每一本教科书。然而去年9月份 Journal of Experimental Psychology (General) 发了篇论文 (Maes & etal., 2016) 报告15 次重复 Blocking Effect 试验都没得到预期结果。是这届的实验动物不行了么?
「斯金纳的鸽子居然还写专栏」
还没有人赞赏,快来当第一个赞赏的人吧!
文章被以下专栏收录
4 条评论
推荐阅读