斯金纳的操作性条件反射理论有四个不好理解的概念:
①正强化、②负强化;
③正惩罚、④负惩罚。
四个概念看起来两两对称,一正对一负。
通常,概念的负值代表与正值相反的概念。比如,“正增长”代表增加,“负增长”则代表“减少”。
但斯金纳的“正强化”和“负强化”却不是这样,初学者看了经常会一头雾水。
他没有像通常那样用“正强化”的反面来定义“负强化”,比如把“负强化”定义成“弱化”,而是把与“正强化”相对立的强化物定义为“负强化”。
举例,“正强化”对应的强化物是“奖赏”,“负强化”对应的强化物是“惩罚”,与“奖赏”相对立。
这样,“正负”在字面上与“强化”就没有直接关系了,这是造成理解困难的原因。
为什么斯金纳会这样定义概念呢?
这与他所做的实验有关。他先是训练老鼠通过按压杠杆来得到食物(奖赏)。老鼠多按杠杆,就能多得食物。他发现老鼠非常喜欢按杠杆,反复不停。于是把这种通过给予奖励使行为增加的现象为“正强化”。
然后他又做了一个反面的实验,对老鼠进行电击,显然这是一种惩罚行为。他设计了一个机关,如果老鼠按杠杆,就能够断开电源,让电击停止。经过训练后,老鼠同样在那里反复按杠杆。斯金纳把此类通过减少惩罚而使行为增加的现象定义为“负强化”。
这两种现象有一个共同点,老鼠按压杠杆的行为都增加了。斯金纳只关心能否让行为增加,只要行为增加了就称为“强化”,即使是“负强化”也是行为增加。
那么,我们怎样轻松区分并记住这四个概念呢?
记住16个字就可以了。
先把四个概念分为两组:
①和④一组,②和③一组,如下图所示:
请点击输入图片描述(最多18字)
第一组例子(8个字):
①正强化:“上班给薪”,
④负惩罚:“迟到扣钱”。
第二组例子(8个字):
②负强化:“坦白从宽”,
③正惩罚:“抗拒从严”。
如果不想把顺序搞乱,按照“正强化,负强化,正惩罚,负惩罚”的正常顺序,
这16个字的排列是:
上班给薪,(行为增加好处,学会进取)
坦白从宽,(行为减少坏处,学会逃避)
抗拒从严,(行为增加坏处,学会抑制)
迟到扣钱。(行为减少好处,学会改错)
前两句让事情变好了,后两句把事情搞坏了。死记住这16个字就行。
解释:
①正强化:
给出一个愉快刺激,从而增加其行为出现的概率。让我们学会“进取”。
“给薪”是愉快刺激,从而增加“上班”的概率。
②负强化:
撤销一个厌恶刺激,从而增加其行为出现的概率。让我们学会“逃避”或“避免”。
本应受到严厉刑罚,而坦白可以减轻量刑(从宽),从而增加坦白的概率。
③正惩罚:
给出一个厌恶刺激,从而降低其行为出现的概率。让我们学会“抑制”或“禁止”。
“从严”是增加量刑,从而降低抗拒行为的概率。
④负惩罚:
撤销一个愉快刺激,从而降低其行为出现的概率。让我们学会“改错”。
“扣钱”是撤销一个愉快的刺激(钱),从而降低“迟到”的概率。
最后讲讲
⑤“消退”
消退是指原本建立起来的强化行为,后来又不给了。导致已建立的强化行为又慢慢消失掉。
比如,参加某个活动“有奖”,于是我每次必去。
但后来不给奖了,所以,我也不想去了。我去参加活动的行为“消退”了。
这样是不是简单又好记?喜欢就点个赞再走吧。
————分割线————
◆如果你点赞,我会越写越带劲,这是对我写作动力的“正强化”。
◆如果你不点赞,我会越来越不想写,这是写作动力的“消退”。
◆如果你发评论骂我,我再也不敢写了。这是对我写作的“正惩罚”。
◆如果我努力提高写作质量,骂我的人变少了,我会更努力多写高质量文章,避免挨骂。这是“负强化”。
◆如果我为提高质量费了大量时间,发文量降低,导致点赞量下降,我会觉得提高质量费力不讨好,又不想写了。这是“负惩罚”。
你觉得这些例子对吗?
评论区留言告诉我。