按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
有人可以预料以后会出现什么后果。我们已知增强物可以增强未来的行为,但无法预测处罚楚否能够导致行为改变。
妈妈抓住幼儿或用力打他的手(即使时间点抓得很准),这个作法是否保证他将来不会再度把东西插入插座呢?去问问任何一位家长,你就会明白现实情况往往是:家长把小东西收好,盖件墙上的插座或者用家具文件住插座。等幼儿长大,他们特别想这么做的冲动就会消失。
行为分析学者认为,增强或处罚都始一个由后果定义的'过程'。负增强物可以拿来进行有效训练,尽管使用厌恶刺激,训练过程仍可能相当无害。以下是个利用负增强训练骆马的好例子(感谢骆马专家吉姆·洛根'Jim Logan'提供此法)。骆马是种半驯化的动物,美国人把牠们当成宠物饲养,其它地区的人则饲养骆马群作为毛料来源。
骆马和马儿一样非常瞻怯害羞,除非自幼时常接触人类,否则人们很难靠近牠们,虽然利用食物增强的训练法对骆马效果极佳,但常牠们对人类过于惊惧而不敢接近取食时,这个方法也派不上用场,所以现今的骆马训练师作法是,利用响片作为讯号,告知骆马牠们的行为将获增强,但这时使用的初级增强物(或真正的增强物)是'移除负增强物(即厌恶刺激)'。
实际上,你等同对骆马说: “如果我走近到离你三十呎处,你可以保持站着不动吗?可以?很好,我按下响片就会转身离去。”、 “现在,如果我走到离你二十五呎处,你可以站着不动吗?可以? 很好,我按下响片就走。” 利用响片标定骆马站着不动的行为,并且利用'可怕人类的离开'作为增强物,有时在五平十分钟内即能靠近到能够触摸到牠的距离·骆马控制着整个局势,只要牠站着不动,牠就可以让人类走开! 所以牠继续站着不动。当人能摸了骆马几次之后才离开,这时便打破僵局了,这个人不再令牠感到害怕。现在饲料桶即可出场,沟通的对话转变为: “你站着不动时我可以摸模你吗?可以?按响片就赏你好吃的东西。” 这时骆马便进入获取'正增强物'的阶段,这些正增强物包括食物、搔痒和拍抚,而且牠正把站着不动的新行为做得很棒,而不是朝着别处逃命去。
利用离开(或好行为出现即不再施压)的作法就是所谓'通马语者'(horse whisper)常利用的训练技巧,训马者在围起来的区域内与自由奔跑的马匹互动,在相当短的时问内使马匹脱胎换骨:野生的马儿从惊怕逃窜变得能够冷静接纳人类,甚至容许马鞍及人类骑乘,这种整体性的转变可说非常神奇。使用这些技巧的训练者虽然都习惯以某个声音或动作作为标定讯号(或制约增强物),但很少人真正意识到自己这么做,反而常用迷信说法解释这种现象。其实这种现象一点都不神奇,全是运用'操作制约'的结果。
虽然负增强很有效,但请牢记:每次使用负增强时,同时也使用了处罚。当拉紧左边缰绳,在马儿转向左以前,向前直走的行为即不断受到处罚。而且滥用负增强和厌恶刺激也可能导致莫瑞·西德门(Murray Sidman)博士所谓的'附带作用',也就是因处罚引起的不良副作用(请见第四章)。
抓准增强物出现的时间点强化的时机 (p。39)
(Timing。of。Reinforcers。–。p。7)。
前述已提过,增强物必须和想改变的行为一起出现。增强物出现的时问点本身就是讯息,它告知学习者你喜欢的行为究竟是什么,当动物试图学习的当下,增强物想传达的讯息会比增强物本身更重要。运动员或舞者受训时,教练喊出'对!'或'很好!'可立即标定当下的正确动作,给予对方确实需要的讯息,若等到回到史衣室才进行事后检讨,则无法产生作用。
增强时机过晚是训练生手最大的问题。例如当狗儿坐下来,在主人说出'好乖!'时,牠正好又回到站姿,这么一来,到底哪个行为被'好乖!'增强呢?是站着的行为! 每当你发现训练出现问题时,第一个该问自己的问题便是增强时机是否太晚,如果你在训练某人或动物时忙得无法分心留意,这时请人帮忙观察,看看自己增强的时机是否太迟,将会大有帮助。
我们增强他人的时机往往太晚,“亲爱的,你昨晚看起来美极了!” 这句话的效果与当下实时赞美的差别很大,迟来的增强甚至可能有适得其反的效果 ('怎么,我现在难道不美吗?');然而对于为时已晚的补偿话,我们却常常寄以厚望。
过早给予增强也可能很没效率。美国布隆克斯动物园(Bronx Zoo)的管理员曾对大猩猩十分头疼,他们必须让牠进入户外栏舍才能打扫室内栏舍,但是牠考绌喜欢坐在进出口,力大无穷的牠可以挡住滑门,阻止门关上,当管理员把食物摆在户外或以香蕉诱引牠时,大猩猩不是不加理会就是抢了食物再赶在门关上前回去挡门。他们请了动物园里的一位训练师处理这个问题,这位训练师解释,'挥舞香蕉'及'丢入食物'是企图以'贿赂'来增强一个尚未发生的行为,但真正有效的解决办法是当大猩猩坐着挡门时不予理会,但是只要牠自己到户外时便给予食物奖励。问题就这么解决了!
家长有时也会误以为自己是鼓励小孩,事实上却太早给予增强('好孩子,就是这样,你“几乎”做对了!) , 因而可能增强了努力的行为,'努力'去做某事和'实际'做到某平是不同的,有时候小孩哭喊着「我做不到!」或许是事实,但是它也可能是努力行为受到过度增强的症状。一般而言,在行为出现前给予礼物、承诺、赞美或任何东西,完全无法增强这们行为,因为受到增强的是增强物出现当下的行为,也最可能是要求增强物的行为。
进行负增强训练的时机点也很重要。马儿学习到当左边缰绳拉紧时向左转,但是在牠左转后必须不再拉繁缰绳,这个停止拉扯的动作即为增强物。在上马后踢踢马腹,马匹往前走了,便不该再继续踢(除非你要牠跑快一点)。新手骑士常会不断踢马,彷佛得不断踩油门马儿才会跑,但对于马儿而言这个动作并不具讯息,因此马术学校里产生了“铁腹马”,无论骑马的人踢得多急,牠们仍以牛步行进。
同样反应也出现在常遭父母、老板或老师唠叨责骂的人,负增强物在期望结果达成时如果没有立刻消失,它将不会有增强作用,也不会传递任何讯息,唠叨责骂不但只成为名符其实的噪音,也是信息论(information theory)中谈到的'噪音'。
我观赏足球和棒球的电视转播赛时发现,球员被增强的时机点总是准确无误,这让我印象深刻。在球员跨过本垒达阵的同时,观众立即爆出欢呼声,而且一旦得分或确定输赢,仔细看看那些球员之问彼此热烈增强的动作。这对演员来说却相当不同,尤其是电影演员。即使是在舞台上演出,仍然得等到谢幕才能获得掌声,而电影演员除了偶尔从导演、摄影师或工作人员得到响应外,他们获得的增弦全都错过了时机,影迷信件和好的影评在数周或甚至好几个月后才会出现,这与洋基球场爆出轰天欢呼的情形比起来显得逊色无趣,他们工作起来可能特别缺乏成就感,即使有很不错的增强物,但获得的时机却总是「太迟」,也难怪常有一些明星近乎病态地喜欢谄媚奉承和追求刺激了。
增强物的大小 (p。42)
(Size。or。Reinforcer。–。p。10)。
刚关始利用食物来增强的训练新手常搞不清楚食物增强物应该多大,答案是尽可能越小越好,增强物越小,动物能越快吃掉它,不但可以减少训练者等待的时问,而且每次练习时还可以增加增强物的使用次数,不会让动物一下子就吃饱吃腻了。一九七九年,我担任华盛顿特区的国立动物园(National Zoological Park In Washington, D。C。)的顾问,教导动物园员工使用正增强技巧。在训练课程上有位管理员抱怨自己的猫熊训练进展得太慢,我认为这不寻常,像猫熊这种贪心又活跃的大型动物以食物作为增强应该很容易训练,在我观察过一回训练后发现,这位管理员虽然已缓俊塑造出猫熊的动作,但是问题出在她每次给予大熊猫的增强物竟是一整根胡萝卜,猫熊好整以暇地享受每根胡箩卜,在管理员宝贵的十五分钟训练时间里牠只得到了三次增强物(而且牠也难免吃腻胡萝卜了),如果改成每次只给一片胡萝卜的话,情况将好得多。
一般来说,一小口增强物就足以让动物保持兴趣,对鸡而言是一两粒玉米,对猫来说是半公分的小肉块,对大象则是半颗苹果,如果是特别喜爱的食物,份量共至可以更少,例如喂给马儿茶匙的谷子,美国国立动物园的管理员甚至只用葡萄干便训练北极熊做出许多有用的行为(例如依指令移动至另一个栏舍)。
训练的基本法则是,如果每天只训练一次,在满足每日给食份量的四分之一前,动物的训练反应都会很好,等训练结束后再给牠其余的份量。如果每天训练达到三至四次,你可以把平常份量分为约八十等份,每次训练用二十至三十份。八十份增强物似乎是任何动物维持学习兴趣的每日最高量(这或许是幻灯片匣是多只能放入八十张幻灯片的原因,因为每常讲师要求换第二个幻灯片匣时我总是会抱怨一下)。
行为的难易程度也与增强物的大小有关,我们在海洋生物世界的经验发现,要求鲸鱼表演笔直冲出水面二十二呎的高难度跳跃动作时,必须给予一条大青花鱼作为奖赏,如果只给平常增强用的两条小梭鱼,牠们会拒绝表演这个动作。
至于人类,增强物的大小虽然没有一定的定律,但是有时候工作越艰难,报酬将会越大,如果我们完成了艰难工作却未获得相对报酬时,我们肯定痛很不已。
意外的'大奖'(p。44)
(Jackpot。–。p。11)。
「大奖」(jackpots)是一个对动物或人类都极为有效的技巧。大奖是指非常大的增强物,万至可能比平常大上十倍,而且训练对象没料到它会出现。我曾在一家广告公司任职,公司除了有一般的圣诞派对,大案子结案或签下新客户时也会有非正式的庆祝活动,不过董事长还有个习惯,他每年总会举行两次突如其来的惊喜派对,可能是在某天下午三、四点时,他会阔步行经每个办公室,大喊着要大家停下工作、关上电话总机,接踵而至的是外烩服务人员、乐师、调酒员、香槟、熏鲑鱼和所有派对应有的东西。这些全为我们而来,而且没有特殊理由,这对五十名员工来说完全是出乎意外的大奖,我认为这对提升高昂的工作情绪有极大影响。
大奖也可以用来标定「突破性的意外进步」,以我认识的一名训马师为例,当年轻马儿首度完成一项困难动作时,他随即从马背跃下,除去马鞍和马勒,然后放牠在场地里任意奔跑 给予完全的自由便是一个大奖,而这么做似乎把新行为保留下来。
然而,遇到动物不听话、害怕或抗拒而完全不出现好行为时,偶尔给一次大奖也可能有效改善动物的反应。我们曾在海洋生物世界进行一些由美国海军资助的研究,作法是增强海豚的新反应,但不增强过去训练过的旧有行为,研究对象是一只极少出现新反应、名为'胡'的温驯海豚,如果牠出现反应却未获增