Free Will

日知录(4):启发式认知偏差

在不确定条件下,人类会采用一种启发式的思维方法,即根据以往(相同的或类似的甚至无关的)的经验来对当前情况进行判断。这是一种思考上的捷径,是解决问题的简单、笼统的策略,也称之为经验法则或拇指法则。

因为人类是认知的“吝啬鬼”,任性、懒惰。启发式推理会简化信息处理的过程。因此,当人们面对大量的信息和不确定性进行判断时,往往并不遵循贝叶斯法则,而是凭借直觉或者以往的经验进行判断。依赖“启发法”做出的决策带有不确定性,只能说可能是正确的结论,但如果所遗漏的因素和现象很重要,那么信息的缺损就会导致产生判断和估计上的严重偏差。

Kahneman和Tversky指出人们通常具有三种启发式推理方式:

  • 代表性启发法
  • 可得性启发法
  • 锚定与调整启发法

这三种方法既可以得出正确的推理结果,也有可能导致错误的结论。

一、代表性启发法

在使用启发法时,首先会考虑到借鉴要判断事件本身或事件的同类事件以往的经验即以往出现的结果,这种推理过程称之为代表性启发法。

  一般情况下,代表性是一个有用的启发法,但在分析以往经验,寻找规律或结果的概率分布的过程中,可能会产生严重的偏差,从而得到错误的启示,导致判断错误。

1.1 代表性启发法的定义

  1. 代表性会导致忽略样本大小。在分析事件特征或规律时,人们往往不能正确理解统计样本大小的意义,对总体进行统计的结果才是真正的结果,样本的数量愈接近真实的数量,统计的结果也就愈可信,样本愈小,与真实数量相差愈大,统计的结果愈不能反映真实的结果情况。代表性启发法是对同类事件以往所出现的各种结果进行统计分析,得到结果的概率分布,从而找出发生概率最大的结果即最可能发生的结果。 因此必须考察所有同类事件这个总体或者考察尽量多同类事件(大样本)但人们往往趋向于在很少的数据基础上很快地得出结论。
  2. 代表性会忽略判断的难易程度,即使面对的是一个复杂的难以判断的问题,也简单地去作出判断,或经常根据不规范的和与判断无关的描述轻易地作出判断,或经常会忽略掉不熟悉或是看不懂的信息,只凭自己能够理解和熟悉的信息去作出判断,这些忽略掉的信息可能对判断是关键的。   

代表性启发出现的背景

  • 没有时间认真思考某个问题
  • 负载信息过多以至于无法充分对其进行加工
  • 认为问题不十分重要以至于不必太过思虑
  • 缺乏做决策所需的可靠知识或者信息

1.2 Tom W 实验

1973年Kahneman及Tversky进行了一个名为“Tom W ”的著名实验,大概如下:给被试以下一段关于Tom W.的描述:“Tom W.智商很高,但是缺乏真正的创造力。他喜欢按部就班,把所有事情都安排得井然有序,写的文章无趣、呆板,但有时也会闪现一些俏皮的双关语和科学幻想。他很喜欢竞争,看起来不怎么关心别人的感情,也不喜欢和其他人交往。虽然以自我为中心,但也有很强的道德感。”

然后要被试估计,Tom W.最有可能是以下哪个专业的学生:企业管理,工程,教育,法律,图书,医学,社会学?想象一下如果你是其中一名被试,你会怎么回答。

结果,绝大多数被试都认为Tom W.最有可能是工程系学生。为什么呢?很有可能是因为Tom W.最像一个学工程学的学生。也就是说,对Tom W.的以上描述,与我们心目中一个理工科学生所应当具有的形象完全吻合(或者说代表了一个理工科学生的形象),所以我们认为Tom W.最有可能是工程系的学生。这就是典型的代表性启发式思维方式。当面对不确定的事件,我们往往根据其与过去经验的相似程度来进行判断或预测。说简单一点,就是基于(过去经验的)相似性来预测(当前事件的)可能性。到底个体A是否归属于群体B?如果个体A具有群体B的某些特征(具有相似性、代表性),则认为个体A归属于群体B。

如果我们在公共汽车上看到一个人鬼鬼祟祟,像个小偷,则我们会认为他就是一个小偷,并提高警惕性。有时相似性确实和可能性有关,因此这种判断是正确的,但有时则可能会因此忽略其它相关信息而做出错误的判断。

比如在Tom W.的实验当中,被试就完全忽略了学生在各个专业中的基础比率(base rate)。就算上述7个专业的学生都一样多,那么任何一个学生是工程系的学生的概率和他是其它任何一个专业的学生的概率是一样的,即1/7。根据另外一组被试对所有学生在各个专业中所占的比率的估计,学工程学的学生应该比学其他专业的学生要更少,即还占不到1/7。如果考虑到这一点,那么任意抽一个学生出来(比如Tom W.),他是学工程学的可能性应该是很低的。这种在判断时忽略基础比率而导致的谬误就是所谓的基础比率谬误(base rate fallacy) 。

再看另外一个问题 ,Linda,31岁,单身、坦率,活泼,她学的专业是哲学。当她还是个学生时,就非常关注歧视和社会公正的问题,并且参加过反核武的示威游行活动。(Linda is 31 years old, single, outspoken, and very bright. She majored in philosophy. As a student, she was deeply concerned with issues of discrimination and social justice, and also participated in anti-nuclear demonstrations.)问Linda更有可能是什么样的人?

  1. Linda是一个银行出纳员。
  2. Linda是一个崇尚女权主义的银行出纳员。

很多人都会选第二项。因为从对Linda描述更符合我们心目中女权主义者的形象(或者说代表了我们心目中女权主义者的形象),所以我们就更倾向于认为Linda是一个崇尚女权主义的银行出纳员。我们在这里就运用了启发式的判断,却没有注意到这样一个基本道理:两个独立的事件同时发生的概率不可能高于其中单个事件单独发生的概率,从而犯了一个所谓的结合谬误(conjunction falalcy)。Linda是崇尚女权主义的概率可能很高,Linda是一个银行出纳员的概率可能不高,但Linda同时既是银行出纳员又崇尚女权主义的概率就肯定低于前二者的概率了 。这个道理说出来很简单,大家心里都清楚,但一到实际中人们往往就不会运用。我们会犯这样一种错误的原因可能是因为对事件描述得越详尽,就越容易让我们产生联想,进而导致我们误以为事件越容易发生。

1.3 赌徒谬误

在运用代表性启发法进行判断时还有可能会导致赌徒谬误(gambler’s fallacy),也称为蒙地卡罗谬误(The Monte Carlo Fallacy ),主要来源于这样一个故事 :

1913年8月18日,在蒙地卡罗的一间赌场里的轮盘 游戏中,黑色不可思议的连续出现了十五次,人们开始近乎疯狂的冲着去押红色。当黑色连续出现了二十次以后,人们还进一步加大了他们的赌注,因为大家都认为在黑色连续出现了二十次以后再出现黑色的可能性已经不到百万分之一了。结果黑色是创纪录的连续出现了二十六次!这间赌场因此挣得盆缽满盈。

大家都有这种感觉:似乎黑色已经连续出现太多次,不可能再出现了。这种想法很普遍。比如玩抛硬币,我告诉你前面抛的五次结果都是“正”,要你猜一猜,下一次会出现哪一面?肯定很多人会倾向于“反”面。前面已经出现过那么多次“正”面了,不可能还是“正”吧?连续出现6次“正”面的概率太低了。又比如人们在买彩票的时候,一般都不会选择上一次中奖已经出现过的号码,不可能连续两次中奖都有同一个号码。其实这也是支撑赌徒一直赌下去的重要心理原素之一:我已经输了那么多次了,无论怎么样也应该会赢一次吧。

这其实也是一种启发式的思维模式。我们认为不可能连续出现6次“正”面或是极端的连续26次黑色,或者连续两次中奖号码都有同一个数字,因为抛硬币、赌博、彩票等事件是随机的,这样的概率实在是太低了,根本就不像是随机事件,一个随机事件怎么可能有这么多巧合?

但到底怎么样才叫“随机”?到底是“正反反正反正”还是”正正正正正正”更有可能出现?其实现实生活中随机事件看起来往往都不像是随机的,或者说随机事件并没有你想象的那么随机。所谓随机也就意味着事件与事件之间在统计学意义上是独立的(what makes a sequence random is that its members are statistically independent of each other),一件事情的发生在统计学意义上对另一件事情的发生没有任何影响。(the occurrence of one has no statistical effect upon the occurrence of the other)。随机事件是没有倾向性的,是不可预测的,是没有记忆功能的。因此,就算黑色已经连续出现了N次,下一次是红还是黑都是随机的,认为黑色不太可能再出现而疯狂的去押红色是没有道理的;不管“正”面已经连续出现了多少次,下一次的结果要不是正面就是反面,二者出现的概率都是50%。

但是竟然会出现连续26次黑色或者连续6次正面这种情况,还是让人难以接受。这是因为有时小样本不具有代表性,样本越小,与真实的数量相差越大,统计的结果越不能反映真实的情况。只有对总体进行统计的结果才是真正的结果,也就是说样本的数量越接近真实的数量,统计的结果也就越可信。如果只抛十次硬币,正反面出现的概率不一定是50%,什么情况都有可能发生,只有抛足够多次,才能得出正反面的概率是50%的结果。这提醒我们有时不要匆忙的作出判断或下结论,很有可能你看到的只不过是一个小样本。

二、可得性启发法

人们在什么情况下更愿意买地震保险?想象在汶川地震以前有位保险销售人员向你推销地震保险,相信你是打死都不会买。因为地震这个事情离你的生活实在是太遥远了,那是八竿子打不着的事情。但在发生汶川地震以后,情况就截然不同了,特别是你在电视上看到了地震的各种惨状以后,如果再有保险销售人员向你推销地震保险的话,你肯定会比以前更愿意掏钱。现在很多人去买房,总喜欢问这样一个问题:这房子能抗几级地震啊?如果我们仔细想想的话,人们的这种反应其实是非常可笑的,因为恰恰是因为刚刚发生过地震,所以在一段时间内再次发生的地震的可能性是很小很小的。那么为什么人们反而会在地震以后更愿意买地震保险呢?这就是可得性启发法(Availability heuristic)的影响。

很多时候我们做出判断是情绪性的、无意识的,非理性的。人们对于越容易想起来的事情(即在脑海中的印象更为深刻),会觉得越容易发生,这就是所谓的可得性启发,通过易得性来判断其可能性,即“人们倾向于根据客体或事件在知觉或记忆中的可得性程度来评估其相对频率,容易知觉到的或回想起的客体或事件被判定为更常出现 ”。比如我们在判断是否要买地震保险时,脑海中首先浮现到的就是不久前发生的地震以及我们在电视上目睹的各种惨状,于是就会觉得地震确实很可怕,并且似乎离我们很近或者说很有可能会发生在我们自己的身上,因此就更愿意购买地震保险了。

对于可得性启发经常被提及的一个实验是这样的,问:以字母k开头的英文单词和第三个字母是K的英文单词相比,二者谁更多?大多数人认为以字母k开头的英文单词更多。因为人们很容易就想到以字母k开头的英文单词,比如keep,kill,kitchen等,但要想起第三个字母是K的英文单词就有些困难了,于是人们就会认为以字母k开头的英文单词会更多。实际上,第三个字母是k的单词是以k字母开头的单词的3倍。

有时候可得性启发式是正确的,越容易回想起来的事情确实越有可能发生,因为不断重复(容易)发生的事情,自然更容易在我们的脑海中留下深刻的印象。但是我们不仅仅只会记住那些经常发生的事情,事实证明,我们更喜欢那些生动的、形象的、具有情绪感染力的事件。

大家都应该见过这张希望工程的宣传图片,相信许多人在看到这张照片以后,都会被深深的感动,可能本来没打算捐钱的结果也捐一点钱,本来打算只捐5块钱的结果捐了10块钱。我们通过这张图片,对贫困失学儿童有了更为直观的、生动的认识。

这就是所谓的一张图片胜过千言万语。不管我们是说帮助中国的失学儿童有多么多么的重要,还是说中国有多少多少的失学儿童并列举一堆统计数字,都不如一张具有视觉冲击力的图片更能打动我们的心。我们的行为很容易因此而受到影响——比如多捐一点钱,当然这是好的方面。(这也就是为什么在禁毒宣传或者交通安全宣传的时候总是喜欢摆一些恶心的照片出来)

此外,我们对自己亲身经历过的事情印象也会特别深刻。一个死于骑摩托车的亲戚比大量的统计数据更能影响你对摩托车的态度。结了婚的年轻人经常会为干家务的事情发生争吵,总认为自己干的家务活要比对方干得多。美国的心理学家做过这样一个调查,让妻子和丈夫各自评估自己所干的事占所有家务的比例,然后将两人的比例加起来,结果总是超过100%。这其实很好理解,这一方面是因为自利归因,另一方面也是因为自己干的家务活自己总是能记住,所以就总觉得自己干的要比对方多。

可得性启发会导致我们做出错误的决策。因为受可得性启发的影响,我们做出判断决策时,依据的可能就仅仅是一些经过我们头脑选择过的、印象最为深刻的例子。正如道金斯在《自私的基因》里说到的:经过选择的例子对于任何有价值的概括从来就不是重要的证据(Chosen examples are never serious evidence for any worthwhile generalization.)。因为例子永远都只能是一个例子,不具有任何的代表性。如果你遇到一个河南人把你的钱都骗光了,你能因此而得出结论说所有的河南人都是骗子,都是不可靠的吗?如果你不是遇到一个河南人如此,而是十个、一百个河南人都如此呢?那么也仅仅说明这十个、一百个河南人是不可靠的,但不能说所有河南人都是不可靠。

此外我们在举例时很容易忽略那些与我们已有观念不一致的信息,从而导致所谓的证实性偏差。塔布勒在《黑天鹅》中把过度举例称为“无知的经验主义”。想象一只火鸡,每天都被喂得饱饱的,每次的喂食都使它更加相信生命的一般法则在于每天得到“为他的最大利益着想”的友善人类的喂食。日子一天天的过去,它的信心也越来越充足。但感恩节也是一天天的临近,它被屠杀的危险也越来越大。当危险最大时它的安全感却达到了最大值。直到感恩节的前一天,它才真正的明白过来,它过去获得的知识和经验都是无关痛痒的甚至是虚假的。在某种程度上,我们所有人都是这只火鸡。

所以例子不应该作为论据来使用的。那么有人会说,你这篇文章里不就通篇都是例子吗?例子在这里只能是为了把更好的把一个道理解释清楚、使人更容易理解。也就是说我们应该用例子来阐释说明而非证明。但现实恰恰是人们很喜欢用例子来证明自己的观点——特别是那些最容易想到的例子。

比如有一次你乘坐A航空公司的航班,结果A航空公司把你的行李给弄丢了,你火冒三丈,觉得A公司的服务怎么这么差,以后再也不要坐这间公司的航班了。这其实和河南人的例子差不多,一次不愉快的经历可能只是一宗个案,并不具有任何代表性。

但有的人就会认为,保障乘客的行李安全是航空运输的最基本要求之一,如果连这一点都做不到的话,那么我们还有什么理由来相信它,就算是个案,这样的事情只要经历一次就足够了,难道还要再丢一次行李吗!这种想法是可以理解的,但却是没有道理的。在某种程度上,错误其实是不可避免的。管理学上有所谓的六西格玛质量管理法,我总是很怀疑这是否能够真的做到。就算是DNA复制这种高度精确的事件,都会不可避免的出现偏差(这正是进化的源泉之一),更何况人为的事件?因此,航空公司把乘客的行李弄丢其实是一个不可避免的错误,只是很不幸碰巧被你遇上了。这是一个负面的影响,导致你对整体产生了负面的认识。但是想象如果是一件正面的事件,比如你买彩票,一不小心中了五百万,那么你会如何认识中奖这样一件事情呢?难道你会因此而觉得彩票中奖是很容易,或者别人也应该中奖,或者你以后会更容易中奖吗?

当然我不是说航空公司把你行李弄丢是和中彩票一样的低概率事件,或者说是可以原谅的。而是要看到,不能仅仅因为一次丢失行李的不愉快的经历而对该公司的服务水平完全否定。如果真的要想知道A公司的服务水平到底怎么样?我们就需要调查不同航线准时到达率和行李丢失率的统计数据。只有统计数据才能相对真实的反映出客观情况。(这也让我想到了所谓的一票否决制,某些领导如果在某些事情上没有达标或者出了什么问题,那么就一概否决,这是不够科学的。没有被否决可能仅仅是运气好罢了。)

在现代传媒的作用下,可得性启发对人们判断决策的影响更加的大。因为媒体为了追求收视率,吸引眼球,总是喜欢过度报道一些特别的事件。正如人们戏言:狗咬人不是新闻,人咬狗才是新闻。但是如果你看电视看的太多并且懒得去想的话,那么你就会很容易认为满大街的人都在咬狗。比如人们总认为坐飞机很危险,事实上大量的统计数据表明,飞机并不会比坐汽车更危险,但为什么人们会有这样一种错误的判断?很大程度上是因为飞机失事更有新闻价值。如果是一宗普通的交通事故,媒体就不会有太多的报道,但如果是一架飞机坠毁了,那么媒体必定是连篇累牍的大肆报道。结果这些事情在人们的脑海里留下了极其深刻的印象,当我们需要作出判断时脑海中首先浮现的就是这些飞机失事的场景,因此就会得出结论:飞机非常的危险。当然人么更害怕坐飞机也有其他方面的原因,比如人类的生物本能,人们对于自己不能控制的事物的恐惧等等。

《魔鬼经济学》里有一个例子:假设有个一个8岁大的叫莫莉的孩子,她有两个最好的朋友,一个叫艾米,一个叫伊玛尼,两个朋友都住在附近。莫莉的父母知道艾米的家里放着一把枪,于是他们不许莫莉到艾米家玩。所以莫莉就经常跑到伊玛尼家玩,伊玛尼家的后院有个游泳池。莫莉的父母觉得自己的做法上是在保护莫莉,这样做是对的。

可根据统计资料显示,这种做法一点都不明智。平均来说,美国每1.1万个家庭游泳池就能溺死一个孩子。美国一共有600万个这样的游泳池,这也就是说,每年将近有550个不到10岁的孩子是溺死在游泳池里。相比之下,在美国,每100多万支枪才会杀死一个孩子。据估计,美国一共有2亿支枪,这就是说美国平均每年死于枪口下的孩子数量大约为175名。所以对于美国孩子来说,他们死于游泳池里的概率(1:11000)要远远大于死于枪口的概率(1:1000000):也就是说莫莉在伊玛尼家的危险程度是在艾米家的100倍。

问题就在于为什么莫莉的父母会觉得枪会比游泳池更危险?这和人们对飞机的态度的原因是一样的。媒体更愿意报道一名丧心病狂的家伙开枪打死一名孩子而不是一名孩子在游泳池里淹死。各种奇闻异事更容易在人们的脑海中留下深刻的印象。因此在某种程度上我们对世界的认识是扭曲的,我们的身边充斥着各路媒体和大量信息,我们以为自己很清楚自己在想什么,实际上我们的世界观价值观已被他人所左右。从这个角度来看,信息越多误差越大。

我们如何摆脱可得性启发带来的偏差?这其实是不可能的,因为启发法是一种无意识的思维,也就意味着有时候我们连自己已经运用了启发法都不知道,更别说避免其错误了。但如果我们对启发法有更深入的了解,那么还是有助于我们减少在这一方面的错误的。感觉往往是不可靠的,不要轻易的下结论。当我们做出判断或得出一个结论时,必须要问自己:我的依据(论据)是什么?这些依据是否足以支撑我的判断?我们对那些感人或者骇人的一切生动的故事都必须保持足够的警惕,不要被我们的情绪所主宰,要更加注重统计数据,很多时候只有统计数据才能相对真实的反映出客观情况。

三、锚定与调整启发法

这是一个地球人都知道的故事。一条巷子里有两家卖粥的小店。左边一个,右边一个,两家店的生意都很好,每天都是顾客盈门。可是,晚上盘点的时候,左边这个店总是比右边那个店每天多赚两三百块钱,而且每天都是这样,让人心生不解。

细心的人终于发现了其中的秘密。如果你走进右边那个粥店,服务员微笑着把你迎进去,给你盛好一碗粥,热情地问你:“您好!加不加鸡蛋?”一般情况下,喜欢吃鸡蛋的人,就会说加一个吧!于是服务员就会拿来一个鸡蛋;不喜欢吃鸡蛋的人,就会说不加,喝完粥结了帐就走了。可是,如果你走进左边那个粥店,服务员同样也是微笑着把你迎进去,给你盛好一碗粥,然后热情地问你:“您好!加一个鸡蛋还是加两个鸡蛋?”一般情况下,喜欢吃鸡蛋的人,就会说加两个;不喜欢吃鸡蛋的人,就会说加一个。就这样,一天下来,左边的这个粥店比右边的那个粥店每天要多卖出很多个鸡蛋,这就是它每天多出多出两三百块的原因。

大凡讲这个故事的人,都是在讲左边那家粥店的生意经。其实,粥店的生意经里蕴含着十分深刻的心理学道理。左边的那个粥店其实是在运用心理学中的锚定法,诱导消费者在不经意间做出有利于店家的选择。如果你是它的顾客,你的决策则是受到了心理锚定效应的影响,你不自觉地在粥店设定的条件下进行了决策选择。
  
也许,多吃一个鸡蛋并没有什么大的问题,但是,如果在商业交易或谈判中,你多付出了10万或者100万,可能就是一个大问题,或者说是一个大损失。左边小店的服务员把顾客“锚定”在“加几个鸡蛋”上,而右边小店的服务员则把顾客“锚定”在“要不要加鸡蛋”上。在前一种情况下,顾客是在“加一个鸡蛋还是加两个鸡蛋”上进行选择或调整,而后一种情况下,顾客是在“加不加鸡蛋”上进行选择或调整,顾客有限的理性使很多的顾客没有充分地调整,使两个小店的生意大相径庭。

心理学家曾经运用一个随机转盘对人们进行测试。当转盘的指针停留在65%这个刻度时,要求被试回答:非洲国家的数量在联合国国家总数中,所占的百分比是大于65%还是小于65%?对于这个常识性的问题,大部分被试都会回答小于65%。实验者接着又问:“具体的比例是多少?”多数被试回答45%左右。

接下来,研究者又对一些从来没有参加这类测试活动的人进行了测试。当转盘的指针指向10%的时候,要求被试回答:非洲国家的数量在联合国国家总数中,所占的百分比是大于10%还是小于10%?

这也是一个常识性的问题,大部分被试会回答大于10%。实验者接着又问:“具体的比例是多少?”多数被试回答在25%左右。所有的被试都知道,转盘的数字是随机出现的,但是,他们的回答却明显地受到转盘先前给出的数字的影响——即使这些数字是无关的。也就是说,被试的答案被“锚定”在先前给出的无关数字上了。

外出旅游的时候,你看中了一件标价为3000元的紫砂壶,但你对紫砂壶的情况又不是很了解,结果你动用了所有的智慧与店主讨价还价,最终以 1500元成交,你感到很满意。因为,你花了1500元的价钱买了3000元的东西,而不是花了4000元的价钱买了3000元的东西。店主也很高兴,因为他把价值500元的东西随意标成了3000元,而店主的这个前置标价,对于你来说就是一种“锚定”,他让你始终围绕着这个似乎是随机的数字3000元来思维,这也就是为什么商家在一开始就标价很高的原因,因为,这种方法能够实现“双赢”:商家赚了钱,顾客“捡了便宜”。

这些现象也会出现在商业谈判之中,在信息不对称的情况下,你可能会“锚定”谈判对手,也可能会被对方所“锚定”。有一种十分简单的方法就可以打破这种思维锚定,那就是货比三家,充分地了解标的物的相关信息。

Kahneman和Tversky认为,无论是初出茅庐的新手,还是经验丰富的决策者,在面对复杂和模糊的问题时,经常会发生启发式认知偏差,只是偏差的几率、幅度大小不同而已。



应统联盟


连接十万名应统专业同学


阿药算法


打通算法面试任督二脉