你知道智商是什么吗?

如果说有哪个心理学术语是被最广泛地误解的,我会投票给“智商”。

智商这个概念,在中国几乎已经成了普通词汇,但大多数人都没有正确地理解什么是智商,只是把它当作“聪明程度”的近义词来使用。

在这篇文章中,我会通过一系列问题,来科学地解释一下,什么是智商。

心理学家为什么要发明智商测验?

在心理学家们发明“智商”这个理论术语之前,人们也有描述类似现象的日常词汇,在汉语里,有“聪明”,“灵敏”,“天赋异禀”,“愚蠢”,“呆板”,“笨拙”等词汇。

这些日常用语很模糊,没有精确含义,无法具体形容一个人的聪明程度或者愚蠢程度。由于没有量化的表达方式,所以心理学家们对此表示很不满意。

心理学家想要发明一套标准化的智商测验,用具体的数字来丈量一个人的聪明程度或愚蠢程度。

之所以叫做智商(intelligence quotient),是因为它是被除数除以除数所得的商。以前用的是心理年龄除以生理年龄再乘100,一个孩子的心理年龄是7岁,生理年龄是6岁,那么智商就是117。

现在已经不再用这么粗陋的算法了,而是用正态分布来计算离差智商。定义一群同龄人的平均智商是100,标准差是15。68%的人的智商在85到115之间,95%的人的智商在70到130之间。智商145的人几乎比99.9%的同龄人要高,智商55的人比99.9%的同龄人要低。

这样的标准化智商测验,成功发明出来了吗?

不完美的智商测验,100多年前就已经发明出来了,随着100多年来的改进,今天已经有很多种大规模应用的标准化智商测验。比如,斯坦福—比奈量表韦氏智力测验瑞文智力测验,等等。

完美的智商测验,还没有发明成功,而且很可能永远也发明不成功。因为智力和身高不同,它本身无法客观衡量,只能通过发明心理量表来估测。既然说是估测,那就必然会有误差。

但也不一定,也许再过几十年或者几百年,随着科学和技术的发展,人类可以通过某种神经测量手段,客观地测量一个人的智力程度。当然,这种说法偏科幻,大家不要有什么期望。

这种标准化的智商测验有什么用处?

可以用在科研上,应用范围非常广,就不多介绍了。

可以用在教育上,将不同智力的学生区分为不同的小组,进行分组教学,实现因材施教。

可以用在医疗上,为一些智力缺陷者(唐氏综合症、笨丙酮尿症等等)进行辅助诊断。

可以用在军队中,将已有的智力太低的士兵开除,或者拒绝智力太低的士兵入伍,以免在前线战斗上误伤友军。

可以用在社交上,一些高智商俱乐部(门萨俱乐部、三九俱乐部等等)使用智商测试作为入会门槛,方便俱乐部成员进行社交。

可以用在社会工程上,一个国家的独裁者可以强制实施优生学政策,将智力低下者进行绝育手术,以提高一国之国民的平均智力。这种方式的缺陷就是见效很慢(需要一两代人的时间),测验误差的后果也很严重,而且违背当今的人道主义精神,会面临国际上的严重批评。

可以用在公司招聘中,公司可以依据应聘者的智商分数,决定录用或者不录用,或者录用后的岗位安排。我曾帮朋友做过阿里巴巴公司的校招笔试(在计算机上在线做,挡住摄像头就行了),其中有部分题目是逻辑推理题,是智商测验中的常用题目。

总之,只要用得好,那标准化的智商测验,用处就很大。但难点就在于,智商测验很难用好。

为什么说智商测验很难用好?

小明出生于2010年,2017年时是7岁,他花了50分钟,做了一套40道题目的智商测验,答对了34道题目。现在问,小明的智商是多少?

小强出生于1980年,2017年是37岁,他花了200分钟,做了一套120道题目的智商测试,答对了82道题目。现在问,小强的智商是多少?

正确答案是,不知道。因为我们不知道应该拿什么样的一群人和小明与小强做对比。

假设小明是中国人,那么理论上,我们可以用同样的这套40道题目的智商测试,去找10万个同样是2010年出生的中国孩子,给他们也测量一下。如果这10万个人的平均分数是34分,那么这就说明小明的智商是100,也就是平均值。

如果这10万个人的平均分是20分,而标准差是5分,那么就说明小明的智力比平均值高出大约3个标准差,大概比98%的同龄人要高。

如果这10万个人的平均分是20分,而标准差是1分,那么内行人一眼就能看出这套测试设计得很烂,需要重新设计。小明的分数没有任何意义,需要另外找一套智商测验,重新测试。

那10万个人的分数,就叫做常模。现在的实际情况是,大多数时候,我们没有足够好的常模。当初建立常模时,数据量可能不够多。哪怕数据量足够多,也可能有些过时,没有2010年版本的,只有1950年版本的。

之所以如此,是因为建立足够好的常模并且不断更新,需要很多钱。测试题本身的修订和完善,也需要很多钱。一般的组织和机构,都没有这么多钱。

网络上流行的智商测试,靠谱吗?

智商测试是否可靠,除了信度和效度这种最基本的要求之外,关键就是看常模了。只有具备很强经济实力的组织,才能够建立并维持一个足够好的常模。比如,韦氏智商测试和瑞文智商测试的版权,现在就是培生集团所有。培生是一个很有钱的全球化教育集团。

由于智商测试的常模通常是不公开的内部机密数据。互联网上流行的那些测试,是拿不到已有的常模数据的,所以它们大多是不靠谱的。或许有例外,比如2015年,瑞文智商测验的标准答案就曾经泄露到互联网上,如果常模也泄露了,那么一些网站就可以对测试分数进行准确的解读了。

就我所知,目前在网络上没有靠谱的免费的智商测试,如果有人知道,可以告诉我。

要在中国进行靠谱的智商测试,并非没有可能。那些拥有智商测试版权的机构,会授权一些医院、学校等组织,允许它们进行智商测试,把原始分数结果发回给公司总部,然后总部再参照常模给出解释。所以,在中国可以找到一些有授权的医院或其他组织。比如,中南大学湘雅医院可以为幼儿和儿童进行智商测试。

普通人有必要主动做智商测试吗?

通常情况下,没有任何必要。智商分数和学校里的考试成绩的相关系数,在0.5到0.7之间。也就是说,学校里的那些不同科目的考试,可以部分替代智商测试的功能,而且还是免费的。

假设你去正规组织,花了一些钱,做了一套智商测试,假设就是韦氏成人智商测试,得出了一个分数结果,假设就是120,那又能怎样呢?这个120分不能让你去更好的学校读书,也不能让你去更好的公司工作。这个分数的唯一用处就是让你自我感觉良好而已。

麻烦在于,假设你的韦氏成人智商测试的分数,只有85分,那这个分数的唯一用处就是让你自我感觉很糟糕,如此而已。

所以,对于绝大多数没有智力障碍的普通人来说,没有必要去主动做智商测试。从小到大,大家经历了这么多考试,在和同龄人的比较当中,对自己的智力水平,心中多少是有数的。

有什么学习或训练的方法,可以提高一个人的智商吗?

作为测试分数的智商,是可以提高的。只要拿到一套智商测试题,反复做很多次,就可以很熟练这套题目了。或者,让得分高的人拿到题目给你讲解一番,让你也明白题目背后的逻辑原理。那么等你正式测试的时候,分数就提高了。

但这种提高是没有意义的,只是让表面的智商分数好看一些,智力实际上没有提高。

从双生子研究来看,智商的变异可以50%到80%由遗传变异来解释。这意味着,在给定一个人健康成长的情况下,比如母亲怀孕时不酗酒,儿童成长过程中没有营养不良,可以接触到足够丰富的心理刺激,没有受到严重的脑部外伤,等等。我们不可控制的遗传因素其实很大程度上决定了我们的智力。任何后天的培养,都很难提高一个人的智力。

这个说法可能导致一个误解,那就是读书无用论。很多低学历农村家长会误以为供孩子们读书没有用处,但实际上读书非常有用。接受义务教育或更高级的高中教育以及高等教育,就是接触更丰富的心理刺激,这些虽然不是提升智商的方式,但它们是防止智力不充分发育的方式。所以,某种意义上说,唯一可靠的提升智商的方式,就是不要让孩子辍学。

有一个很反直觉的研究结论,很多人都会以为,随着儿童长大成人,影响智商变异的环境因素应该越来越大,遗传因素应该越来越小,但实际结果恰好相反。成年人的智力,比起儿童的智力,其遗传影响更大。这是为什么呢?

很可能是因为高智力者更可能去追求有着更丰富心理刺激的环境,从而锻炼自己的智力。这意味着环境对于智力的提升,其实也有不小的作用。但人们很难利用起这个作用,因为一个人选择什么样的环境,很大程度上也受到了智力的影响。

不同的人群,智商会有什么差异吗?

地域来看,智商测试分数的结果,东亚人最高,欧美人居中,非洲人最低。不过原因倒不是东亚人智力最高,而可能是东亚人最熟悉纸笔考试,非洲人最不熟悉这种考试。

社会经济地位来看,有钱人比穷人的智商要高,背后的原因很复杂。可能是一个人智力更高,能完成更有难度的工作,所以有更高的收入,能给孩子提供更好的教育。而不是反过来,一个人只要更有钱,就可以有更高的智力。一个中了巨额彩票的人,会突然变得更有钱,但智力不会突然变高。

学历来看,高学历者比低学历者智商要高,不过这很符合常识,我也不多解释了。不过,不要把统计意义上的相关理解错,这句话不是说任意高学历者的智商会比任意低学历者的智商高,而是说随机选取100位高学历者的平均智商会比随机选出的100位低学历者的平均智商要高。

性别来看,目前没有发现男性和女性的显著差异。通常也认为男性和女性之间没有智力差异。如果得出有差异的结论,那就是政治不正确,也不大可能发表。

族裔来看,美国的黑人会比美国的白人的智商要低一些,不过这不大可能是由遗传因素导致,更可能是教育因素导致的。美国黑人往往社会经济地位更低一些,对教育的投入也没有白人那么大。

年龄上来看,由于现有的离差智商是以某一个体和他的同龄人进行对比,所以不同年龄人的智商分数的比较没有意义。但从智力来看,一般认为成年人的智力比儿童高,而老年人比自己年轻时可能会有一定程度的认知能力的降低。这些结论都是常识。

如果从历史发展的角度来看,还有一个很有趣的现象,叫做弗林效应。它描述的是人类的智商测试分数大概每10年就提高了3点。换句话说,让100年前的人做今天的智商测试,他们的平均分数就只有70。而一般低于70,就会被认为是弱智患者了。

为什么会出现弗林效应呢?

最可能的原因,不是人类的智力在这100年的时间里提高了30点,而是用来测量智力的智商量表的设计问题。

实际上,已有的智商量表并不能直接测量g因素,它只能测量s因素。最常用的s因素,就是抽象逻辑推理能力。换句话说,我们实际上是在通过测量一个人的抽象逻辑推理能力,来推测一个人的一般认知能力。

所以,这100年来,人类的智力可能没有多少提高,但抽象逻辑推理能力大大提高了。

为什么人类的抽象逻辑推理能力大大提高了呢?

这主要是因为教育普及导致的。以前,接受教育是贵族的特权。而今天,义务教育强制所有孩子都要去上学,接受高等教育的人也越来越多。在这些教育中,无论是数学、语文、物理、化学、生物还是什么科目,都在强调抽象的逻辑推理能力。

换句话说,是科学教育的普及,导致了弗林效应的出现。

哪些心理学家为智商测验的发展做出了巨大的贡献?

非常多,我只列举最先出现在我脑海中的三位:

达尔文的表弟,高尔顿(Francis Galton,1822—1911)是我想到的第一个。他可以看作心理测量学之父。他曾试图发明标准化的智商测验,但没有成功。失败的原因之一,就是他想要通过测量颅骨大小来判断智力高低,事后发现这种方式很不靠谱。但高尔顿对智力的定量测量的尝试,是很有价值的。

第一套真正有用的智商测验,法国心理学家比奈(Alfred Binet,1857—1911)发明的。法国1882年就在全国范围推进了免费的义务教育制度,孩子们必须去学校上学。随之而来出现了一个问题,有些孩子在学习上总是跟不上别的孩子,所以学校就想着把这群孩子们集中到一起,进行特殊的强化教育。1905年,比奈和他的同事们试图通过测量孩子们的语言能力来判断他们的智力高低,事后发现这种方式还算靠谱。在比奈发明这套智商测试之前,学校里判断学生是否需要特殊强化教育,都是靠教师的主观判断,误差很大。

英国心理学家斯皮尔曼(Charles Spearman,1863—1945)做出很多理论上和数学上的贡献。他区分了g因素和s因素。s因素就是某种具体的能力,比如记忆能力、语言能力、空间想象能力、数学计算能力、逻辑推理能力、问题解决能力、学习能力等等。g因素现在又叫一般认知能力,是很多智商测验试图测量的因素。换句话说,g因素(g factor)、一般认知能力(general cognitive ability)、智商(IQ)这三个词,几乎是同义词。

关于智商,还有什么值得强调的信息吗?

还有不少,但一篇文章的篇幅有限,我没有办法面面俱到。

我没有详细介绍不同的智力理论,而这其实很值得详细介绍。

还有很多重要的问题也没有提到。比如,智力和理性程度有什么关系?智力和创造力有什么关系?智力和体育运动能力有什么关系?智力和工作绩效有什么关系?情商是什么东西?等等。

以后有空,再补充这些内容


欢迎关注微信公众号:认真想

致力于普及批判性思维与通识教育

认真想小助手微信号:Reason-A

发布于 2017-09-24

文章被以下专栏收录