谈方法论:归纳与统计

谈方法论:归纳与统计

作者:长明


上篇文章讨论了数量思想,但从方法间的联系来说,集合思想应该联系到统计思想,然后再深化到数量思想,所以今天就补充上这个环节。

是的,本篇内容应当结合愚者发的朴素集合方法阅读,统计思想以集合思维为基础。没有看集合方法的,赶紧去看,然后再对照本文。


认识是从个别到一般, 又由一般再到个别的过程。通过个别认识一般的主要思维方法是归纳, 由一般认识个别的主要思维方法是演绎。

归纳方法是从个别或特殊事物概括出共同本质或一般原理的逻辑思维方法, 在逻辑上叫做归纳推理。归纳的结论是或然性的。


根据归纳法自身的特点, 我们可以将其区分为两类不同类型:完全归纳法、不完全归纳法

●完全归纳法是考察了某类事物中的全部个别事物后,得出关于这类事物的一般性原理的方法。也就是对集合的全集进行观察抽象,从而得到共性的过程。数学上的穷举法就是一种完全归纳法。这一方法,由于是在考察了某类事物的全部个体,发现它们都具有某种属性才做出归纳的,所以,关于这类事物的一般性结论是确实的。

比如说,我看见小明家每个人的主食都是米饭,那么就可以得出小明家所有人的主食都是米饭,从而得到主食是米饭是本家庭成员的共性。


然而面对客观世界的复杂性,穷举某类事物的全部,有时是不可能的(对无限多的);有时是十分困难的 (对数量众多的)。所以,绝大多情况下使用的是不完全归纳法

比如说,要知道本村人的主食是什么,还可以每家每户的调查,但是一旦上升到很高层次的社会系统,像省市、国家的话就难以进行了。


●不完全归纳法是在考察了某类事物的部分个别对象后,就得出关于这类事物的一般性原理的方法。实际上就是对事物全集的子集进行抽象,得到部分子集的共性,而这个共性不一定就是全集的共性。

不完全归纳的结论对没能考察到的那些事例来说,具有推测的性质,有或然性存在。人们在运用这一方法时,要尽量增加考察事例的数量,并使其尽量具有代表性,以增加结论的可靠程度。如果只根据少数几个事例的枚举,就轻率地做出一般性结论,就会出现“轻率概括”的逻辑错误。像人们常说的以点代面、一叶障目、把局部当全体、把支流当主流等以偏概全的错误,均出于此。


■结论的或然性。上面说了完全归纳和不完全归纳的区别,读者仔细阅读的话,就会发现上面一开始说的归纳的结论是或然性的与完全归纳结论的确实性是相悖。实际上我们提高层次来看,完全归纳始终是在一定精度下进行的归纳,客观世界是无穷的,不存在绝对的完全归纳,因此即使是所谓的完全归纳结论在根本上也是或然的。只不过在一定层次一定精度来说,基于一定条件的完全归纳可以视为确实的。所以总的来说归纳的结论是或然性的。

■结论的跨层级性。这个用集合去理解,通过对子集的归纳,得到了对母集属性的刻画,认识就从个性上升为共性,部分上升为整体,从偶然性上升为必然性。


理解了归纳的概念,了解了归纳的普遍性和结论的跨层级性、或然性,那么显然的我们必须掌握好归纳的特点和规律。基于此,也发展出了很多的具体方法和工具,其中统计正是不完全归纳常用的数学工具之一,统计方法实质上是归纳的低层次具现化。

统计学相关的内容很丰富,是一个大学科,但本文并不想展开论述,考虑实用性,在生活中我们掌握一定的高层次思维方法就够用了,也就是下面要论述的统计思想。


●统计,就是对样本性质做调查分析,去估计总体的性质。

为什么要学统计,举两个例子:窥一斑而知全豹、一叶落而知天下秋。统计对于认识事物的属性、发展趋势及其变化规律很有帮助。掌握统计思想,可以使得我们花费较小的成本和精力,就可以得到对广泛事物的高层级认识,达到见微知著、见微知萌的作用。


■统计的普遍性:基于客观世界的复杂性,可以说统计规律无处不在。因为一个人所能接触和直接认识的事物是很有限的。做科学研究的,经常要遇到的一个东西就是经验公式,经验公式就是统计规律。类似热力学、统计物理学等学科,甚至以统计方法为主要方法。虽然统计一般运用在集合元素数量较多的场合,但一方面对于我们认识能力来说数量多的集合很多很多,另一方面通过统计思想掌握不完全归纳方法的核心内容,就为我们认识更广阔的世界起到了帮助。


■统计规律是大量随机性现象在整体上表现出来的必然联系。作为随机事件的整体性规律,它不是单个随机事件特点的简单叠加,而是事件系统所具有的必然性。统计规律的一个重要特征,即只是在大样本条件下表现出来的平均性质,而不一定每个样本都具有。

例如正常人体的体细胞染色体数目为23对,成年人骨骼206块等,这都是统计规律。

对于统计规律来说,举少量反例并不能打倒,因为只要反例对总体情况影响不大,那么结论就成立。只有达到一定数量的反例,超过了精度允许的范畴,才能够推翻。集合的共性则不同,集合的共性是必然性的,一旦出现反例,则说明共性抽象的不准确,需要修正。运用时,注意二者区别。

以守株待兔为例,兔子撞树桩被人捡到是极小概率下才会发生的事件,把兔子撞树桩归纳为规律是明显错误的,这不具备统计意义。等待兔子送上门的人,之所以被取笑,不是因为不存在可能性,而是因为不存在可行性。

坊间传闻北方人比南方人高,从集合的角度来说,这个命题只要举一个反例就可以否定,但从统计规律的角度来说,必须要进行一定规模的调查才能够得到结论,论证这个命题如果只举自己的同学、男女朋友什么的,可信度很低。


因为社会本身就是一个复杂巨系统,可以得到一个重要结论:社会科学规律基本上都是统计规律。从这个根据出发,对判断关于社会情况的很多结论,具有明显的作用。

俗语云:天下衙门朝南开,有理无钱莫经来。这句话是古人朴素的归纳经验,描写了私有制社会中的常见现象,所以得到了广泛流传。所谓的清官不仅属于少数个例,而且也是基于维护等级制立场的。又比如买彩票致富,统计概率就知道不靠谱。

知乎上的问答贴,很多人直观感性的根据自己身边碰见的少量例子,就归纳得到了很广泛范围的结论,这就跳跃层级了。这方面例子生活中很多,这里不再展开,广知乎上就大把例子。


■关于统计的误差。因为统计是用样本去估计总体,估计结果难免有误差(调查结果和真实值之间存在的差异称为误差),误差必然存在,但是实践中只需要保证结论在一定精度要求范围内即可

控制误差的方法:增大样本数量和改进取样方法。两种方法同时采用,在实践条件下尽可能提高估计的精确度即可。具体内容不再展开,有需要的同志可以继续研究。

例如幸存者偏差,就是取样方法导致的误差。取样中,对集合主体认识不明确,对样本子集与其他子集的联系没有把握好,就导致了这样的错误。

科研中常用的正交实验方法就是在把握了统计的内核上,所开发的一种专门方法。既保证了成本较低,又达到了对实验精度的要求。


■统计的局限性:统计得到的数据和结论,仅仅只是现实的直观的表象的,得到的是相关性,而不直接是事物之间的本质联系,需要掌握好其他思维方法才能够利用好统计工具。

比如说,我们统计一批老鼠,所有的正常老鼠碰见人都会逃跑,然后所有的被剁掉四条腿的老鼠看见人都不会跑,于是得出结论:老鼠的耳朵在腿上。




总结:集合确定了讨论、研究的主体,统计则是连接高低层级的数学工具,数量思想确定了结论的精度,而这些都仅只是对系统方法的一些简化,掌握这些方法既可以直接为实践服务,也是为掌握系统论打下了基础。

编辑于 2018-03-03

文章被以下专栏收录