什么是概率?

什么是概率?

继《线性代数》和《单变量微积分》后,“马同学图解”系列又迎来新的成员 ---- 《概率论与数理统计》,覆盖浙江大学《概率与数理统计》前八章(考研范围),下面是本课程的第二篇文章,欢迎大家试读和购买(微信公众号:马同学高等数学,菜单“图解”中购买)。

1 争论

概率论需要回答的第一个问题就是,什么是概率?

刚接触这门学科的同学可能觉得难以置信,这个问题仍然存在着广泛的争论:

而且这个问题更像是一个哲学问题,而不是数学问题,确实也有不少哲学家参与讨论。

对于概率的定义有几个主流的派别:

  • 频率派
  • 古典派
  • 主观派

了解这些派别对于理解概率论很有帮助,下面来简单介绍一下。

2 频率派

首先来了解下频率派,频率派的理论基础是对过去事实的归纳总结。

2.1 什么是频率?

学概率从抛硬币开始才是正确姿势。我们知道硬币是有正反两面:

硬币抛出之后:

得到的结果是随机的,那么得到正面的概率是多少呢?这里的“概率”又指的是什么?

我们扔100次硬币试试:

可以看到,得到48次正面,52次反面,用正面次数除以总的次数:

P_{100}(正面)=\frac{48}{100}=0.48\\

P_{100}(正面) ”称为扔100次硬币时,正面出现的\color{Salmon}{频率}

2.2 频率与概率

2.2.1 频率稳定性

同样的,扔n 次硬币时如果出现了n_H 次正面,那么:

P_{n}(正面)=\frac{n_H}{n}\\

P_{n}(正面) ”为此时正面出现的频率。历史上很多数学家都做过扔n 次硬币的实验:

 \begin{array}{c|c|c|c}     \hline     \quad\quad&\quad n\quad&\quad n_H\quad&\quad P_n(正面)\quad\\     \hline \\     \quad 德摩根 \quad&\quad 2048 \quad&\quad 1061 \quad&\quad 0.5181 \quad\\      \quad 蒲丰 \quad&\quad 4040 \quad&\quad 2048 \quad&\quad 0.5069 \quad\\      \quad 皮尔逊 \quad&\quad 24000 \quad&\quad 12012 \quad&\quad 0.5005 \quad\\     \\\hline \end{array} \\

从试验结果可见,随着n 的增大,频率越来越趋近于0.5。可见,虽然单次扔硬币的结果是随机的,但多次重复后频率趋于稳定,这种稳定性也称为\color{Salmon}{频率稳定性} ,反应了扔硬币存在某种必然性。

2.2.2 定义

频率派认为如果频率存在稳定性,即当n\to\infty 时下面极限存在,就得到了\color{Salmon}{概率} (用Probability的首字母P来表示):

P(正面)=\lim_{n\to\infty}P_{n}(正面)\\

可以自己尝试扔一下,点一下按钮就会模拟扔100次硬币,看看是不是扔的次数越多,越趋于0.5(计算机模拟的,内部使用的是伪随机,难免会有一些偏差):

此处有互动内容,点击此处前往操作。

3 频率派的缺点

通过频率来定义概率的方法比较符合直觉,但缺陷也很明显:

  • 首先,需要n 足够大,但是“足够大”这个词很含糊
  • 其次,需要在相同条件下反复扔硬币,但是“相同条件”这个词也很含糊,也很难保证,比如扔了10000次后,硬币上沾满汗水,那又怎么办?
  • 再次,永远也不可能扔无限次硬币,所以得到的概率始终是一个近似值
  • 最后,有些时候根本不具备反复实验的条件,比如火山喷发的概率应该怎么计算?

4 古典派

接下来介绍古典派,古典派的理论基础是不充分理由原则。

4.1 不充分理由原则

在概率论草创阶段,雅各布·伯努利(1654-1705):

就提出,如果因为无知,使得我们没有办法判断哪一个结果会比另外一个结果更容易出现,那么应该给予它们相同的概率。比如:

  • 硬币:由于不清楚硬币哪一面更容易出现,那么应该给予正面、反面相同的概率,即为\frac{1}{2}
  • 骰子:我们不清楚骰子哪一面更容易出现,那么应该给予每一面相同的概率,即为\frac{1}{6}

此称为\color{Salmon}{不充分理由原则} (Insufficient Reason Principle)。

4.2 古典概率

以不充分理由原则为基础,经由拉普拉斯(皮埃尔-西蒙·拉普拉斯侯爵,1749-1827):

之手,确立了\color{Salmon}{古典概率} 的定义,即:

未知的概率都为等概率

在这之后,古典概率在整个19世纪也被人们广泛接受,我们高中学习的概率,基本都是古典概率。

比如,有一家原木加工厂,它会把木头切成不同的木方,木方的截面都是正方形,边长会在1\sim 3尺之间随机浮动:

那么根据古典概率,正方形边长在1\sim 2尺之间的概率为多少?

根据古典概率的不充分理由原则,我们没有办法判断哪一种边长更容易出现,那么就应该给予它们相同的概率,也就是说1\sim 3之间每一种长度都是等可能的。

1\sim 2包含了一半的可能长度:

所以,正方形边长在1\sim 2尺之间的概率为\frac{1}{2}

5 古典派的缺点

古典派的缺陷也是非常明显的:

(1),古典派的概率定义,“未知的概率都是等概率”,有循环定义的嫌疑。

(2),不充分理由原则没办法处理非等概率的情况,假如被告知硬币两面是非等概率的,但是不知道是哪一面,那么应该怎么办?(拉普拉斯提出还是应该按照等概率来处理)

(3),还容易产生矛盾,比如刚才练习题中提到的原木加工厂,它会把木头切成不同的木方,木方的截面都是正方形,边长会在1\sim 3尺之间随机浮动:

那么根据不充分理由原则,正方形边长在1\sim 2尺之间的概率为\frac{1}{2}

刚才的问题还可以转为面积来解答,1\sim 3尺边长的正方形面积为1\sim 9平方尺,1\sim 2尺边长的正方形面积为1\sim 4平方尺:

同样,根据不充分理由原则,1\sim 9平方尺之间的正方面面积是等可能的,那么正方形面积在1\sim 4平方尺之间的概率为\frac{3}{8}

选择对“长度”还是对“面积”运用不充分理由原则,同一个问题会得到了不同的概率:

上述问题是\color{Salmon}{伯特兰悖论} (Bertrand's paradox)简化版,由伯特兰在1899年出版的《概率论》中提出:

伯特兰悖论先说在这里,之后会有专门介绍古典派概率的章节,到时再来解决这个悖论。

6 主观派

最后介绍下主观派,主观派认为概率是\color{Salmon}{信念强度} (degree of belief)。

比如说,我个人相信20年后人类从网络时代进入人工智能时代的概率为70%:

上面说的概率也就是主观概率,是个人对这个命题的信念强度,换句话说我觉得还是很有可能实现的。

虽说是主观概率,其实也有客观的部分,比如刚才对人工智能的判断,就是基于AI的基础设置发展、计算速度的提高等事实。

主观概率更贴近人的思考方式,比如我们在作科学研究时,会先给出一个猜想,这就是给出了一个主观概率。

所以在人工智能时代,因为要模仿人的行为,主观概率越来越受到重视:

当然主观派缺陷也很明显,这也是被大家接受困难的原因:

  • 说到科学,大家都认为应该是客观的,但是偏偏主观概率不客观,充满了个人偏见
  • 因为主观,大家很难对某个主观概率达成共识

7 小结

三个流派大概有以下的区别:

 \begin{array}{c|c}     \hline     \quad\quad&\quad\color{orange}{频率派}\quad&\quad\color{blue}{古典派}\quad&\quad\color{ForestGreen}{主观派}\quad\\     \hline \\     \quad 理论基础 \quad&\quad 过往事实的归纳总结\quad&\quad不充分理由原则\quad&\quad知识和直觉\quad\\     \quad 概率定义 \quad&\quad频率稳定性\quad&\quad等概率\quad&\quad信念强度\quad\\     \\\hline \end{array} \\

这三个流派并非泾渭分明、互不相容,反而在发展中犬牙交错。比如要判断火山的喷发概率,就需要总结过往数据(频率派),再加入主观知识(主观派)。

为什么概率的定义不明确?可能因为概率本身研究的就是“不明确”。

发布于 2019-03-12

文章被以下专栏收录