Improving your statistical inferences第二周(2):贝叶斯方法

Improving your statistical inferences第二周(2):贝叶斯方法

hcp4715hcp4715
注:Improving your statistical inference是荷兰 Eindhoven University of Technology心理学研究者Danial Lakens在coursera上开设的一门公开课,目的是为了增加心理学研究者对心理学研究中常用统计的理解。本次补第二周的第二部分内容。

你对p值的理解吗?让我们来测一测:你理解p值和置信区间?


第二周的第二部分内容是贝叶斯统计。贝叶斯统计(Bayesian)最近几年应该说是越来越火,当然在心理学研究中,绝大部分人还是使用频率主义的做法。正如我们在第一周的内容里说的,有一种玩笑:之所以用p值是因为不会贝叶斯。从某个侧面说明了贝叶斯统计并不是那么容易。还好Daniel给我们提供了一个比较友好的入门。


贝叶斯最突出的一点是:有一个先验的假设(或者信念, prior belief)。如下图,贝叶斯的主要思路就是根据通过先验假设和数据,将实验者的假设进行更新,成为后验的假设/信念。视频中举的例子是:掷三个次硬币,都是正面朝上。面对这个信息,一个从来没有见过掷硬币的婴儿可能就相信掷硬币都会得到正而朝上的结果;而你我这样能来学习统计推断的人,则会不得到这样的一个信念。差别在哪里?在于我们的先验假设。

更加具体一点,可以这么写:

那么在二项分布中,先验假设一般是一个beta分布,这个分布有两个参数:alpha 和beta。这两个值不同的,我们会得到很不同的分布:

使用贝叶斯的原则,我们得到数据之后可以根据数据对先验假设进行更新,在Beta分布中,这个更新非常容易:

至于为什么是这样,Daniel没有讲,我也不太懂,我就假装它就是这样的吧。假定我们的先验是:完全不知道掷硬币时出现下面的概率分布是怎么的,于是我们的先验是均匀分布,一条直线。掷了10次硬币之后,发现了6次正面朝上。这时,更新之后后验看起来就不一样了:

上图中,灰色的是先验假设;蓝黑线则是根据数据进行更新之后的。由于先验假设没有提供任何的信息,所以这里的后验信念与前面讲的似然率是一样的,都是由数据本身所决定的。

但是,如果先验的假设是有信息量的,则贝叶斯的后验假设会与似然率分离:

上图仍然是掷10次硬币出现6次正面朝上。但我们一个先验假设(灰色),根据数据的似然率(蓝色虚线),我们得到了后验信念(黑色的实线)。

贝叶斯的方法的用途之一是进行假设检验,不过与似然率比值相似的是,贝叶斯统计的假设检验也是相对比值。在视频中,Daniel将贝叶斯假设检验的统计指标之一 —— 贝叶斯因子(Bayes Factor)解释为后验与先验的相对比值。同样以上面的数据为例子,当我们的先验假设不同,即便我们得到了相同的数据,最后得到的贝叶斯因子也会有所差异:

贝叶斯的另一种用法是估计(Estimation),也就是根据先验假设和数据,来估计出最可信的值。这个估计出来的结果称为credible interval,可信区间。有意思的是,当先验的假设不一样时,估计出来的可信区间也非常不同:

左图是先验的假设没有信息量时(均匀分布),右图的假设则是认为硬币是有偏的,更有可能出现正面。

从这两个图中可以看出来,贝叶斯的统计的一特点是通过数据来更新信念,随着数据的不断收集,我们有会越来越接近真值。

讲完贝叶斯统计的基本思路之后,Daniel在第三个视频中进一步讲了贝叶斯的思维(Bayesian thinking)。这课里讲的是贝叶斯统计里通常会举的例子:一次医学测试的结果是阳性,有多大可能是真的是患病了?

比如,一个医学测试,它的Sensitivity (true positive) 为80%,Specificity (true negative)为 87%;而流行病学的调查表明,它的患病率为3%。

如果你进行一次测试,发现结果是阳性的,这个时候你患上这个疾病的概率是多少?根据贝叶斯公式,可以进行计算:

P(患病|阳性)= P(患病&阳性)/P(阳性) = P(阳性|患病)*P(患病)/(P(阳性|患病)*P(患病) + P(阳性|没患病)*P(没患病)) = 80%*3%/(80%*3% + 13%*97%) = 0.159。

所以这个可能性是相当低。

随后,Daniel介绍了一个图,可以将P值与先验假设结合起来,不用通过贝叶斯的计算,就能得到一个大约的估计:

不过本人推荐大家使用JASP这个软件,可以很容易地进行贝叶斯的假设检验。


第二周的作业基本上是练习似然率和贝叶斯统计的一些内容,对于加深对这视频中讲解的内容非常有帮助。

3 条评论