Improving your statistical inferences第二周(1):似然性

Improving your statistical inferences第二周(1):似然性

hcp4715hcp4715
注:Improving your statistical inference是荷兰 Eindhoven University of Technology心理学研究者Danial Lakens在coursera上开设的一门公开课,目的是为了增加心理学研究者对心理学研究中常用统计的理解。本次补第二周的内容。

你对p值的理解吗?让我们来测一测:你理解p值和置信区间?

第二周的主要内容是关于另外两种统计的取向:似然率比值和贝叶斯统计。正如在第一周开始的介绍中所说,贝叶斯和似然率比值与频率主义的思路很不相同,它们关注的是相对的证据。也就是说,当前的数据,在多大程度上支持了我的假设A(相对于假设B)。

本文主要讲似然率比值(Likelihood ratio)。似然率比值本身可以作为一统计推断的方法,也是贝叶斯统计的基础。

这个可以看出来,似然率比值与NHST的区别还是挺大的:似然率比值是根据数据来推断某个统计模型的可能性;而NHST是假设H0为真的情况下出现当然数据的可能是多少,这个可能性是否小到我们认为在一次抽样中不可能发生。

课程中使用二项分布来讲解似然率比值:

二项式分布就是我们在大学以前学习过的掷N次硬币出现m次有多大可能的那个,上面的这个公式是一个数学的表达式。当然,不喜欢公式实际上也不影响理解。

假如你掷了10次硬币,出现了8次正面朝上。根据这个数据,我们可以算一下这个硬币是否是一个公平的硬币(也就是说不断掷下去正反面出现的比例各为0.5)。一个公平的硬币,在二项式公式中的参数\theta = 0.5 。抛10次硬币出现8次正面向上,计算硬币是公平的概率时,把\theta = 0.5代到下面的公式之中即可

[10!\div (8!(10-8)!)]\times \theta^8\times(1-\theta)^2 (1)

当然,我们可能会怀疑,这个硬币不是公平,它本身可能是一个\theta = 0.8的一个硬币(也是说,80%的情况下出现正面)。这种情况下,可以把\theta = 0.8代入到公式(1)得到这个情况下的似然性(约为0.3)。

在这两种情况下\theta = 0.8\theta = 0.5 相当于是我们假设的模型,而10次硬币中出现8次正面向上则是我们的数据。根据数据可以计算出每个模型的似然性。实际上,还可以有更多的模型,比如 \theta = 0.4\theta = 0.3 ... 。这些模型之下的似然性可以画成一条曲线:

讲到这里,好像还没讲似然率比值中的比值(ratio)是什么呢。前面说到了,似然率是在当前数据下,不同模型可能性的比值。假如我们有两个假设:H0 是 \theta = 0.5 ,H1是\theta = 0.8 ,那这两种情况下我们似然率比值是多少呢?见下图:



如果掷了10次硬币,只有4次是正面朝上,这时时候,H0和H1的似然率比值就发生了重大的变化:


对于似然率比值来说,我们应该使用什么样的标准觉得比较合适来进行判断呢?Royall给了一个直觉的标准:


但是使用似然率比值的时候,需要非常警惕一点,这个比值是相对的:即便一个模型比别外一个模型的似然性高的不知道哪里去了,也有可能两个模型都是错得离谱的(比如下图中 H0(\theta = 0.3)比H1(\theta = 0.8)的似然率比值大了许多倍,仍然不能说明它是正确的假设。


通常二项式来解释似然率,应该算是比较清楚了。Daniel顺便八卦了一下,似然率是Fisher在读本科的时候发明的,当时22岁(大神就是这么屌啊)。

二项式的似然率的比值在我们的研究中可以怎么用呢?Daniel举了一个很有趣的例子:假如我们研究某个效应,可以比较H0假设为真时出现显著结果的似然率(\theta = 0.05)和H1为真情况出现显著结果的似然率(假定我们的研究的统计功效为0.8,则\theta = 0.8)。这种情况下,假如我们进行了3个实验,则有4个种可能:0个显著、1个显著、2个显著和3个都显著。

那么H0为真的情况下,3个实验中有2个显著的似然率为:

H1为真的情况下(每个实验的统计功效均为0.8),3个实验有2个显著的似然率为:

采用似然率比值的话,那么H1为真的情况比H0为真的情况下的似然率比值是54,也就是说,3个实验中有2个显著的话(统计功效为0.8),H1为真比H0为真的似然率高54倍。

不过这里有一个更意义的值:

在H1为真且统计功效为0.8的情况下,只有0.51的可能得到三个实验全部显著(那些八、九个实验全部显著的研究得怎么做到的 [捂脸])。

当我们进行4个实验时,得到0个、1个、2个、3个和4个显著结果的可能性分布见下图,最有可能出现的结果是出现2到3个显著的结果。

在课程中,Daniel实际上讲的是用似然率比值来估计我们多个实验的情况下,H0和H1为真的比值。但在单个实验中,我们能否使用似然率比值?这里没有提,我的理解是比较困难,因为我们可能不知道我们所研究的这个现象它应该是一个什么分布,如果不知道这个分布的话,如何计算似然率本身就比较困难了。


当然,将似然性比值运用于对多个实验结果的分析中,也是非常有意义的,至少这个统计取向对于我们研究有实际的意义。

「真诚赞赏,手留余香」
1 人赞赏
微雨初梦
1 条评论