03.随机变量和3F(PDF、CDF、PMF)

03.随机变量和3F(PDF、CDF、PMF)

本专栏循序渐进地进行讲解统计学知识,建议大家浏览专栏的目录结构,按顺序浏览01.[必读]目录

(1)随机变量(random variable)

随机变量实际上是一个函数,是随机过程映射到数值的函数。

(2)离散随机变量和PMF

如果随机变量X只可能取有限个或至多可列个值,则称X为离散型随机变量。

\mathbf X = \begin{cases} 0 & ,如果下雨\\ 1& ,不下雨\\ \end{cases}

\mathbf X = \begin{cases} 0 & ,硬币正面\\ 1& ,硬币反面\\ \end{cases}

\mathbf X = \begin{cases} 1& ,骰子点数1\\ 2& ,骰子点数2\\ 3& ,骰子点数3\\ 4& ,骰子点数4\\ 5& ,骰子点数5\\ 6& ,骰子点数6\\ \end{cases}

一般我们使用PMF来描述离散随机变量的概率函数.

PMF : 概率质量函数(probability mass function), 在概率论中,概率质量函数是离散随机变量在各特定取值上的概率。


投5次硬币,对应的PMF为:

   [计算方式见下一章节<二项分布>]


(3)连续随机变量

在一定区间内可以任意取值的变量叫连续变量.

一般我们使用PDF来描述连续随机变量的概率分布.

PDF:概率密度函数(probability density function), 连续型随机变量的概率密度函数是一个描述某个确定的取值点附近的可能性的函数。

下面是正态分布的PDF:

PDF中随机变量在横轴的区间的概率对应其上不同颜色的面积,例如 [\mu-\sigma,\mu+\sigma]对应的概率为34.1%*2 .

为了便于概率的计算,我们引入了CDF的概念.

CDF : 累积分布函数 (cumulative distribution function),是概率密度函数的积分,能完整描述一个实随机变量X的概率分布。

CDF是PDF的(从负无穷-oo到当前值的)积分,PDF是CDF的导数.
CDF相当于其左侧的面积,也相当于小于该值的概率,负无穷的CDF值为0,正无穷的CDF值总为1.

正态分布的PDF和CDF对比


下一章内容:

袁杰雄:04.二项分布Binomialzhuanlan.zhihu.com图标

编辑于 2018-04-22

文章被以下专栏收录