我只要这么多样本!

问:一个学校有N个人,其中有若干男生若干女生。若想估算这所学校的男生比例(即男生数/总人数),要求有98%的概率可以距离真实值1%以内,需取样多少?

答:最多92104个!不管N多大!!!!不!!管!!N!!多!!大!!!

被惊吓到有木有!!

平常做算法题分析算法复杂度的时候O(1)复杂度的算法想都不敢想有木有!!

居然实现了有木有!!!

咩!!!!!

为什么呢?

其实很简单。。。(其实知道原理什么东西都很简单。。)

快去查Chernoff Bound!!

定理如下(用英语写(照抄)了不好意思。。):

Let X_1, \ldots, X_mbe independent, identically distributed random variables, such that E[X_i] = p and S_m = \sum_{i=1}^m X_i. If X_i \in [-1, +1], then:

\begin{align}
Prob \left[ \left|\dfrac{S_m}{m} - p \right| \geq \lambda \dfrac{1}{\sqrt{m}}\right] \leq 2e^{-\lambda^2/2}
\end{align}

在此例中设\lambda\dfrac{1}{\sqrt{m}} 为0.01, 2e^{-\lambda^2/2}为0.02即可得出m为以上结果。

好神奇有木有!!!!!

PS. 评论整个学校都没有这么多人的。。。我。。我。。。那你就全问了不就知道完全精确的数儿了嘛!!!

读了一个学期Ph.D.就搞了半天这个。。坑爹啊啊啊啊!!!!!

编辑于 2014-11-25

文章被以下专栏收录