本記事は「これなら分かる!はじめての数理統計学」シリーズに含まれます。
不適切な内容があれば,記事下のコメント欄またはお問い合わせフォームよりご連絡下さい。
目次
正規近似
$X_i(i=1\cdots n)$が期待値$p$,分散$p(1-p)$となるような分布に独立に従うとする。
\begin{align}
Z &= X_1 + X_2 + \cdots + X_n
\end{align}
Z &= X_1 + X_2 + \cdots + X_n
\end{align}
に対して$n$が十分大きいとき,
\begin{align}
P(Z \leq x) \approx \Phi \left( \frac{x - np}{\sqrt{np(1-p)}} \right) \quad (x \in \bbR) \label{gauss_approx}
\end{align}
P(Z \leq x) \approx \Phi \left( \frac{x - np}{\sqrt{np(1-p)}} \right) \quad (x \in \bbR) \label{gauss_approx}
\end{align}
進め方の便宜上「$X_i~(i=1\cdots n)$が期待値$p$,分散$p(1-p)$となるような分布に従う」というような曖昧な書き方をしていますが,要するに「$X_i$は二項分布に独立に従う」ということです。つまり,二項分布に独立に従う確率変数の和は,$n$が大きければ正規分布で近似できるというお話が正規近似です。ですので,定理の名前は「二項分布の正規近似」とした方が正確かもしれません。二項分布に関しては,後ほどしっかりと扱っていきます。他にも,$n$が大きくても$p$が小さい場合は正規近似の精度が悪くなってしまうことがあります。その場合は,正規分布の代わりにポアソン分布と呼ばれる分布を導入して近似を行います。これを「(二項分布の)ポアソン近似」と呼びます。こちらも,後ほど詳しく説明します。
証明
証明はシンプルです。なぜなら,中心極限定理をそのまま適用すればOKだからです。実際に,確率変数の性質より$Z$の期待値が$p$,分散が$p(1-p)$であることを考慮すれば,正規近似の式(\ref{gauss_approx})は中心極限定理そのものであることが分かります。
参考文献
本稿の執筆にあたり参考にした文献は,以下でリストアップしております。
コメント