【これなら分かる!】連続修正の証明

zuka

こんにちは。
zuka(@beginaid)です。

本記事は「これなら分かる!はじめての数理統計学」シリーズに含まれます。

内容は統計検定1級に準拠しています。もし不適切な内容や誤植があれば,記事下のコメント欄もしくはお問い合わせフォームよりご連絡いただけますと幸いです。

目次

連続修正

$X_i(i=1\cdots n)$が期待値$p$,分散$p(1-p)$となるような分布に独立に従うとする。$Z=X_1 + X_2 + \cdots + X_n$に対して

\begin{align}
P(Z \leq x) \approx \Phi \left( \frac{x + \frac{1}{2} – np}{\sqrt{np(1-p)}} \right) \quad (x \in { 0,1,\cdots, n }) \label{formula:Continuity_Correction}
\end{align}

証明

$x \in { 0,1,\cdots, n }$のとき,正規近似を利用すると近似として一番小さいものを使っていることになります。なぜなら,ある$x$に対して$x’ \in (x, x+1)$となるような$x’$を考えます。この$x’$に対して$P(Z\leq x) = P(Z\leq x’)$が成り立つため

\begin{align}
P(Z\leq x) &= \Phi\left( \frac{x’ – np}{\sqrt{np(1-p)}}\right)
\end{align}

とも近似できてしまうからです。確率変数が離散型であるがゆえに起こってしまう弊害ともいえます。この「近似として一番小さいものを使っている」という状況を打破するために,安直ではありますが単純に中間の値を利用して近似しようというアイディアが連続修正です。

式(\ref{formula:Continuity_Correction})の右辺の分子にある$\frac{1}{2}$は,離散型確率変数の間隔$1$の半分という意味です。注意点としては,「近似として一番小さいものを使っている」という状況を打破する方法は,単に$\frac{1}{2}$を足すだけではないということです。例えば,$x \in { 0,1,\cdots, n }$に対して$P(Z\geq x)$の近似は

\begin{align}
P(Z\geq x) &= 1 – P(Z\leq x – 1)\\[0.7em]
&\approx 1 – \Phi \left( \frac{x – \frac{1}{2} – np}{\sqrt{np(1-p)}} \right)
\end{align}

となります。$P(Z\geq x) = 1 – P(Z\leq x – 1)$の変形は$x$が離散型変数であることに注意すれば理解できるかと思います。また,先ほどの例とは異なり,なぜ$\frac{1}{2}$を引いているのかというと,$x^{”} \in (x-1, x)$のような$x^{”}$を考えているからです。

シェアはこちらからお願いします!
URLをコピーする
URLをコピーしました!

コメント

コメントする

目次
閉じる