【徹底解説】超幾何分布・二項分布・ポアソン分布の関係

本記事は「これなら分かる!はじめての数理統計学」シリーズに含まれます。

不適切な内容があれば,記事下のコメント欄またはお問い合わせフォームよりご連絡下さい。

目次

超幾何分布と二項分布・ポアソン分布

超幾何分布において,アタリの割合が少なくて試行回数が十分大きいときにはポアソン分布に近似でき,くじの母数が十分多くてアタリも十分含まれている場合には二項分布に近似できる。

証明

超幾何分布とポアソン分布の関係は,超幾何分布において「$p=M/N$を一定に保ちながら$N$を大きくしていけば二項分布に近似できる」ということから出発すると分かりやすいです。実際に示してみましょう。$N$から$(N-n+1)$までの中途半端な階乗を$(N)_n$と表すことにします。

\begin{align}
(N)_n &= N(N-1)\cdots (N-n+1)
\end{align}

このとき,コンビネーションを使った演算は以下のように表されます。

\begin{align}
{}_{N} \C_{n} &= \frac{N !}{n !(N-n) !}=\frac{(N)_{n}}{n !} \\[0.7em]
{}_{M} \C_{x} &= \frac{M !}{x !(M-x) !}=\frac{(N p) !}{x !(N p-x) !}=\frac{(N p)_x}{x !} \\[0.7em]
{}_{N-M} \C_{n-x} &= \frac{(N-M) !}{(n-x) !(N-M-n+x) !}\\[0.7em]
&= \frac{(N q) !}{(n-x) !(N q-n+x) !} \\[0.7em]
&= \frac{(N q)_{n-x}}{(n-x) !}
\end{align}

ただし,$1-p=q$とおきました。すると,超幾何分布の確率関数は以下のように書き直せます。

\begin{align}
p(x) &=\frac{n !}{x !(n-x) !} \frac{(N p)_x (N q)_{n-x}}{(N)_{n}}\\[0.7em]
&= {}_n \C_{x} \cdot \frac{(N p)_x (N q)_{n-x}}{(N)_{n}} \label{equation:超幾何からポアソン}
\end{align}

さて,以下の式なのですが,

\begin{align}
\frac{(N p)_x (N q)_{n-x}}{(N)_{n}}
\end{align}

分母と分子に登場する階乗の各成分を$N$でくくると,分母にも分子にも$N$が$n-1$項現れるので,相殺されます。すると,階乗の分母は$1-o(1/N)$,分子はそれぞれ$p-o(1/N)$,$q-o(1/N)$になります。ただし,$o(\cdot)$はカッコの中身よりもオーダーが小さい多項式を示します。この操作を数式に落とし込みます。$n\rightarrow \infty$のとき,式(\ref{equation:超幾何からポアソン})は以下のように変形できます。

\begin{align}
p(x)
&= {}_n \C_{x} \cdot \frac{(N p)_x (N q)_{n-x}}{(N){n}}\\[0.7em]
&= {}_n \C_{x} \cdot \frac{N^{n-1} \left(p-\frac{1}{N}\right)\cdots \left(q-\frac{1}{N}\right)\cdots}{N^{n-1}\left(1-\frac{1}{N}\right) \cdots}\\[0.7em]
&\longrightarrow~ {}_n \C_{x}~ p^x q^{n-x}\quad(N\rightarrow \infty)
\end{align}

二項分布の形に帰着できました。この近似の意味は,たくさんのクジで非復元抽出を行えば,それは復元抽出にみなせるということを示しています。$p=M/N$が小さく,かつ$n\rightarrow \infty$のときには二項分布がポアソン分布に収束しますので,同時に超幾何分布がポアソン分布に近似されることも示されました。

以上から,超幾何分布において,くじの母数が十分多くてアタリもそれなりの割合含まれている場合には二項分布に近似でき,アタリの割合が少なくて試行回数が十分大きいときにはポアソン分布に近似できるということが分かりました。

参考文献

本稿の執筆にあたり参考にした文献は,以下でリストアップしております。

シェアはこちらからお願いします!

コメント

コメントする

※ Please enter your comments in Japanese to distinguish from spam.

目次