【これなら分かる!】二項分布とは

zuka

こんにちは。
zuka(@beginaid)です。

本記事は「これなら分かる!はじめての数理統計学」シリーズに含まれます。

もし不適切な内容があれば,記事下のコメント欄又はお問い合わせフォームよりご連絡下さい。

二項分布

取り得る結果が成功・失敗の$2$つである独立な試行を繰り返したとき,成功する回数を表す確率分布を二項分布と呼びます。要するに,二項分布における試行は独立なベルヌーイ試行の繰り返しですので,$Y_1,\ldots,Y_n$が独立に同一の$p\in(0,1)$で指定されるベルヌーイ分布に従っているとき,確率変数

\begin{align}
X &= Y_1+\cdots+Y_n
\end{align}

の従う分布が二項分布であり,$\Bin(n,p)$と書きます。 二項分布には再生性があります。ロードマップ中では二項分布はあらゆる分布の出発点に相当します。以下では,$X \in \{0, \ldots, n \}$とします。

\begin{align}
f_{X}(x) &= {}_n C _x~p^x(1-p)^{1-x} \\[0.7em]
G_{X}(s) &= (ps + 1-p)^n \\[0.7em]
E[X] &= np \\[0.7em]
V[X] &= np(1-p)
\end{align}

確率質量関数

二項分布は,ベルヌーイ試行を$n$回繰り返すことを考えます。$n$回のコイントスのうち表の出る回数を$x$と置けば,二項分布$\Bin (n,p)$の確率質量関数は自然に導かれます。

\begin{align}
f_{X}(x) &= P(X=x) \\[0.7em]
&= {}_n C_x~p^x(1-p)^{1-x}\quad (x=0,1,\ldots,n)
\end{align}

確率母関数

確率母関数の定義に従って計算していきます。ベルヌーイ分布のモーメント母関数を利用すれば簡単に求められます。

\begin{align}
G_{X}(s) &= E[s^{x}] \\[0.7em]
&= E[s^{(y_1 + \cdots + y_n)}] \\[0.7em]
&= E[s^{y_1}] \cdots E[s^{y_n}] \\[0.7em]
&= (ps + 1-p)^n
\end{align}

平均・分散

離散分布の平均と分散を求める際には「確率母関数の性質」を利用します。まず,確率母関数の一階微分から$E[X]$を求めます。

\begin{align}
E[X] &= \left.\frac{d G_{X}(s)}{d s}\right|_{s=1}\\[0.7em]
&= \left. n(ps + 1-p)^{n-1}\cdot p \right|_{s=1}\\[0.7em]
&= np
\end{align}

次に,確率母関数の二階微分から$E[X(X-1)]$を求めます。

\begin{align}
E[X(X-1)] &= \left.\frac{d^2 G_{X}(s)}{d s^2}\right|_{s=1}\\[0.7em]
&= \left. n(n-1)(ps + 1-p)\cdot p^2 \right|_{s=1}\\[0.7em]
&= n(n-1)p^2
\end{align}

最後に,分散の定義から分散を求めます。

\begin{align}
V[X] &= E[X^2]-E[X]^2\\[0.7em]
&= E[X(X-1)] + E[X]-E[X]^2\\[0.7em]
&= n(n-1)p^2 + np-(np)^2\\[0.7em]
&= np(1-p)
\end{align}

再生性

再生性を示すためには,再生性を示したい分布に従う独立な二つの確率変数を考え,その和のモーメント母関数(離散分布の場合はモーメント母関数)を計算したときに,パラメータが和の形になっていることを示します。

$X\sim \Bin (n, p)$,$Y\sim \Bin (m, p)$とし,$X$と$Y$は独立な確率変数とします。このとき,$X+Y$の確率母関数を考えます。各分布のパラメータ$p$は共有している点に注意してください。

\begin{align}
G_{X+Y}(s) &= G_X(s) \cdot G_Y(s) \\[0.7em]
&= (ps + 1-p)^n \cdot (ps + 1-p)^m \\[0.7em]
&= (ps + 1-p)^{n+m}
\end{align}

これは,$X+Y$の確率母関数が$B(n+m, p)$の母関数であることを示しています。つまり,

\begin{align}
X+Y \sim \Bin (n+m, p)
\end{align}

であり,二項分布の再生性を示しています。

ロードマップ再来

確率分布のロードマップ

さて,ロードマップに戻りましょう。 二項分布はあらゆる分布の出発点です。しっかりとおさえておくようにしましょう。

シェアはこちらからお願いします!
URLをコピーする
URLをコピーしました!

コメント

コメントする