【これなら分かる!】負の二項分布とは

zuka

こんにちは。
zuka(@beginaid)です。

本記事は「これなら分かる!はじめての数理統計学」シリーズに含まれます。

もし不適切な内容があれば,記事下のコメント欄又はお問い合わせフォームよりご連絡下さい。

負の二項分布

無限に続くベルヌーイ試行において,$r$回成功するまでの失敗の回数を確率変数$X$とするとき,$X$は以下のように表される負の二項分布$\NB (r, p)$に従います。負の二項分布は,ポアソン分布の混合分布にもなっています。負の二項分布には再生性があります。ロードマップ中では負の二項分布は二項分布の極限に相当します。以下では,$X\in\{0, \ldots, n\}$とします。

\begin{align}
f_{X}(x) &= {}_{x+r-1} C_{x}\;p^r (1-p)^{x} \\[0.7em]
G_{X}(s) &= \left\{ \frac{p}{1-(1-p)s} \right\}^r \\[0.7em]
E[X] &= r\frac{1-p}{p} \\[0.7em]
V[X] &= r \frac{1-p}{p^2}
\end{align}

確率密度関数

負の二項分布は「$r$回表が出るまでの失敗の回数」を確率変数とする確率分布です。この定義から,確率密度関数は自然に導かれます。

\begin{align}
P(X=x) &= {}_{x+r-1} C_{x}\;p^r (1-p)^{x}\quad (x=0,1,\cdots)
\end{align}

確率母関数

負の二項分布の確率母関数を求めるには,「$r$回表が出るまでの失敗の回数」を「$1$回表が出るまでの失敗の回数の和」として捉えると簡単です。つまり,幾何分布に従う$r$個の独立な確率変数$X_1,\cdots,X_r$の和$S_r$が負の二項分布に従います。したがって,確率母関数は以下のようになります。

\begin{align}
G_{S}(s; r,p) &= G_{X_1+\cdots X_r}(s;p)\\[0.7em]
&= G_{X_1}(s;p)\cdots G_{X_r}(s;p)\\[0.7em]
&= \left\{ \frac{p}{1-(1-p)s} \right\}^r
\end{align}

一般的な確率母関数の導出方法もご紹介しておきます。そこでは,一般二項定理と呼ばれている以下のテイラー級数を利用します。

\begin{align}
(1-t)^{-\alpha} &= \sum_{x=0}^{\infty} \frac{(\alpha)_x}{x!}t^x \label{equation:一般二項定理}
\end{align}

ただし,$(\alpha)_x$は超幾何分布で導入した記号と同様で,$(\alpha)_0=1$および$x=1,2,\cdots$に対して$(\alpha)_x=\alpha(\alpha+1)\cdots(\alpha+x-1)$となります。

\begin{align}
{}_N \tilde{C} _x &=
\begin{cases}
{}_N C_x & (x=0,\cdots,n)\\[0.7em]
0 & (\text{その他})
\end{cases}
\end{align}

さて,確率母関数の定義通りに計算していきます。

\begin{align}
E[s^x] &= \sum_{x=0}^{\infty} s^x {}{x+r-1}\mathrm{C}{x}p^r (1-p)^x\\[0.7em]
&= \sum_{x=0}^{\infty} s^x \frac{(x+r-1)!}{x! (r-1)!}p^r (1-p)^x\\[0.7em]
&= \sum_{x=0}^{\infty} \frac{(x+r-1)!}{x! (r-1)!}p^r \left\{ (1-p)s\right\}^x\\[0.7em]
&= p^r \sum_{x=0}^{\infty} \frac{(r)_x}{x!}\left\{ (1-p)s\right\}^x\\[0.7em]
&= p^r \left\{1 – (1-p)s\right\}^{-r}\\[0.7em]
&= \left\{ \frac{p}{1-(1-p)s} \right\}^r
\end{align}

平均・分散

離散分布の平均と分散を求める際には「確率母関数の性質」(連続分布の平均と分散を求める際には「モーメント母関数の性質」)を利用します。

\begin{align}
E[S_r] &= E[X_1 + \cdots + X_r]\\[0.7em]
&= E[X_1] + \cdots + E[X_r]\\[0.7em]
&= r\frac{1-p}{p}\\[0.7em]
V[S_r] &= V[X_1 + \cdots + X_r]\\[0.7em]
&= V[X_1] + \cdots + V[X_r]\\[0.7em]
&= r\frac{1-p}{p^2}\\[0.7em]
\end{align}

再生性

再生性を示すためには,再生性を示したい分布に従う独立な二つの確率変数を考え,その和のモーメント母関数(離散分布の場合はモーメント母関数)を計算したときに,パラメータが和の形になっていることを示します。

確率母関数の形に注目すると,二項分布の再生性を示したときと全く同様にして再生性を示すことができます。さて,ここで負の二項分布が「負の」二項分布と呼ばれている由来をお伝えしておきます。上では確率母関数を幾何分布に従う確率変数の和や一般二項定理を利用して計算してきました。実は,負の二項分布の確率母関数の導出にはもう1つの方法があり,そこで二項係数を負の値まで拡張した負の二項係数を導入するのです。この導出方法こそが,負の二項分布の由来となっています。実際に,負の二項係数を導入して負の二項分布の確率母関数を導出してみましょう。まずは,負の二項係数の確認です。

\begin{align}
{}_{-r}C_{x} &=\frac{(-r)(-r-1) \cdots\left\{ -r-(x-1)\right\}}{x !} \\[0.7em]
&=(-1)^{x} \frac{r(r+1) \cdots(r+x-1)}{x !} \\[0.7em]
&=(-1)^{x} {}_{x+r-1} C_{x}
\end{align}

そして,二項定理の公式を負の二項定理に利用すれば,以下の等式が成り立つことに注意しましょう。

\begin{align}
\sum_{k=0}^{n} {}_{n} C_{k} x^{k} y^{n-k}=(x+y)^{n} \label{equation:二項定理の和}
\end{align}

これらの式を使って確率母関数を計算します。

\begin{align}
E[s^x] &= \sum_{x=0}^{\infty} s^x {}_{x+r-1}C_{x}p^r (1-p)^x\\[0.7em]
&= p^r\sum_{x=0}^{\infty} s^x (-1)^x {}_{-r}C_{x} (1-p)^x\\[0.7em]
&= p^r\sum_{x=0}^{\infty} {}_{-r}C_{x} \left\{ -(1-p)s\right\}^x\\[0.7em]
&= p^r\sum_{x=0}^{\infty} {}_{-r}\mathrm{C}_{x} \left\{ -(1-p)s\right\}^x \cdot (1)^{-r-x}\\[0.7em]
&= p^r \left\{ 1-(1-p)s \right\}^{-r} \quad (\because \text{式(\ref{equation:二項定理の和})より})\\[0.7em]
&= \left\{ \frac{p}{1-(1-p)s} \right\}^r
\end{align}

ロードマップ

確率分布のロードマップ

さて,ロードマップに戻りましょう。 負の二項定理は二項定理を一般に拡張したテイラー級数を利用して母関数が求められました。また,幾何分布に従う確率変数の和としても定義できました。逆に言えば,負の二項定理において$r=1$という特殊な場合が幾何分布に相当するということになります。

シェアはこちらからお願いします!
URLをコピーする
URLをコピーしました!

コメント

コメントする