本記事は「これなら分かる!はじめての数理統計学」シリーズに含まれます。
不適切な内容があれば,記事下のコメント欄またはお問い合わせフォームよりご連絡下さい。
ガンマ分布・ポアソン分布と負の二項分布
ガンマ分布とポアソン分布は,負の二項分布と深い関係があります。ポアソン分布のパラメータ$\lambda$がガンマ分布に従っているとき,それらの分布の混合が負の二項分布になります。定性的には,ガンマ分布に従って生成された$\lambda$を用いて定められるポアソン分布に関して,全ての考えられる$\lambda$を足し合わせた分布が負の二項分布になります。
本稿で用いる確率関数の定義はリンク先(ガンマ分布・ポアソン分布・負の二項分布)と同一とします。
さて,実際に計算していきます。ポアソン分布の定義域は$\{0,1,\ldots\}$で,ガンマ分布の定義域は$[0, \infty)$であることに注意して,ガンマ分布とポアソン分布の混合を計算します。
\int_{0}^{\infty} \left(\frac{\lambda^x}{x!} e^{-\lambda} \right)\cdot\left(\frac{\beta^{\alpha}}{\Gamma(\alpha)} \lambda^{\alpha-1}e^{-\beta \lambda}\right) d\lambda
&= \frac{\beta^\alpha}{x! \Gamma(\alpha)} \int_{0}^{\infty}
\lambda^{x+\alpha-1}e^{-(\beta + 1)\lambda} d\lambda \label{1}\\[0.7em]
&= \frac{\beta^\alpha}{x! \Gamma(\alpha)} \frac{\Gamma(x+\alpha)}{(\beta + 1)^{x+\alpha}} \label{2}
\end{align}
ただし,式($\ref{1}$)から式($\ref{2}$)はガンマ分布の定義を代入しました。ここで,$\alpha$が正の整数のときは,ガンマ分布と階乗の関係が利用できますので,
\frac{\beta^\alpha}{x! \Gamma(\alpha)} \frac{\Gamma(x+\alpha)}{(\beta + 1)^{x+\alpha}}
&= \frac{(x+\alpha-1)!}{x! (\alpha-1)!}\beta^{\alpha}(1+\beta)^{-(x+\alpha)} \label{3}\\[0.7em]
&= \frac{(x+\alpha-1)!}{x! (\alpha-1)!}\left(\frac{1-p}{p}\right)^{\alpha} p^{x+\alpha} \label{4}\\[0.7em]
&= {}_{x+\alpha-1}C_{\alpha - 1}p^{\alpha} (1-p)^{x}\label{5}
\end{align}
と変形できます。ただし,式($\ref{3}$)から式($\ref{4}$)は
\beta &= \frac{p}{1-p}
\end{align}
と置き,式($\ref{4}$)から式($\ref{5}$)は二項系数の定義を利用しました。
以上をまとめると,$\lambda$の確率的な変動をガンマ分布として考慮した分布が負の二項分布になるということです。さらに,式(\ref{3})で連続値であるガンマ関数を離散値である階乗として表していることから,負の二項分布はガンマ分布の離散バージョンであるという解釈もできます。
参考文献
本稿の執筆にあたり参考にした文献は,以下でリストアップしております。
コメント
コメント一覧 (2件)
ガンマ関数の定義が書かれていませんがおそらく,Ga(a, 1/b)と置いているのだと思います.
ガンマ分布はGa(a, b)やGa(a, λ)と書く(λ=1/b)のが通常ですので,上記の表記はかえって混乱を招く表記方法だと感じました.
たしかにおっしゃる通りですね。
竹村本でも久保川本でも尺度母数を用いてガンマ分布を表しています。
当サイトの記法を一括して修正する必要があるため,近日中に行う予定のリファクタと併せて対応します。