【これなら分かる!】ガンマ分布とは

zuka

こんにちは。
zuka(@beginaid)です。

本記事は「これなら分かる!はじめての数理統計学」シリーズに含まれます。

もし不適切な内容があれば,記事下のコメント欄又はお問い合わせフォームよりご連絡下さい。

ガンマ分布

負の二項分布に現れる階乗をガンマ関数を用いて表した分布をガンマ分布と呼び,$\Ga (n, \lambda)$と表します。ガンマ分布には再生性があります。ロードマップ中では,ガンマ分布は負の二項分布の連続バージョン,そして指数分布の拡張に相当しています。具体的には,指数分布に独立に従う確率変数の和が従う分布として定義されます。 負の二項分布の連続拡張や指数分布の一般化という文脈からも分かる通り,ガンマ分布は$X > 0$で定義されます。また,パラメータ$n$,$\lambda$は正定数で,モーメント母関数は$t < \lambda$の場合にのみ存在します。

\begin{align}
f_{X}(x) &= \frac{\lambda^{n}}{\Gamma(n)}x^n e^{-\lambda x} \\[0.7em]
M_{X}(t) &= \left( \frac{1}{1-t/\lambda} \right)^{n} \\[0.7em]
E[X] &= \frac{n}{\lambda} \\[0.7em]
V[X] &= \frac{n}{\lambda^2}
\end{align}

ただし,$\Gamma(\cdot)$はガンマ関数を表す。

\begin{align}
\Gamma(n) &= \int_0^{\infty}t^{n-1}e^{-t}dt
\end{align}

確率密度関数

ガンマ分布は指数分布に独立に従う確率変数の和が従う分布として定義されます。ここでは,モーメント母関数とガンマ関数の定義を利用して導出していきます。まず,$X_1, \ldots, X_{\alpha}$がそれぞれ指数分布$\mathrm{Exp}(\beta)$に従っているとします。すると,$Y = X_1 + \ldots + X_{\alpha}$のモーメント母関数は以下のようになります。

\begin{align}
M_{Y}(t) &= M_{X_1+\ldots+X_{\alpha}}(t) \\[0.7em]
&= M_{X_1}(t) \cdots M_{X_{\alpha}(t)} \\[0.7em]
&= \left( 1-\frac{t}{\beta} \right)^{-\alpha} \\[0.7em]
&= \left( \frac{\beta}{\beta – t} \right)^{\alpha}
\end{align}

ただし,指数分布のモーメント母関数の条件より$t < \beta$です。ガンマ分布の確率密度関数を$f(x)$とおけば,モーメント母関数の定義より,以下が成り立ちます。

\begin{align}
\int_{0}^{\infty} e^{tx} f(x)dx &= \left( \frac{\beta}{\beta – t} \right)^{\alpha} \label{gamma関数の形を定める式}
\end{align}

ここから先の方針は大きく2つに分かれます。1つ目は天下り的にガンマ分布を持ちだす方法。2つ目は愚直に積分計算を行う方法です。順番に見ていきましょう。

天下り要素が多い導出方法

ここでは,ガンマ分布を天下り的に持ち出す導出方法をお伝えしていきます。式($\ref{gamma関数の形を定める式}$)を満たす$f(x)$を天下り的に与え,それがしっかりと式($\ref{gamma関数の形を定める式}$)を満たすことを確認していくという方法です。

この方法は例えば「ガンマ分布の確率密度関数が…で表されることを示せ」という問題に利用することができます。この類の問題ではガンマ分布の確率密度関数が天下り的に与えられていますから,モーメント母関数が式($\ref{gamma関数の形を定める式}$)で表されることを示すだけでOKということです。

$f(x)$は以下のような形をしていれば式($\ref{gamma関数の形を定める式}$)を満たすことが知られています。

\begin{align}
f(x) &= \frac{\beta^{\alpha}}{\Gamma(\alpha)}x^\alpha\exp(-\beta x) \label{ガンマ関数の確率密度関数}
\end{align}

ただし,$\Gamma(\alpha)$はガンマ関数と呼ばれていて,以下のような関数を表します。

\begin{align}
\Gamma(\alpha) &= \int_{0}^{\infty} t^{\alpha – 1} e^{-t} dt
\end{align}

もうこのガンマ関数の定義は定義として覚えるしかありません。さて,先ほどの式($\ref{gamma関数の形を定める式}$)に代入してみましょう。

\begin{align}
\int_{0}^{\infty} e^{tx} f(x)dx
&= \int_{0}^{\infty} e^{tx} \frac{\beta^{\alpha}}{\Gamma(\alpha)} x^{\alpha – 1} e^{-\beta x} dx \\[0.7em]
&= \frac{\beta^{\alpha}}{\Gamma(\alpha)} \int_{0}^{\infty} x^{\alpha – 1} e^{-(\beta – t)x} dx
\end{align}

ここで,第二項目の形がガンマ関数に似ていることに着目します。なぜガンマ関数を持ち出すことを思いつくのかというと,結局我々の目標は上式を計算して$\{ \lambda/(\lambda – t) \}^n$となることを示すことですので,第一項目の分母に表れているガンマ関数$\Gamma(\alpha)$を消したい気持ちがあるからです。

第二項目の形をガンマ関数の形に近づけるため,ガンマ関数において$t = \beta x$という変数変換を利用します。

\begin{align}
\int_{0}^{\infty} x^{\alpha – 1} e^{-\beta x} dx &= \frac{\Gamma(\alpha)}{\beta^{\alpha}}
\end{align}

すると,先ほどの計算式は以下のようになります。

\begin{align}
\int_{0}^{\infty} e^{tx} f(x)dx
&= \frac{\beta^{\alpha}}{\Gamma(\alpha)} \cdot \frac{\Gamma(\alpha)}{(\beta – t)^{\alpha}}\\[0.7em]
&= \left( \frac{\beta}{\beta – t} \right)^{\alpha}
\end{align}

以上から,$f(x)$を式($\ref{ガンマ関数の確率密度関数}$)のように定めれば($\ref{gamma関数の形を定める式}$)を満たしますので,ガンマ分布の確率密度関数が$f(x)$でることを示すことができました。

天下り要素の少ない導出方法

個人的には上記方法はスッキリしているものの,天下り要素が強すぎて,ガンマ関数の形に必然性を持たせられないと考えています。そこで,実際に$Y$の積分を実行してあげることでガンマ分布の形を導出するという方法をとることもできます。一般に,$X$が$p(x)$に従うとき,$Y=f(X)$は$\int\delta(y-f(x))p(x)dx$に従うことを利用します。

\begin{align}
&f(y) \notag \\[0.7em]
&=\beta^{\alpha} \int \delta(y – x_1-\ldots-x_\alpha)e^{-\beta\left(x_{1}+x_{2}+\cdots+x_{\alpha}\right)} d x_{1} d x_{2} \cdots d x_{\alpha} \label{ガンマ分布の積分計算}
\end{align}

ここで,$y=x_1+\ldots+x_{\alpha}$の関係式を使って代入法で$x_1$を消去して式(\ref{ガンマ分布の積分計算})に$y$を取り込みましょう。そうすることで,$dx_{1}, \ldots, dx_{\alpha}$をそれぞれバラシて計算することが可能になります。いま,$x_1$は指数分布に従っているので$x_1 \geq 0$です。したがって,$x_1 = y – (x_2 + \ldots + x_{\alpha}) \geq 0$が成り立ちます。ですから,$x_2$に関する条件として$x_2 \leq z – (x_3 + \ldots + x_{\alpha})$が得られます。

ここで,$x_2 \geq 0$に注意すると,$0 \leq z – (x_3 + \ldots + x_{\alpha})$となり,結局$x_3 \leq z – (x_4 + \ldots + x_{\alpha})$が得られます。これを次々適用していくことで,式(\ref{ガンマ分布の積分計算})は以下のように各変数に関する積分にバラすことができます。

\begin{align}
f_{\alpha}(y)
&=\beta^{\alpha} e^{-\beta y} \int_{0}^{y} d x_{\alpha} \int_{0}^{y-x_{\alpha}} d x_{\alpha-1} \cdots \int_{0}^{y-\left(x_{4}+\cdots+x_{\alpha}\right)} d x_{3} \int_{0}^{y-\left(x_{3}+x_{4}+\cdots+x_{\alpha}\right)} d x_{2}
\label{バラした後のガンマ分布の積分}
\end{align}

実は,式(\ref{バラした後のガンマ分布の積分})を計算していく途中で階乗の形が現れるため,ガンマ関数が必然的に登場するのです。実際に計算していきましょう。一番右側の積分から注目していきます。

\begin{align}
\int_{0}^{y-\left(x_{3}+x_{4}+\cdots+x_{\alpha}\right)} d x_{2}=\left\{y-\left(x_{4}+\cdots+x_{\alpha}\right)\right\}-x_{3}
\end{align}

この結果をすぐ左側の積分の中身に移動させます。

\begin{align}
&\int_{0}^{y-\left(x_{4}+\cdots+x_{n}\right)}\left[\left\{y-\left(x_{4}+\cdots+x_{n}\right)\right\}-x_{3}\right] d x_{3} \notag \\[0.7em]
&=\frac{1}{2 !}\left\{y-\left(x_{4}+\cdots+x_{n}\right)\right\}^{2} \\[0.7em]
&=\frac{1}{2 !}\left[\left\{y-\left(x_{5}+\cdots+x_{n}\right)\right\}-x_{4}\right]^{2}
\end{align}

これを次々に計算していくと,最終的に以下の積分を得ます。

\begin{align}
\frac{1}{(n-2) !} \int_{0}^{y}\left(y-x_{\alpha}\right)^{\alpha-2} d x_{n}
&=\frac{1}{(\alpha-1) !}\left[-\left(y-x_{\alpha}\right)^{\alpha-1}\right]_{0}^{y} \\[0.7em]
&=\frac{1}{(\alpha-1) !} y^{\alpha-1}
\end{align}

したがって,ガンマ分布の確率密度関数$f(x)$は以下のようになります。

\begin{align}
f(x) &= \frac{\lambda^{\alpha}}{(\alpha-1) !} y^{\alpha-1} e^{-\beta y}
\end{align}

最後に少しだけ天下り的ですが,階乗の一般化としてのガンマ関数$(\alpha-1)!=\Gamma(\alpha)$を用いれば,ガンマ分布の確率密度関数を導出することができます。

負の二項分布との関係

ガンマ分布とポアソン分布は負の二項分布とも深い関係があります。ポアソン分布のパラメータ$\lambda$がガンマ分布に従っているとき,つまりポアソン分布とガンマ分布の混合分布が負の二項分布になります。具体的には,ポアソン分布とガンマ分布の確率密度関数の積を積分することで負の二項分布が導かれます。なぜ2つの分布の積を積分するのかというと,混合分布の定義が積の積分で定義されているからです。定性的には,ガンマ分布に従って生成された$\lambda$を用いて定められるポアソン分布に関して,全ての考えられる$\lambda$を考えたいからです。ポアソン分布もガンマ分布も定義域が$[0, \infty)$であることに注意しましょう。

\begin{alignat}{2}
\int_{0}^{\infty} \left(\frac{\lambda^x}{x!} e^{-\lambda} \right)&\cdot\left(\frac{\beta^{\alpha}}{\Gamma(\alpha)} \lambda^{\alpha-1}e^{-\beta \lambda}\right) d\lambda\notag \\[0.7em]
&= \frac{\beta^\alpha}{x! \Gamma(\alpha)} \int_{0}^{\infty}
\lambda^{x+\alpha-1}e^{-(\beta + 1)\lambda} d\lambda \\[0.7em]
&= \frac{\beta^\alpha}{x! \Gamma(\alpha)} \frac{\Gamma(x+\alpha)}{(\beta + 1)^{x+\alpha}}\quad&&(\because \text{ガンマ関数の定義})\label{ガンマ関数で特殊な場合} \\[0.7em]
&= \frac{(x+\alpha-1)!}{x! (\alpha-1)!}\beta^{\alpha}(1+\beta)^{-(x+\alpha)}\quad&&(\because \Gamma(n)=(n-1)!)\\[0.7em]
&= \frac{(x+\alpha-1)!}{x! (\alpha-1)!}\left(\frac{1-p}{p}\right)^{\alpha} p^{x+\alpha}\quad &&(\because \beta = (1-p)/p\text{とおいた})\\[0.7em]
&= {}_{x+\alpha-1}C_{\alpha – 1}p^x (1-p)^\alpha\quad &&(\because \text{二項系数の定義})
\end{alignat}

$\lambda$の確率的な変動をガンマ分布として考慮した分布が負の二項分布になるということです。さらに,式(\ref{ガンマ関数で特殊な場合})で連続値であるガンマ関数を離散値である階乗として表していることから,負の二項分布はガンマ分布の離散バージョンであるという解釈もできます。

ポアソン過程との関係

ガンマ分布はポアソン過程と密接な関係があります。ポアソン過程というのは,ポアソン分布において$\lambda$を$\lambda t$に拡張したものです。このように,「単位時間あたり」を任意の時間間隔$[0, t]$に拡張した概念を確率過程と呼びます。すなわち,ポアソン過程は以下のように表されます。

\begin{align}
p(t) &= \frac{(\lambda t)^{k}e^{-\lambda t}}{k!}
\end{align}

ここで,ガンマ分布とポアソン過程の定性的な理解を今一度確認しましょう。ガンマ分布は,ある事象が$n$回発生するまでの時間を表します。一方,ポアソン過程は区間$[0, w]$における事象の発生回数を表します。したがって,ガンマ分布を$W > w$で積分したものは,事象が$n$回発生するまでに要する時間が$w$よりも長い確率を表します。これは,区間$[0, w]$における事象の発生回数が$n$未満である確率に等しいため,ガンマ分布の累積密度関数とポアソン過程の累積密度関数には以下のような関係があります。

\begin{align}
\int_{w}^{\infty} \frac{\lambda^n}{\Gamma(n)} t^{n-1} e^{-\lambda t} dt
&= \sum_{k=1}^{n-1} (\lambda w)^k \frac{e^{-\lambda t}}{k!} \label{ガンマ分布とポアソン過程}
\end{align}

これは,次のように解釈することができます。$Y$をある製品が危険率$\lambda$の下で故障するまでの時間を表すとします。すると,$Y\sim \mathrm{Exp}(\lambda)$となります。これを$n$個の製品について考えます。$Y_1, \ldots, Y_n$が独立に$\mathrm{Exp(\lambda)}$に従うとすれば,$W=Y_1+\ldots+Y_n$は$n$個の製品が故障するまでの時間を表しています。これは,ガンマ分布の定義から$W\sim \Gamma(n, \lambda)$になります。ここで,ポアソン過程の定性的な理解からも分かる通り,$[0, w]$に故障する製品の個数を$X$とすれば,$X\sim \mathrm{Po}(\lambda w)$となります。すると,先ほどの式(\ref{ガンマ分布とポアソン過程})は改めて下のように表すことができます。

\begin{align}
P(W > w) = P(X \geq k-1)
\end{align}

式(\ref{ガンマ分布とポアソン過程})は定性的に導かれましたが,実際に部分積分と$\Gamma(n)=(n-1)!$を用いて確認することができます。左辺のガンマ分布の累積密度関数を部分積分してみましょう。

\begin{align}
\int_{w}^{\infty}\frac{\lambda^n}{\Gamma(n)} t^{n-1}e^{-\lambda t}dt
&= \frac{\lambda^n}{(n-1)!} \int_{w}^{\infty}
t^{n-1}\left(-\frac{e^{-\lambda t}}{\lambda} \right)’dt \\[0.7em]
&= e^{-\lambda w}\frac{(\lambda w)^{n-1}}{(n-1)!}\int_{w}^{\infty} \frac{\lambda^{n-1}}{(n-2)!}t^{n-2}e^{-\lambda t} dt\\[0.7em]
&= (\lambda w)^{n-1}\frac{e^{-\lambda w}}{(n-1)!}
+ \int_{w}^{\infty} \frac{\lambda^{n-1}}{\Gamma(n-1)}t^{n-2}e^{-\lambda t} dt
\end{align}

この操作を繰り返し適用することで,ガンマ分布の累積密度関数の積分からポアソン過程の形を抽出することができ,結果的に式(\ref{ガンマ分布とポアソン過程})が導かれます。

モーメント母関数

先ほど導出したように,ガンマ分布のモーメント母関数は以下のようになります。

\begin{align}
M_{X}(t) &= \left( \frac{\beta}{\beta – t} \right)^{\alpha} \quad (t < \beta)
\end{align}

平均・分散

連続分布の平均と分散を求める際には「モーメント母関数の性質」(離散分布の平均と分散を求める際には「確率母関数の性質」)を利用します。まずは1次モーメントと2次モーメントを求めておきましょう。

\begin{align}
\frac{d}{dt} M(t)
&= \frac{\alpha}{\beta} \left( 1-\frac{t}{\beta} \right)^{-\alpha – 1} \\[0.7em]
\frac{d^2}{dt^2} M(t)
&= \frac{\alpha}{\beta^2}(\alpha + 1) \left( 1-\frac{t}{\beta} \right)^{-\alpha – 2}
\end{align}

したがって,指数分布の平均と分散は以下のようになります。

\begin{align}
E[X]
&= \left.\frac{d}{dt} M(t) \right|{t=0} \\[0.7em]
&= \frac{\alpha}{\beta} \\[0.7em]
V[X]
&= E[X^2] – E[X]^2 \\[0.7em]
&= \left.\frac{d^2}{dt^2} M(t) \right|{t=0} – \frac{\alpha^2}{\beta^2}\\[0.7em]
&= \frac{\alpha}{\beta^2}(\alpha + 1) – \frac{\alpha^2}{\beta^2}\\[0.7em]
&= \frac{\alpha}{\beta^2}
\end{align}

再生性

再生性を示すためには,再生性を示したい分布に従う独立な二つの確率変数を考え,その和のモーメント母関数(離散分布の場合はモーメント母関数)を計算したときに,パラメータが和の形になっていることを示します。

$X_1\sim \mathrm{\mathrm{Ga}}(\alpha_1, \beta)$,$X_2\sim \mathrm{Ga}(\alpha_2, \beta)$を独立にガンマ分布に従う2つの確率変数とします。このとき,$X_1+X_2$のモーメント母関数を考えます。

\begin{align}
M_{X_1 + X_2}(t) &= M_{X_1}(t) \cdot M_{X_2}(t) \\[0.7em]
&= \left( \frac{\beta}{\beta – t} \right)^{\alpha_1}
\cdot \left( \frac{\beta}{\beta – t} \right)^{\alpha_2}\\[0.7em]
&= \left( \frac{\beta}{\beta – t} \right)^{\alpha_1 + \alpha_2}
\end{align}

これは,$X_1+X_2$のモーメント母関数が$\mathrm{Ga}(\alpha_1 + \alpha_2, \beta)$の母関数であることを示しています。つまり,$X_1+X_2\sim \mathrm{Ga}(\alpha_1 + \alpha_2, \beta)$であり,ガンマ分布の再生性を示しています。

ロードマップ

確率分布のロードマップ

さて,ロードマップに戻りましょう。 ガンマ分布は指数分布に独立に従う確率変数の和が従う分布として定義されます。ガンマ関数をもちだす際に天下り要素が多い方法と少ない方法がありました。また,ポアソン過程と関係があるだけでなく,ポアソン分布における$\lambda$の確率的な変動をガンマ分布として考慮した分布が負の二項分布になることも示しました。

シェアはこちらからお願いします!
URLをコピーする
URLをコピーしました!

コメント

コメントする