【これなら分かる!】指数分布とは

zuka

こんにちは。
zuka(@beginaid)です。

本記事は「これなら分かる!はじめての数理統計学」シリーズに含まれます。

もし不適切な内容があれば,記事下のコメント欄又はお問い合わせフォームよりご連絡下さい。

指数分布

ポアソン分布は単位時間あたりの生起確率を表しているのに対し,指数分布は事象の生起間隔の確率を与え,$\Exp (\lambda)$と表します。指数分布に再生性はありません。ロードマップ中では,ガンマ分布の特殊ケース$\Ga (1, \lambda)$に相当します。指数分布の最も合理的な導入方法は,危険率$\lambda$が一定な確率分布として計算する方法で,$x > 0$,$\lambda > 0$で定義されます。

\begin{align}
f_{X}(x) &= \lambda e^{-\lambda x} \\[0.7em]
M_{X}(t) &= \frac{1}{1-t/\lambda} \\[0.7em]
E[X] &= \lambda \\[0.7em]
V[X] &= \lambda^2
\end{align}

確率密度関数

指数分布は幾何分布を連続時間に拡張して得られる分布です。事象$X$は時刻$t$が取りうる範囲$0 \leq t<\infty$の中で必ず1回$だ$け起こるものとし,時刻$t$で$X$が起こったことを確率変数$T$を用いて$T=t$と表すことにします。ある時刻$t_{1} \geq 0$より前に$X$が起こらなかった場合には,$t_{1}$から時間$\Delta t$の間に事象$X$が起きる確率は,$\Delta t$が一定であれば$t_{1}$に関わらず常に一定の値$q(\Delta t)$であるとします。この仮定を無記憶性と呼びます。これはすなわち,確率変数

\begin{align}
P\left(t_{1} \leq T<t_{1}+\Delta t | T \geq t_1 \right)=q(\Delta t)
\end{align}

を満たす性質のことを指します。無記憶性は条件付き確率で定義されることに注意してください。

ちなみに,無記憶性をもつ離散型確率分布は幾何分布のみで,無記憶性をもつ連続型確率分布は指数分布のみです。指数分布が幾何分布の連続拡張であることに矛盾しませんね。逆に言えば,時間間隔に関して無記憶性を仮定して導出される唯一の確率分布は指数分布ということになります。

さて,$0$と$(n-1) \Delta t$の間$(n=1,2,3, \cdots)$で$X$が起こらず,$(n-1) \Delta t$と$n \Delta t$の間で起こる確率は,

\begin{align}
P((n-1) \Delta t \leq T<n \Delta t)=(1-q(\Delta t))^{n-1} q(\Delta t)
\end{align}

とります。等比級数の和の公式より,時刻$n\Delta t=t$までに事象$X$が起こる確率は

\begin{align}
q(n \Delta t)
&=P(0 \leq T<n \Delta t) \\[0.7em]
&=\sum_{k=1}^{n} P\left((k-1) \Delta t \leq T<k \Delta t | T\geq (k-1)\Delta t\right) \\[0.7em]
&=\frac{1-(1-q(\Delta t))^{n}}{q(\Delta t)} q(\Delta t)\\[0.7em]
&= 1-(1-q(\Delta t))^{n} \\[0.7em]
&=1-(1-q(\Delta t))^{\frac{t}{\Delta t}}
\end{align}

となります。$\Delta t \rightarrow 0$のとき,$t$は連続型変数に近似されます。$\Delta t$に対して定数$\Delta t^{\ast}$と微小量$n^{\ast}$を導入してロピタルの定理を用いれば,

\begin{align}
\lim_{\Delta t \rightarrow 0} \frac{q(\Delta t)}{\Delta t}
&= \lim_{n^{\ast} \rightarrow 0}
\frac{q(\Delta t^{\ast})}{n^{\ast}\Delta t^{\ast}}\\[0.7em]
&= \lim_{n^{\ast} \rightarrow 0}
\frac{1-(1-q(\Delta t^{\ast}))^{n^{\ast}}}{n^{\ast}\Delta t^{\ast}}\\[0.7em]
&= \lim_{n^{\ast} \rightarrow 0}
\frac{-(1-q(\Delta t^{\ast}))^{n^{\ast}} \ln (1-q(\Delta t^{\ast}))}{\Delta t^{\ast}}\\[0.7em]
&= \frac{\ln (1-q(\Delta t^{\ast}))}{\Delta t^{\ast}}\\[0.7em]
&\triangleq \lambda
\end{align}

と$q(\Delta t)$の導関数は定数に収束することが分かります。ただし,定数を$\lambda$と置きました。

なお,$n^{\ast}\rightarrow 0$のとき $1-(1-q(\Delta t^{\ast}))^{n^{\ast}}$と$n^{\ast}\Delta t^{\ast}$はどちらも$0$に収束し,$n^{\ast}=0$の周辺で$n^{\ast} \Delta t^{\ast} \neq 0$であることから,ロピタルの定理が適用できます。

さて,$q(n\Delta t)=q(t)$に対して$\Delta t \rightarrow 0$の極限を考えます。

\begin{align}
\lim_{\Delta t \rightarrow 0} q(n \Delta t)
&= \lim_{\Delta t \rightarrow 0} \left\{ 1-(1-q(\Delta t))^{\frac{t}{\Delta t}}\right\} \\[0.7em]
&=1-\lim_{n^{\ast} \rightarrow 0} \left(1-q\left(n^{\ast} \Delta t^{\ast}\right)\right)^{\frac{t}{n^{\ast} \Delta t^{\ast}}} \\[0.7em]
&=1-\lim_{n^{\ast} \rightarrow 0} \left(1-\lambda n^{\ast} \Delta t^{\ast}\right)^{\frac{t}{n^{\ast} \Delta t^{\ast}}} \\[0.7em]
&=1-\lim_{n^{\ast} \rightarrow 0} \left(1-n^{\ast} \Delta t^{\ast} \lambda \right)^{(-\frac{1}{n^{\ast} \Delta t^{\ast} \lambda})(- \lambda t)} \\[0.7em]
&=1-e^{-\lambda t}
\end{align}

$q(t)$の定義より,これが指数分布の累積分布関数であることに注意すれば,指数関数の確率密度関数$f(t; \lambda)$は以下のようになります。

\begin{align}
f(t; \lambda) &= \frac{d q(t)}{dt} \\[0.7em]
&= \lambda e^{-\lambda t}
\end{align}

他にも,指数分布ポアソン分布から指数分布を導くこともできるほか,ガンマ分布の特殊な場合に相当し,危険率が一定の確率分布として定式化されます。危険率を用いた定式化はワイブル分布とGompertz分布導出の際に確認しますので,ここではポアソン分布からの導出も併せて確認します。ポアソン分布のページにもある通り,ポアソン分布はある一定時間における事象の起こる回数$X$を確率変数とし,事象の起こる回数の期待値を$\tau$とすれば,確率密度関数$f(x)$は以下のように表されます。

\begin{align}
f(x) &= \frac{e^{-\tau}\tau^x}{x!}
\end{align}

ここで,ある一定時間として$(0, t]$を考えます。単位時間における事象の起こる回数の期待値を$\lambda$とおけば,$\tau = \lambda t$となりますので,時間区間$(0, t]$において事象が起こるは回数を$X$とすると,$X$に関する確率密度関数は以下のように表されます。

\begin{align}
f(x) &= \frac{e^{-\lambda t}(\lambda t)^x}{x!}
\end{align}

さて,ここで新しく確率変数を定義します。$T$は事象が初めて起こるまでの待ち時間とします。すると,上で設定した事象の起こる回数$X$を使って,時間$t$まで事象が1回も起こっていない確率$p(T > t)$を記述することができます。なぜ時間$t$まで事象が1回も起こっていない確率が$p(T>t)$なのかというと,事象が起こるのは少なくとも時間$t$よりも長い時間待った後だからです。

\begin{align}
p(T > t) &= f(x=0) \\[0.7em]
&= e^{-\lambda t}
\end{align}

すると,$p(T<t)$の余事象$p(T \geq t)$は,事象が時刻$t$の直前まで起こらず時刻$t$で初めて起こった確率を表します。言い方を変えれば,事象が時刻$t$の直前まで起こらず時刻$t$で初めて起こった確率は,$T=0$から$T=t$までを考えたとき1回以上事象が起こった確率の和$p(T \geq t)$になります。

\begin{align}
p(T \geq t) &= 1 – p(T < t) \\[0.7em]
&= 1 – e^{-\lambda t}
\end{align}

さて,$p(T \geq t)$は1回しか起こらない事象が初めて起こるために要する時間$t$の累積分布関数にほかなりません。したがって,事象が初めて起こるまでの待ち時間の確率密度関数$g(t)$は以下のように求められます。

\begin{align}
g(t) &= \frac{d}{dt} (1 – e^{-\lambda t}) \\[0.7em]
&= \lambda e^{-\lambda t}
\end{align}

これが指数分布の確率密度関数になります。ちなみに,指数分布は微分方程式からも導出することができますが,それはワイブル分布導出の際に触れることにします。

モーメント母関数

モーメント母関数の定義に従って計算していきます。

\begin{align}
M(t; \lambda) &= E[e^{tx}] \\[0.7em]
&= \int_0^{\infty} e^{tx} \lambda e^{-\lambda x}dx \\[0.7em]
&= \int_0^{\infty} \lambda e^{(t -\lambda) x}dx
\end{align}

ここで,収束条件は$t-\lambda < 0$です。そのため,$t-\lambda \geq 0$の場合は指数関数のモーメント母関数は存在しません。しかし,モーメント母関数の定義より$t$は$0$に限りなく近いものとしてOKですので,以下は$t-\lambda < 0$としてモーメント母関数の計算を進めていきます。

\begin{align}
M(t; \lambda) &= \left[\frac{\lambda}{t-\lambda} e^{(t-\lambda)x} \right]_0^{\infty} \\[0.7em]
&= \left( 1-\frac{t}{\lambda} \right)^{-1}
\end{align}

平均・分散

連続分布の平均と分散を求める際には「モーメント母関数の性質」(離散分布の平均と分散を求める際には「確率母関数の性質」)を利用します。

まずは1次モーメントと2次モーメントを求めておきます。

\begin{align}
\frac{d}{dt} M(t; \lambda) &=
\frac{1}{\lambda} \left( 1 – \frac{t}{\lambda} \right)^{-2} \\[0.7em]
\frac{d^2}{dt^2} M(t; \lambda) &=
\frac{2}{\lambda^2} \left( 1 – \frac{t}{\lambda} \right)^{-3}
\end{align}

したがって,指数分布の平均と分散は以下のようになります。

\begin{align}
E[X] &= \left.\frac{d}{dt} M(t; \lambda) \right|_{t=0} \\[0.7em]
&= \frac{1}{\lambda} \\[0.7em]
V[X] &= E[X^2] – E[X]^2 \\[0.7em]
&= \left.\frac{d^2}{dt^2} M(t; \lambda) \right|_{t=0} – \frac{1}{\lambda^2}\\[0.7em]
&= \frac{2}{\lambda^2} – \frac{1}{\lambda^2}\\[0.7em]
&= \frac{1}{\lambda^2}
\end{align}

再生性

再生性を示すためには,再生性を示したい分布に従う独立な二つの確率変数を考え,その和のモーメント母関数(離散分布の場合はモーメント母関数)を計算したときに,パラメータが和の形になっていることを示します。

しかし,指数分布のモーメント母関数の積をとっても同じモーメント母関数の形が現れないため,指数関数に再生性はありません。

ロードマップ

確率分布のロードマップ

さて,ロードマップに戻りましょう。 指数分布は幾何分布の連続バージョンとして導入されました。ロードマップには記載はありませんがポアソン分布からも指数分布が導けることを示しました。指数分布がガンマ分布の特殊な場合であることはガンマ分布のページで示します。

シェアはこちらからお願いします!
URLをコピーする
URLをコピーしました!

コメント

コメントする