【これなら分かる!】ワイブル分布とは

zuka

こんにちは。
zuka(@beginaid)です。

本記事は「これなら分かる!はじめての数理統計学」シリーズに含まれます。

もし不適切な内容があれば,記事下のコメント欄又はお問い合わせフォームよりご連絡下さい。

ワイブル分布

指数分布は危険率が$\lambda$で一定の確率分布として導入しましたが,ワイブル分布は危険率が$ct^b$となる場合を考えます。他には,以下で導入される確率変数

\begin{align}
Y &= \frac{X^{b+1}}{b+1}
\end{align}

が指数分布$\Exp (c)$に従うときに,$X$が従う分布として導入する方法もあります。なお,モーメント母関数は$e^x$のテイラー展開とガンマ関数の定義を用いて導出できますが,平均と分散は別の方法(指数分布からの変数変換)を用いて求められますので,今回は割愛します。ワイブル分布には再生性はありません。ロードマップ中では,ワイブル分布は指数分布の一般化に相当します。指数分布同様,ワイブル分布は$X > 0$で定義されます。以下では,$\kappa = (b + 1)^{-1}$とおきます。

\begin{align}
f_{X}(x) &= cx^b \exp \left( -\frac{cx^{b+1}}{b+1} \right) \\[0.7em]
E[X] &= m\Gamma(1 + \kappa) \\[0.7em]
V[X] &= m^2 \left\{ \Gamma(1 + 2\kappa)-\Gamma^2(1+\kappa) \right\}
\end{align}

ただし,$\Gamma(\cdot)$はガンマ関数を表す。

\begin{align}
\Gamma(n) &= \int_0^{\infty}t^{n-1}e^{-t}dt
\end{align}

確率密度関数

ワイブル分布は危険率が$ct^b$で与えられる確率分布として定式化されます。さて,危険率という言葉が初めて出てきましたね。危険率$l(t)$は以下のように定義されます。

危険率

\begin{align}
l(t) \triangleq \lim_{\Delta \rightarrow 0}
\frac{1}{\Delta} p(t \leq T < t+\Delta | T \geq t)
\end{align}

この危険率の定性的な理解を促す補足をしておきます。以下の条件付き確率

\begin{align}
p(t \leq T < t+\Delta | T \geq t)
\end{align}

は,$T \geq t$であると分かっている状況において $t \leq T < t+\Delta$となる確率を表しています。 ここで,確率変数$T$を時刻$0$に誕生した人が死亡する時刻と定義することにします。 すると,以下の条件付き確率

\begin{align}
p(t \leq T < t+\Delta | T \geq t)
\end{align}

は,時刻$t$までは生きていると分かっている人が時刻$t$以降の$\Delta$時間経過する間に死亡する確率のことを表しています。

ですから, 条件付き確率$p(t \leq T < t+\Delta | T \geq t)$を $\Delta$で割ったものは,時刻$t$以降における単位時間あたりの死亡確率を表しています。 危険率は単位時間あたりの死亡確率において$\Delta \rightarrow 0$としたものですから,「時刻$t$まで生きている人が次の瞬間死亡する確率」を表していると言えます。

さて,危険率を別の角度から捉えてみます。これは指数分布・ワイブル分布・Gompertz分布導出の布石です。少々天下り的ですが,寿命が$t$以下であることを表す累積分布関数$F(t)$を導入します。

\begin{align}
F(t) \triangleq P(T \leq t)
\end{align}

危険率は「時刻$t$まで生きている人が次の瞬間死亡する確率」でしたから, 累積分布関数を用いて「時刻$t$まで生きている」確率を表したいです。 これは$p(T > t)$と表せますから, 累積分布関数の余事象$1 – F(t)$となります。 これで危険率を累積分布関数と紐づける準備ができました。 $F'(t)=f(t)$に注意すれば, 危険率を以下のように表すことができます。

\begin{align}
l(t) &= \lim_{\Delta \rightarrow 0}
\frac{1}{\Delta} p(t \leq T < t+\Delta | T \geq t) \\[0.7em]
&= \lim_{\Delta \rightarrow 0}
\frac{1}{\Delta} \frac{p(t \leq T < t+\Delta )}{p(T \geq t)}\quad(\because T \geq t \in t \leq T < t+\Delta ) \\[0.7em]
&= \frac{1}{p(T \geq t)} \lim_{\Delta \rightarrow 0}
\frac{F(t+\Delta) – F(t)}{\Delta} \quad (\because F(t)の定義より)\\[0.7em]
&= \frac{F'(t)}{1-F(t)}\\[0.7em]
&= -\frac{d}{dx}\ln \left\{ 1-F(t) \right\}
\end{align}

微分方程式の形に帰着しました。これで,危険率に関して条件を与えてあげることで$F(t)$が求まりますので,そこから$f(t)$を求めることができます。実際に微分方程式を解いてみましょう。

\begin{align}
-\frac{d}{dt}\ln \left\{ 1-F(t) \right\} &= l(t) \\[0.7em]
\ln \left\{ 1-F(t) \right\} &= -\int_{0}^{t}l(u)du + C_0 \\[0.7em]
F(t) &= 1 – C\exp\left\{-\int_{0}^{t}l(u)du \right\}
\end{align}

ここで,$F(0)$は寿命が$0$以下である確率を表していますから,$F(0)=0$になります。この初期条件を利用すれば,$C=1$となることが分かります。最後に,$F(t)$を微分して$f(t)$を求めます。

\begin{align}
f(t) &= \frac{d}{dt}F(t) \\[0.7em]
&= \frac{d}{dt} \left\{1-\exp\left(-\int_{0}^{t}l(u)du \right)\right\} \\[0.7em]
&= -\frac{d}{dt} \exp\left(-\int_{0}^{t}l(u)du \right) \label{eq:危険率導出の解}
\end{align}

さて,ここから指数分布・ワイブル分布・Gompertz分布導出を行なっていきたいと思います。指数分布は危険率が$l(t)=\lambda$で一定の確率分布です。式(\ref{eq:危険率導出の解})に代入します。

\begin{align}
f(t) &= -\frac{d}{dt} \exp\left(-\int_{0}^{t}\lambda du \right) \\[0.7em]
&= -\frac{d}{dt}\exp\left(-\lambda t \right) \\[0.7em]
&= \lambda e^{-\lambda t}
\end{align}

しっかり指数分布の確率密度関数が導出できました。続いて,ワイブル分布は危険率が$l(t)=ct^b$で与えられる確率分布です。式(\ref{eq:危険率導出の解})に代入します。

\begin{align}
f(t) &= -\frac{d}{dt} \exp\left(-\int_{0}^{t} cu^b du \right)\\[0.7em]
&= -\frac{d}{dt} \exp\left(- \frac{ct^{b+1}}{b+1} \right)\\[0.7em]
&= ct^b \exp\left(- \frac{ct^{b+1}}{b+1} \right)
\end{align}

これがワイブル分布の確率密度関数になります。Gompertz分布は危険率が$l(t)=ce^{bt}$で与えられる確率分布です。式(\ref{eq:危険率導出の解})に代入します。

\begin{align}
f(t) &= -\frac{d}{dt} \exp\left(-\int_{0}^{t} ce^{bu} du \right)\\[0.7em]
&= -\frac{d}{dt} \exp\left(-\frac{c}{b}e^{bt} + \frac{c}{b} \right) \\[0.7em]
&= -\frac{d}{dt}\left( -\frac{c}{b}e^{bt} \right)\cdot \exp\left(-\frac{c}{b}e^{bt} + \frac{c}{b}\right) \\[0.7em]
&= c\exp\left( bt – \frac{c}{b}e^{bt} + \frac{c}{b} \right)
\end{align}

これがGompertz分布の確率密度関数になります。

モーメント母関数

通常,モーメント母関数を求めるときはモーメント母関数の定義に従って計算していきます。しかし,ワイブル分布の モーメント母関数は$e^x$ののテイラー展開とガンマ関数の定義を用いて導出できますが,平均と分散は別の方法(指数分布からの変数変換)を用いて求められますので,今回は割愛します。

平均・分散

通常,連続分布の平均と分散を求める際には「モーメント母関数の性質」(離散分布の平均と分散を求める際には「確率母関数の性質」)を利用します。しかし,ワイブル分布の場合は指数分布からの変数変換を用いて平均と分散を求めることができますので,本記事でもその方針に従うことにします。

ワイブル分布のモーメント母関数は$e^x$のテイラー展開とガンマ関数の積になっており,計算が煩雑になってしまうために多くの場合は指数分布からの変数変換を用いてワイブル分布の期待値と分散を求めています。指数分布の確率密度関数とワイブル分布の確率密度関数を見比べると,以下で定義される確率変数$Y$が

\begin{align}
Y &= \frac{X^{b+1}}{b+1}
\end{align}

が指数分布$\mathrm{Exp}(c)$に従うときに,$X$が従う確率分布がワイブル分布であることが分かります。すると,$\kappa=(b+1)^{-1}$とおくと,$X={(b+1)Y}^{\kappa}$に注意すれば,期待値の性質から

\begin{align}
E[X]
&= E[{(b+1)Y}^{\kappa}]\\[0.7em]
&= (b+1)^{\kappa} E[Y^{\kappa}]
\end{align}

となります。$E[Y^{\kappa}]$は,式において$\alpha=1+\kappa$,$\beta=c$とおくことで計算することができます。

\begin{align}
E[Y^{\kappa}]
&= \int_{0}^{\infty} y^{\kappa} c\exp(-cy) dy \\[0.7em]
&= c \int_{0}^{\infty} y^{\kappa} c\exp(-cy) dy\\[0.7em]
&= c \frac{\Gamma(1+\kappa)}{c^{1+\kappa}} \\[0.7em]
&= \frac{\Gamma(1+\kappa)}{c^{\kappa}}
\end{align}

したがって,ワイブル分布の平均は以下のようになります。

\begin{align}
E[X] &= (b+1)^{\kappa} E[Y^{\kappa}] \\[0.7em]
&= \left(\frac{b+1}{c}\right)^{\kappa} \Gamma(1+\kappa)
\end{align}

同様に,式において$\alpha=2+\kappa$,$\beta=c$とおくことで$E[Y^{2\kappa}]$を計算してワイブル分布の分散を求めることができます。期待値の性質より,

\begin{align}
E[X^2] &= E[{(b+1)Y}^{2\kappa}]\\[0.7em]
&= (b+1)^{2\kappa} E[Y^{2\kappa}]
\end{align}

となることに注意すれば,

\begin{align}
E[Y^{2\kappa}]
&= \int_{0}^{\infty} y^{2\kappa} c\exp(-cy) dy \\[0.7em]
&= c \int_{0}^{\infty} y^{2\kappa} c\exp(-cy) dy\\[0.7em]
&= c \frac{\Gamma(1+2\kappa)}{c^{1+2\kappa}} \\[0.7em]
&= \frac{\Gamma(1+2\kappa)}{c^{2\kappa}}
\end{align}

と計算できますので,結局分散は以下のように求められます。

\begin{align}
V[X] &= E[X^2] – E[X]^2 \\[0.7em]
&= (b+1)^{2\kappa} E[Y^{2\kappa}]- \left(\frac{b+1}{c}\right)^{2\kappa} \Gamma^2(1+\kappa) \\[0.7em]
&= (b+1)^{2\kappa} \frac{\Gamma(1+2\kappa)}{c^{2\kappa}} – \left(\frac{b+1}{c}\right)^{2\kappa} \Gamma^2(1+\kappa)\\[0.7em]
&= \left(\frac{b+1}{c}\right)^{2\kappa} \left\{\Gamma(1+2\kappa) – \Gamma^2(1+\kappa) \right\}
\end{align}

再生性

再生性を示すためには,再生性を示したい分布に従う独立な二つの確率変数を考え,その和のモーメント母関数(離散分布の場合はモーメント母関数)を計算したときに,パラメータが和の形になっていることを示します。

ワイブル分布のモーメント母関数は$e^x$のテイラー展開とガンマ関数の積になっており,モーメント母関数の積を考えても同じ関数の形に帰着しないためワイブル分布に再生性はありません。

ロードマップ

確率分布のロードマップ

さて,ロードマップに戻りましょう。 ワイブル分布は指数分布の一般化として与えられました。これは,指数分布は危険率が一定の下で導出されるのに対し,ワイブル分布は危険率がべき乗で与えられた下で定義されることを示しています。

シェアはこちらからお願いします!
URLをコピーする
URLをコピーしました!

コメント

コメントする