【これなら分かる!】対数正規分布とは

zuka

こんにちは。
zuka(@beginaid)です。

本記事は「これなら分かる!はじめての数理統計学」シリーズに含まれます。

もし不適切な内容があれば,記事下のコメント欄又はお問い合わせフォームよりご連絡下さい。

対数正規分布

確率変数$X \sim \N (\mu, \sigma^2)$に対して,

\begin{align}
Y &= e^{X}
\end{align}

とおいたときに,$Y$が従う分布を対数正規分布と呼びます。$\log X$が正規分布に従うことが名前の由来になっています。対数正規分布のモーメント母関数は存在しません。対数正規分布には再生性はありません。ロードマップ中では対数正規分布は正規分布からの変数変換に相当します。注意点として,確率密度関数中の$\mu$と$\sigma^2$は正規分布とは異なってそれぞれ平均と分散には対応しません。定義から分かる通り,$X > 0$となります。

\begin{align}
f_{X}(x) &= \frac{1}{\sqrt{2\pi\sigma^2}}\frac{1}{x}\exp\left\{ -\frac{1}{2\sigma^2} (\log x-\mu)^2 \right\} \\[0.7em]
E[X] &= e^{\mu + \sigma^2/2} \\[0.7em]
V[X] &= e^{2\mu + \sigma^2}\left( e^{\sigma^2}-1 \right)
\end{align}

確率密度関数

$X\sim \mathcal{N}(\mu, \sigma)$のとき,$Y=\log X$の従う分布が対数正規分布になります。実際に計算していきましょう。$\frac{dy}{dx} = \frac{1}{x}$を踏まえれば,$f(x)$を正規分布の確率密度関数,$g(x)$を対数正規分布の確率密度関数として,以下が成り立ちます。

\begin{align}
f(x) dx &= g(y) dy \\[0.7em]
f(x) &= g(y) \frac{dy}{dx} \\[0.7em]
&= \frac{g(\log x)}{x}
\end{align}

従って,$f(x)$は以下のように表されます。

\begin{align}
f(x) &= \frac{1}{\sqrt{2\pi \sigma^2}x} \exp\left\{-\frac{(\log x – \mu)^2}{2 \sigma^2}\right\}
\end{align}

モーメント母関数

対数正規分布のモーメント母関数が存在しないことを確認します。モーメント母関数の定義に従って計算していきます。$x > 0$に注意します。

\begin{align}
M_{X}(t) &= E[e^{tX}] \\[0.7em]
&= \int_{0}^{\infty} \frac{1}{\sqrt{2\pi \sigma^2}x} \exp\left\{ -\frac{1}{2\sigma^2} (\log x-\mu)^2 + tx \right\}
\end{align}

さて,$x \rightarrow \infty$のときに右辺が発散することを示します。$x$に関わりのない定数項を除けば,被積分関数を$h$として,その対数$\log h$は以下のようになります。

\begin{align}
\log h &= \log \frac{1}{x \exp\left\{ -\left( \log x \right)^2 – \log x + tx \right\}} \\[0.7em]
&= – x + \left( \log x \right)^2 + \log x – tx
\end{align}

ここで,$x \geq x + 1$を利用して$h$を下からおさえます。分かりやすさのため,途中で$\log x = z$とおきます。

\begin{align}
h &\geq -(\log x + 1) + \left( \log x \right)^2 + \log x – t(\log x + 1) \\[0.7em]
&\propto z^2 – tz \\[0.7em]
&\longrightarrow \infty\quad (z \rightarrow \infty)
\end{align}

$ z \rightarrow \infty $のとき$h$は発散しますから, $ x \rightarrow \infty $のときも$g$は発散します。したがって,モーメント母関数の被積分関数が$ x \rightarrow \infty $で発散することが示せたため,モーメント母関数が存在しないことが確認できました。

平均・分散

対数正規分布の平均と分散は,正規分布のモーメント母関数を利用して美しく求めることができます。$X\sim \mathcal{N}(\mu, \sigma)$のとき,$\log X$が従う分布が対数正規分布でした。$X$のモーメント母関数は以下の通りです。

\begin{align}
M(t; \mu, \sigma^2) &= E[e^{tX}] \\[0.7em]
&= \exp\left(\mu t + \frac{\sigma^2 t^2}{2} \right)
\end{align}

モーメント母関数は$t$の関数ですので,$X$のモーメント母関数において$X$を$\log X$に置き換えることができます。すると,以下のような変形ができます。

\begin{align}
E[e^{t\log X}] &= E[X^t] \\[0.7em]
&= \exp\left(\mu t + \frac{\sigma^2 t^2}{2} \right)
\end{align}

なんと,対数正規分布の$t$次モーメントが正規分布のモーメント母関数に対応していることが分かりました。ですので,平均と分散は正規分布のモーメント母関数を$M(t; \mu, \sigma^2)$として,以下のようにして簡単に求められます。

\begin{align}
E[X] &= M(1; \mu, \sigma^2) \\[0.7em]
&= \exp\left(\mu + \frac{\sigma^2}{2} \right) \\[0.7em]
V[X] &= M(2; \mu, \sigma^2) – \left\{ M(1; \mu, \sigma^2) \right\}^2 \\[0.7em]
&= \exp\left(2 \mu + 2 \sigma^2 \right) – \exp\left(2 \mu + \sigma^2 \right) \\[0.7em]
&= \exp\left(2 \mu + \sigma^2 \right) \left\{\exp\left( \sigma^2 – 1 \right) \right\}
\end{align}

再生性

再生性を示すためには,再生性を示したい分布に従う独立な二つの確率変数を考え,その和のモーメント母関数(離散分布の場合はモーメント母関数)を計算したときに,パラメータが和の形になっていることを示します。

対数正規分布はモーメント母関数が存在しないことからも分かる通り,再生性をもちません。一方,確率変数の積に対しては再生性をもちます。なぜなら,

\begin{align}
X\sim \mathcal{N}(\mu_x, \sigma_x) \\[0.7em]
Y\sim \mathcal{N}(\mu_y, \sigma_y)
\end{align}

に対して

\begin{align}
X+Y &\sim \calN (\mu_x+\mu_y, \sigma_x+\sigma_y)
\end{align}

が成り立ちますので,

\begin{align}
\log X\sim \mathcal{N}(\mu_x, \sigma_x) \\[0.7em]
\log Y\sim \mathcal{N}(\mu_y, \sigma_y)
\end{align}

に対して

\begin{align}
\log X + \log Y &= \log XY \\[0.7em]
&\sim \calN (\mu_x+\mu_y, \sigma_x+\sigma_y)
\end{align}

が成り立つからです。

ロードマップ

確率分布のロードマップ

さて,ロードマップに戻りましょう。 対数正規分布は,正規分布に従う変数の対数が従う確率分布でしたね。

シェアはこちらからお願いします!
URLをコピーする
URLをコピーしました!

コメント

コメントする