【徹底解説】指数分布とは

本記事は「これなら分かる!はじめての数理統計学」シリーズに含まれます。

不適切な内容があれば,記事下のコメント欄またはお問い合わせフォームよりご連絡下さい。

指数分布

指数分布

(1)fX(x)=λeλx(2)MX(t)=11t/λ(3)E[X]=1λ(4)V[X]=1λ2

指数分布は事象の生起間隔の確率を与え,

(5)Exp(λ)

と表されます。ただし,λ>0とします。指数分布に従う確率変数Xに対し,実現値は

(6)xR+

であり,モーメント母関数の変数はtRとします。指数分布は再生性を持たず,ロードマップ中ではガンマ分布の特殊ケースGa(1,λ)に相当します。

確率密度関数

指数分布の確率密度関数の導出には,大きく分けて四つの方法があります。

  • 幾何分布の連続拡張として導出
  • 無記憶性の定義より導出
  • 危険率が一定となる確率分布として導出
  • ポアソン分布から導出

幾何分布の連続拡張として導出

時刻t[0,)を長さ1/nの区間に分割して,各区間のインデックスをkとおきます。ポアソン分布の導出と同様に,各区間で事象Aが起こる確率を,

(7)p=λn

で表し,nを考えます。ただし,λ>0とします。ここで,パラメータがp幾何分布を考えると,インデックスkで初めてAが起こる確率は,

(8)p(T=kn)=(1p)kp(9)=(1λn)kλn

となります。ただし,確率変数TAが初めて起こる時刻を表し,n,k,tの定義からt=k/nとなります。ここで,指数分布の確率密度関数をf(t)とおくと,確率密度関数の定義よりAが微小区間dtの中で初めて起こる確率は以下のように表されます。

(10)p(Tdt)=f(t)dt

t=k/nよりk=ntとなること,nのとき区間1/nは微小量になることからdtと表されることに注意すると,式(9)の極限は以下のように計算できます。

(11)f(t)dt=limnp(T=kn)(12)=limn(1λn)kλn(13)=limn(1λn)ntλ dt(14)=limnλ{(1λn)n/λ}λtdt(15)λeλtdt

ただし,ネイピア数eの定義を利用しました。以上より,指数分布の確率密度関数fは以下で表されることが分かりました。

(16)f(t)=λeλt

無記憶性の定義より導出

指数分布は,無記憶性を持つ連続型確率分布として導出されます。無記憶性の定義の左辺を条件付き確率の定義を用いて変形し,右辺を指数分布の累積密度関数Fを用いて書き直すと,以下のようになります。

(17)p(tT<t+Δt, Tt)p(Tt)=F(Δt)

ただし,上で述べた通りqが指数分布の累積密度関数そのものを表していることを利用しました。さて,左辺もFを用いて表すことで,式(17)をFに関する方程式に仕上げましょう。まず,分母に関しては累積密度関数の余事象を用いて表すことができます。分子に関しても,累積密度関数の差で表すことができます。したがって,式(17)は以下のように計算することができます。

(18)F(t+Δt)F(t)1F(t)=F(Δt)

私たちの目標は,Fを求めることでその導関数fを求めることです。左辺の分母が導関数の定義に似ていることに注目して,両辺をΔtで割ってみましょう。

(19)F(t+Δt)F(t)ΔtΔt1F(t)=F(Δt)Δt(20)=F(0+Δt)F(0)Δt

ただし,累積密度関数の定義よりF(0)=0であることを用いました。続けて,式(20)の両辺でΔ0の極限を取りましょう。

(21)f(t)1F(t)=f(0)

分かりやすさのため,S(t)=1F(t)と置き,式(21)を微分方程式の形に書き直してみます。

(22)S(t)S(t)=S(0)

この微分方程式を,F(0)=0f(0)=λの初期条件で解きます。

初期条件の妥当性を確認しておきます。F(0)=0は,累積密度関数の定義より必ず成り立ちます。f(0)=λは,危険率を用いて妥当性を確認することができますが,まとめて次のパートでお伝えすることにします。本パートでは,一旦微分方程式を解くための便宜上の仮定と理解しておいてください。

式(22)は変数分離形の微分方程式ですので,両辺をtで積分しましょう。

(23)logS(t)=S(0)t+C

ただし,Cは積分定数です。S(0)=f(0)であることに注意すると,S(t)は以下のように表されます。

(24)S(t)=Ceλt

ただし,定数はまとめてCと置きました。S(t)=1F(t)と置きましたので,指数分布の累積密度関数および確率密度関数は以下で表されます。

(25)F(t)=1Ceλt(26)f(t)=F(t)(27)=Cλeλt

確率密度関数の定義より,以下が成り立ちます。

(28)0Cλeλt=1

したがって,定数Cは以下のように表されます。

(29)C=(0λeλt)1(30)=1

以上より,指数分布の確率密度関数は以下のように表されることが分かりました。

(31)f(t)=λeλt

危険率が一定となる確率分布として導出

指数分布は,危険率が一定値λとなる確率分布として導入できます。危険率の定義より,以下が成り立ちます。

(32)limΔ01Δp(tT<t+ΔTt)=λ

危険率の定義と無記憶性の定義が非常に似ていることに注意すると,先ほどまでの「無記憶性の定義より導出」のパートを流用できることが分かります。すなわち,式(20)の左辺が危険率における極限の対象を表していますので,式(21)より危険率はf(0)であることが分かります。

(33)limΔ01Δp(tT<t+ΔTt)=f(t)1F(t)(34)=f(0)(35)=λ

危険率が一定値λであるという仮定は,微分方程式の初期条件にf(0)=λを与えることを意味していたのです。したがって,指数分布の確率密度関数の導出方法としては,無記憶性の定義に基づくものと危険率に基づくものは,本質的には同じ方針と捉えることができます。なお,ワイブル分布では危険率として定数以外を与えます。

ここからの計算は「無記憶性の定義より導出」と同様ですので割愛します。なお,危険率に基づく確率密度関数の導出に関する定理を用いれば,以下のように計算することも可能です。「無記憶性の定義より導出」と本質的な操作に変わりはありません。

(36)f(t)=ddtexp{0tl(u)du}(37)=ddtexp{0tλdu}(38)=ddteλt(39)=λeλt

ポアソン分布から導出

ある一定時間における事象の起こる回数をX,事象の起こる回数の期待値をτとすれば,ポアソン分布の確率質量関数g(x)は以下のように表されます。

(40)g(x)=τxx!eτ

ここで,ある一定時間として(0,t]を考えます。単位時間における事象の起こる回数の期待値をλとおけば,

(41)τ=λt

となりますので,先ほどのポアソン分布の確率質量関数(40)に代入します。

(42)g(x)=(λt)xx!eλt

ここで,事象が初めて起こるまでの待ち時間を表す確率変数Tを導入します。すると,事象の起こる回数Xを使って,時間tまで事象X1回も起こっていない確率p(T>t)を記述することができます。

(43)p(T>t)=f(x=0)(44)=eλt

事象が起こるのは少なくとも時間tよりも長い時間待った後になることから,時間tまで事象が1回も起こらない確率がp(T>t)となります。

p(T>t)の余事象は

(45)p(Tt)=1p(T>t)(46)=1eλt

と表され,1回しか起こらない事象が初めて起こるために要する時間tの累積分布関数となります。したがって,事象が初めて起こるまでの待ち時間,すなわち指数分布の確率密度関数f(t)は以下のように求められます。

(47)f(t)=ddt(1eλt)(48)=λeλt

モーメント母関数

モーメント母関数の定義に従って計算していきます。

(49)MX(t)=E[etx](50)=0etxλeλxdx(51)=0λe(tλ)xdx

式(51)の収束条件はtλ<0ですので,tλ0の場合は指数分布のモーメント母関数は存在しません。しかし,モーメント母関数の定義より,t0に限りなく近いものとしてOKですので,以下はtλ<0としてモーメント母関数の計算を進めていきます。

(52)MD(t)=[λtλe(tλ)x]0(53)=(1tλ)1

平均・分散

連続分布の平均と分散を求めるためには,モーメント母関数の性質を利用します。まず,一次モーメント,すなわち期待値を求めます。

(54)E[X]=MX(t)|t=0(55)=1λ(1tλ)2|t=0(56)=1λ

続いて,二次モーメントを求めます。

(57)E[X2]=MX(t)|t=0(58)=2λ2(1tλ)3|t=0(59)=2λ2

最後に,一次モーメントと二次モーメントから分散を求めます。

(60)V[X]=E[X2]E[X]2(61)=2λ21λ2(62)=1λ2

再生性

再生性を示すためには,再生性を示したい分布に従う独立な二つの確率変数を考え,その和のモーメント母関数を計算したときに,パラメータが和の形になっていることを示します。指数分布のモーメント母関数の積をとっても同じモーメント母関数の形が現れないため,指数分布に再生性はありません。

ロードマップ

確率分布のロードマップ

さて,ロードマップに戻りましょう。 指数分布は以下の四つの方針で導入されました。

  • 幾何分布の連続拡張として導出
  • 無記憶性の定義より導出
  • 危険率が一定となる確率分布として導出
  • ポアソン分布から導出

以下の内容も参考になるでしょう。

参考文献

本稿の執筆にあたり参考にした文献は,以下でリストアップしております。

シェアはこちらからお願いします!

コメント

コメント一覧 (6件)

  • すいません、今統計学の勉強をしているものです。
    幾何分布の連続拡張として導出からの(14)から(15)にかけての証明で

    "ネイピア数の定義を利用しました"というところがよくわかりません。。

    {(1-λ/n)}^-n/λの式がネイピア数eになるのでしょうか。。

    • sunaga様

      ご質問ありがとうございます。ネイピア数の定義

      (63)e=limx0(1+x)1/x

      x=λ/nを適用しています。

  • コメントありがとうございます。
    あと、追記ですいません、(12)のλ/n が(13)では、nがなくなりλだけになっているのはどういうことでしょうか。。

    • 本文にある「nのとき区間1/nは微小量になることからdtと表されることに注意すると」の通りです。

  • あ、dt=1/nになったんですね。わかりました! 
    あと最後ですが、(14)の式にある累乗 (-λ/n) と{ }にある-λt ですが、-
    累乗同士を掛けるとn/λ・-λt = ntになる。
    nt を -( )^-n/λ・{ }^ -λt にわけたと考えてよかったですか?

コメントする

※ Please enter your comments in Japanese to distinguish from spam.