本記事は「これなら分かる!はじめての数理統計学」シリーズに含まれます。
不適切な内容があれば,記事下のコメント欄またはお問い合わせフォームよりご連絡下さい。
指数分布
指数分布
指数分布は事象の生起間隔の確率を与え,
と表されます。ただし,とします。指数分布に従う確率変数に対し,実現値は
であり,モーメント母関数の変数はとします。指数分布は再生性を持たず,ロードマップ中ではガンマ分布の特殊ケースに相当します。
確率密度関数
指数分布の確率密度関数の導出には,大きく分けて四つの方法があります。
- 幾何分布の連続拡張として導出
- 無記憶性の定義より導出
- 危険率が一定となる確率分布として導出
- ポアソン分布から導出
幾何分布の連続拡張として導出
時刻を長さの区間に分割して,各区間のインデックスをとおきます。ポアソン分布の導出と同様に,各区間で事象が起こる確率を,
で表し,を考えます。ただし,とします。ここで,パラメータがの幾何分布を考えると,インデックスで初めてが起こる確率は,
となります。ただし,確率変数はが初めて起こる時刻を表し,の定義からとなります。ここで,指数分布の確率密度関数をとおくと,確率密度関数の定義よりが微小区間の中で初めて起こる確率は以下のように表されます。
よりとなること,のとき区間は微小量になることからと表されることに注意すると,式()の極限は以下のように計算できます。
ただし,ネイピア数の定義を利用しました。以上より,指数分布の確率密度関数は以下で表されることが分かりました。
無記憶性の定義より導出
指数分布は,無記憶性を持つ連続型確率分布として導出されます。無記憶性の定義の左辺を条件付き確率の定義を用いて変形し,右辺を指数分布の累積密度関数を用いて書き直すと,以下のようになります。
ただし,上で述べた通りが指数分布の累積密度関数そのものを表していることを利用しました。さて,左辺もを用いて表すことで,式()をに関する方程式に仕上げましょう。まず,分母に関しては累積密度関数の余事象を用いて表すことができます。分子に関しても,累積密度関数の差で表すことができます。したがって,式()は以下のように計算することができます。
私たちの目標は,を求めることでその導関数を求めることです。左辺の分母が導関数の定義に似ていることに注目して,両辺をで割ってみましょう。
ただし,累積密度関数の定義よりであることを用いました。続けて,式()の両辺での極限を取りましょう。
分かりやすさのため,と置き,式()を微分方程式の形に書き直してみます。
この微分方程式を,,の初期条件で解きます。
初期条件の妥当性を確認しておきます。は,累積密度関数の定義より必ず成り立ちます。は,危険率を用いて妥当性を確認することができますが,まとめて次のパートでお伝えすることにします。本パートでは,一旦微分方程式を解くための便宜上の仮定と理解しておいてください。
式()は変数分離形の微分方程式ですので,両辺をで積分しましょう。
ただし,は積分定数です。であることに注意すると,は以下のように表されます。
ただし,定数はまとめてと置きました。と置きましたので,指数分布の累積密度関数および確率密度関数は以下で表されます。
確率密度関数の定義より,以下が成り立ちます。
したがって,定数は以下のように表されます。
以上より,指数分布の確率密度関数は以下のように表されることが分かりました。
危険率が一定となる確率分布として導出
指数分布は,危険率が一定値となる確率分布として導入できます。危険率の定義より,以下が成り立ちます。
危険率の定義と無記憶性の定義が非常に似ていることに注意すると,先ほどまでの「無記憶性の定義より導出」のパートを流用できることが分かります。すなわち,式()の左辺が危険率における極限の対象を表していますので,式()より危険率はであることが分かります。
危険率が一定値であるという仮定は,微分方程式の初期条件にを与えることを意味していたのです。したがって,指数分布の確率密度関数の導出方法としては,無記憶性の定義に基づくものと危険率に基づくものは,本質的には同じ方針と捉えることができます。なお,ワイブル分布では危険率として定数以外を与えます。
ここからの計算は「無記憶性の定義より導出」と同様ですので割愛します。なお,危険率に基づく確率密度関数の導出に関する定理を用いれば,以下のように計算することも可能です。「無記憶性の定義より導出」と本質的な操作に変わりはありません。
ポアソン分布から導出
ある一定時間における事象の起こる回数を,事象の起こる回数の期待値をとすれば,ポアソン分布の確率質量関数は以下のように表されます。
ここで,ある一定時間としてを考えます。単位時間における事象の起こる回数の期待値をとおけば,
となりますので,先ほどのポアソン分布の確率質量関数()に代入します。
ここで,事象が初めて起こるまでの待ち時間を表す確率変数を導入します。すると,事象の起こる回数を使って,時間まで事象が回も起こっていない確率を記述することができます。
事象が起こるのは少なくとも時間よりも長い時間待った後になることから,時間まで事象が回も起こらない確率がとなります。
の余事象は
と表され,回しか起こらない事象が初めて起こるために要する時間の累積分布関数となります。したがって,事象が初めて起こるまでの待ち時間,すなわち指数分布の確率密度関数は以下のように求められます。
モーメント母関数
モーメント母関数の定義に従って計算していきます。
式()の収束条件はですので,の場合は指数分布のモーメント母関数は存在しません。しかし,モーメント母関数の定義より,はに限りなく近いものとしてOKですので,以下はとしてモーメント母関数の計算を進めていきます。
平均・分散
連続分布の平均と分散を求めるためには,モーメント母関数の性質を利用します。まず,一次モーメント,すなわち期待値を求めます。
続いて,二次モーメントを求めます。
最後に,一次モーメントと二次モーメントから分散を求めます。
再生性
再生性を示すためには,再生性を示したい分布に従う独立な二つの確率変数を考え,その和のモーメント母関数を計算したときに,パラメータが和の形になっていることを示します。指数分布のモーメント母関数の積をとっても同じモーメント母関数の形が現れないため,指数分布に再生性はありません。
ロードマップ
確率分布のロードマップ
さて,ロードマップに戻りましょう。 指数分布は以下の四つの方針で導入されました。
- 幾何分布の連続拡張として導出
- 無記憶性の定義より導出
- 危険率が一定となる確率分布として導出
- ポアソン分布から導出
以下の内容も参考になるでしょう。
参考文献
本稿の執筆にあたり参考にした文献は,以下でリストアップしております。
コメント
コメント一覧 (6件)
すいません、今統計学の勉強をしているものです。
幾何分布の連続拡張として導出からの(14)から(15)にかけての証明で
"ネイピア数の定義を利用しました"というところがよくわかりません。。
{(1-λ/n)}^-n/λの式がネイピア数eになるのでしょうか。。
sunaga様
ご質問ありがとうございます。ネイピア数の定義
で を適用しています。
コメントありがとうございます。
あと、追記ですいません、(12)のλ/n が(13)では、nがなくなりλだけになっているのはどういうことでしょうか。。
本文にある「 のとき区間 は微小量になることから と表されることに注意すると」の通りです。
あ、dt=1/nになったんですね。わかりました!
あと最後ですが、(14)の式にある累乗 (-λ/n) と{ }にある-λt ですが、-
累乗同士を掛けるとn/λ・-λt = ntになる。
nt を -( )^-n/λ・{ }^ -λt にわけたと考えてよかったですか?
はい。合ってます。定番の式変形なので必ずおさえてください。