【徹底解説】累積分布関数の定義

本記事は「これなら分かる!はじめての数理統計学」シリーズに含まれます。

不適切な内容があれば,記事下のコメント欄またはお問い合わせフォームよりご連絡下さい。

目次

累積分布関数

離散型変数$X$に対して,

\begin{align}
F_{X}(x) &= P(X \leq x) \\[0.7em]
&= \sum_{k:x_k\leq x}f_{X}(x_k)
\end{align}

で定義される関数$F_{X}(\cdot)$を累積分布関数と呼ぶ。ただし,$\sum_{k:x_k\leq x}$は$x_k \leq x$なる$k$で和をとるという意味である。また,$X$が連続型変数の場合には

\begin{align}
F_{X}(x) &= P(X \leq x) \\[0.7em]
&= \int_{-\infty}^{x} g_{X}(t)dt
\end{align}

で定義される関数$F_{Y}(\cdot)$を累積分布関数と呼ぶ。

私自身,統計学を習い始めた頃は「累積分布関数なんて何で定義する必要があるんだろう」と思っていました。必ずと言っていいほど,統計学のテキストでは累積分布関数が定義され,紹介されていますよね。それに対する現時点での私の答えは「$X \leq x$となるような$X$を対象とする操作が行われることが多いから」です。そのため,累積分布関数を定義することで,見通しよく数学的な組み立てができるようになる場面が多々あるのです。累積分布関数の値は,下側確率とも呼ばれています。

補足

確率密度関数は以下のようにも定義できるのでした。

\begin{align}
f(x) &= \lim_{\varepsilon\rightarrow 0}\frac{P(x\leq X\leq x+\varepsilon)}{\varepsilon}
\end{align}

すると,確率密度関数は累積分布関数の導関数としても定義できることが分かります。

\begin{align}
f(x) &= \lim_{\varepsilon\rightarrow 0}\frac{F(x+\varepsilon)-F(x)}{\varepsilon} \\[0.7em]
&= \frac{d}{dx}F(x)
\end{align}

参考文献

本稿の執筆にあたり参考にした文献は,以下でリストアップしております。

コメント

コメントする

※ Please enter your comments in Japanese to distinguish from spam.

目次