本記事は「これなら分かる!はじめての数理統計学」シリーズに含まれます。
不適切な内容があれば,記事下のコメント欄またはお問い合わせフォームよりご連絡下さい。
目次
同時分布と周辺分布
複数の確率変数$X$,$Y$に対して定義される確率分布を同時分布と呼ぶ。 このときの$X$の分布をその周辺分布と呼ぶ。
確率変数の数が1つ増えれば,当然ですがシグマや積分の数は1つ増えます。上記定義では確率変数が二つのケースを扱いましたが,三つ以上に拡張することも可能です。
補足
周辺分布は同時分布(同時確率関数)から求められます。$X$,$Y$が離散型確率変数の場合,
\begin{align}
f_{X}(x) &= P(X=x) \\[0.7em]
&= P(X=x,Y\in\{y_1,y_2,\ldots\}) \\[0.7em]
&= \sum_{l=1}^{\infty}P(X=x, Y=y_l) \\[0.7em]
&= \sum_{l=1}^{\infty}f_{XY}(x,y_l)
\end{align}
f_{X}(x) &= P(X=x) \\[0.7em]
&= P(X=x,Y\in\{y_1,y_2,\ldots\}) \\[0.7em]
&= \sum_{l=1}^{\infty}P(X=x, Y=y_l) \\[0.7em]
&= \sum_{l=1}^{\infty}f_{XY}(x,y_l)
\end{align}
となります。同様に,$X$,$Y$が連続型確率変数の場合,確率密度関数が累積分布関数の導関数であることに注意すれば,
\begin{align}
F_{X}(x) &= P(X\leq x) \\[0.7em]
&= P(X\leq x,-\infty < Y < \infty) \\[0.7em]
&= \int_{-\infty}^{x}\left\{\int_{-\infty}^{\infty}f_{XY}(s,t)dt\right\}ds \\[0.7em]
&= \int_{-\infty}^{x} f_{X}(s) ds
\end{align}
F_{X}(x) &= P(X\leq x) \\[0.7em]
&= P(X\leq x,-\infty < Y < \infty) \\[0.7em]
&= \int_{-\infty}^{x}\left\{\int_{-\infty}^{\infty}f_{XY}(s,t)dt\right\}ds \\[0.7em]
&= \int_{-\infty}^{x} f_{X}(s) ds
\end{align}
が成り立ちます。したがって,
\begin{align}
f_{X}(x) &= \int_{-\infty}^{\infty}f_{XY}(x,y)dy
\end{align}
f_{X}(x) &= \int_{-\infty}^{\infty}f_{XY}(x,y)dy
\end{align}
となります。
参考文献
本稿の執筆にあたり参考にした文献は,以下でリストアップしております。
コメント