【徹底解説】多変数から一変数への変数変換

本記事は「これなら分かる!はじめての数理統計学」シリーズに含まれます。

不適切な内容があれば,記事下のコメント欄またはお問い合わせフォームよりご連絡下さい。

目次

多変数から一変数への変数変換

$D$次元の確率変数$\mX=[X_1,\ldots,X_D]$とその実現値$\vx=[x_1,\ldots,x_D]$に対し,

\begin{align}
y &= g(\vx)
\end{align}

で定義される確率変数$Y$と,その実現値$y$を考える。$Y$が離散型確率変数である場合,$\vx$の同時確率質量関数を$h$とおくと,$Y$の確率質量関数$f(y)$は以下のように表される。

\begin{align}
f(y) &= \sum_{\vx} \delta(y, g(\vx))h(\vx)
\end{align}

ただし,$\delta(\cdot, \cdot)$はクロネッカーのデルタ関数を表す。$Y$が連続型確率変数である場合,$\vx$の同時確率密度関数を$h$とおくと,$Y$の確率質量関数$f(y)$は以下のように表される。

\begin{align}
f(y) &= \int_{R} \delta(y-g(\vx))h(\vx) d\vx
\end{align}

ただし,$R$は$\vx$の積分範囲,$\delta (\cdot)$はディラックのデルタ関数を表す。

補足

多変数から一変数への変数変換は,クロネッカーのデルタ関数とディラックのデルタ関数の定義そのものを表しています。抽象的でやや分かりにくいと思いますので,簡単な例を考えてみましょう。$D=2$かつ

\begin{align}
y &= x_1 + x_2
\end{align}

のケースを考えてみます。対象が離散型確率変数の場合を考えましょう。例えば,$f(3)$というのは$Y=3$となる確率を表しますが,$Y=3$となる$(x_1, x_2)$の組み合わせ全てに関して$(x_1, x_2)$の同時確率質量関数$h$の値を足し合わせなくてはなりません。ここでは,$y$と$x_1+x_2$の値が等しいときにだけ$1$となるディラックのデルタ関数が利用できます。

\begin{align}
f(3) &= \sum_{x_1, x_2} \delta(y, x_1+x_2)h(x_1, x_2)
\end{align}

これを$Y=y$に拡張してベクトルで表記すると,

\begin{align}
f(y) &= \sum_{\vx} \delta(y, g(\vx))h(\vx)
\end{align}

が得られます。対象が連続型確率変数の場合も同様です。$f(3)$というのは$Y=3$となる確率を表しますが,$Y=3$となる$(x_1, x_2)$の組み合わせ全てに関して$(x_1, x_2)$の同時確率密度関数$h$の値を足し合わせなくてはなりません。ここでは,$y$と$x_1+x_2$の値が等しいときにだけ積分が$1$となるディラックのデルタ関数が利用できます。

\begin{align}
f(3) &= \int_{x_1}\int_{x_2} \delta(y-x_1-x_2)h(x_1, x_2) dx_1 dx_2
\end{align}

これを$Y=y$に拡張してベクトルで表記すると,

\begin{align}
f(y) &= \int_{R} \delta(y-g(\vx))h(\vx) d\vx
\end{align}

が得られます。

参考文献

本稿の執筆にあたり参考にした文献は,以下でリストアップしております。

シェアはこちらからお願いします!

コメント

コメントする

※ Please enter your comments in Japanese to distinguish from spam.

目次