【徹底解説】確率変数の変数変換

2023年9月29日

本記事は「これなら分かる！はじめての数理統計学」シリーズに含まれます。

目次へ

不適切な内容があれば，記事下のコメント欄またはお問い合わせフォームよりご連絡下さい。

変数変換

離散型確率変数$X$，$Y$に対して，$2$次元の実数値関数

\begin{align}
(U, V) &= \vg(X, Y) \\[0.7em]
&= \left( g_1(X, Y), g_2(X, Y) \right)
\end{align}

を考える。$\vg$の逆関数$\vh$が存在して

\begin{align}
(X, Y) &= \vh(U, V) \\[0.7em]
&= \left( h_1(U, V), h_2(U, V) \right)
\end{align}

が成り立つとき，$U$と$V$の同時確率質量関数は

\begin{align}
f_{U V}(u, v) &= P\left\{ \vg(X, Y) = (u, v) \right\} \\[0.7em]
&= f_{X Y} \left\{ \vh(u, v) \right\}
\end{align}

で与えられる。$X$，$Y$が連続型確率変数であるときは，ヤコビアン

\begin{align}
J(u, v) &= \frac{\partial \left( h_1(u,v), h_2(u,v) \right)}{\partial(u,v)} \\[0.7em]
&= \left|
\begin{array}{cc}
\partial h_1(u,v) / \partial u & \partial h_1(u,v) / \partial v \\
\partial h_2(u,v) / \partial u & \partial h_2(u,v) / \partial v \\
\end{array}
\right|
\end{align}

を用いて，$U$と$V$の同時確率密度関数は

\begin{align}
f_{U, V}(u,v) &= f_{X, Y} \left(\vh(u, v)\right)\cdot | J(u,v) |\label{主題}
\end{align}

で与えられる。ただし，ヤコビアンは各点$(u,v)$で$0$にならないものとする。

逆関数が存在するときの変数変換です。離散型確率変数の場合は，逆関数を求めてそのまま代入するだけで変数変換を行うことができます。一方で，連続型確率変数の場合は少し厄介です。一言で表せば「元の確率関数に変数変換後の変数を代入してヤコビアンを掛けたものが変換後の確率関数になる」ことを示しています。確率変数の変数変換を用いることで，種々の確率分布を組み合わせながら拡張性の高い議論が可能になります。変数変換を用いなければ見えてこない確率分布同士の関係性もありますので，必ず押さえておかなければならない定理です。余談ですが，この定理は「簡単のため」2次元で逆関数が存在するときを考えていますが，私たちが統計検定や入試などで解く問題は逆関数が存在する場合がほとんどですので，一旦は例外を考えすぎることなくこの定理をおさえるようにした方がベターだと思います。

証明

$X$，$Y$が離散型確率変数である場合は，

\begin{align}
f_{U V}(u, v) &= P \left\{ (U, V) = (u,v) \right\} \\[0.7em]
&= P \left\{ \vg(X, Y) = (u,v) \right\} \\[0.7em]
&= P \left\{ (X, Y)= \vh(u,v) \right\} \\[0.7em]
&= f_{X Y} \left\{ \vh(u, v) \right\}
\end{align}

として示すことができます。$X$，$Y$が連続型確率変数である場合は，累積分布関数を微分することで確率密度関数を導出します。任意の$(u,v)\in {\bbR}^2$に対して，$A=(-\infty, u] \times (-\infty, v]$とすると，

\begin{align}
F_{U V}(u, v) &= P \left( U \leq u, V \leq v \right) \\[0.7em]
&= P\left\{ (U, V) \in A \right\} \\[0.7em]
&= P \left\{ (X, Y) \in \vh (A) \right\} \\[0.7em]
&= \int \int_{\vh (A)} f_{X Y}(x, y)dxdy \label{eq:1} \\[0.7em]
&= \int \int_{A} f_{X Y} \left\{ h_1(u,v), h_2(u,v) \right\} |J(u,v)|dudv \label{eq:2} \\[0.7em]
&= \int_{-\infty}^{u}\int_{-\infty}^{v} f_{X Y}{ \vh(u,v) }|J(u,v)|dudv \\[0.7em]
\end{align}

本質的には，式($\ref{eq:1}$)から式($\ref{eq:2}$)の部分で変数変換を行っています。離散型確率変数とは異なり，変数変換に伴って倍率に相当するヤコビアンを掛け合わせる必要があります。以上の結果より，両辺を$u$と$v$で偏微分すると，

\begin{align}
\frac{\partial^2 F_{U V}(u, v)}{\partial u \partial v} &= f_{U V}(u, v)\\[0.7em]
&= f_{X Y}{ \vh(u,v) }|J(u,v)|
\end{align}

となります。

式($\ref{主題}$)は変換前後で確率密度が変化しないことを意味しています。これは，ヤコビアンが本質的には変換前後の面積比を表していることに矛盾しません。

補足

より単純な例として，$Y=g(X)$の密度関数が下記のように表されることがよく用いられます。

\begin{align}
f_{Y}(y) = f_{X}(g^{-1}(y))|\det J(\partial x/\partial y)|\label{単純な例}
\end{align}

ただし，$\det J(\partial x/\partial y)$は$x$を$y$で偏微分したヤコビアンを表します。式($\ref{単純な例}$)は，

\begin{align}
f_{Y}(y) = f_{X}(x)|\partial x/\partial y|
\end{align}

と捉えておくと非常に覚えやすいのでおすすめです。また，式($\ref{単純な例}$)は重積分によって裏付けられており，

\begin{align}
P(Y\in A) = P(X\in B) = \int_{B}f_{X}(x)dx = \int_{A}f_{X}(g^{-1}(y))|\det J(\partial x/\partial y)|dy
\end{align}

はおさえておきましょう。

参考文献

本稿の執筆にあたり参考にした文献は，以下でリストアップしております。

参考文献リストへ

シェアはこちらからお願いします！

【徹底解説】確率変数の変数変換

変数変換

証明

補足

参考文献

コメント

コメントする コメントをキャンセル

コメントするコメントをキャンセル