本記事は「これなら分かる!はじめての数理統計学」シリーズに含まれます。
不適切な内容があれば,記事下のコメント欄またはお問い合わせフォームよりご連絡下さい。
目次
共分散ベクトルの性質
$m$次元確率ベクトル$X$,$n$次元確率ベクトル$Y$に対する行列表記の共分散は,
\begin{align}
\Cov[X,Y] &= E[(X-E[X])(Y-E[Y])^{T}]\label{主題1}
\end{align}
\Cov[X,Y] &= E[(X-E[X])(Y-E[Y])^{T}]\label{主題1}
\end{align}
と表すことができる。また,$m$次元確率ベクトル$X_{1},X_{2}$,$n$次元確率ベクトル$Y_{1},Y_{2}$,$l\times m$行列$A,C$,$l\times n$行列$B,D$に対し,
\begin{align}
\Cov [AX_{1}+BY_{1}, CX_{2}+DY_{2}] &= A\Cov[X_{1}, Y_{1}]C^{T} + A\Cov[X_{1}, Y_{2}]D^{T} \notag\\[0.7em]
&\quad\quad+ B\Cov[X_{2}, Y_{1}]C^{T} + B\Cov[X_{2}, Y_{2}]D^{T}\label{主題2}
\end{align}
\Cov [AX_{1}+BY_{1}, CX_{2}+DY_{2}] &= A\Cov[X_{1}, Y_{1}]C^{T} + A\Cov[X_{1}, Y_{2}]D^{T} \notag\\[0.7em]
&\quad\quad+ B\Cov[X_{2}, Y_{1}]C^{T} + B\Cov[X_{2}, Y_{2}]D^{T}\label{主題2}
\end{align}
確率変数の性質の多変量拡張です。1.を共分散ベクトルの定義として用いる場合もあります。
証明
式($\ref{主題1}$)から証明します。$E[(X-E[X])(Y-E[Y])^{T}]$の$(i,j)$要素は$E[(X_{i}-E[X_{i}])(Y_{j}-E[Y_{j}])^{T}]$となります。共分散の定義より,
\begin{align}
E[(X_{i}-E[X_{i}])(Y_{j}-E[Y_{j}])^{T}] &= \Cov[X_{i},Y_{j}]
\end{align}
E[(X_{i}-E[X_{i}])(Y_{j}-E[Y_{j}])^{T}] &= \Cov[X_{i},Y_{j}]
\end{align}
が成り立ちます。したがって,$E[(X-E[X])(Y-E[Y])^{T}]$が共分散ベクトルの定義と一致することが示されました。
上でも述べましたが,$E[(X-E[X])(Y-E[Y])^{T}]$を共分散ベクトルの定義として用いる場合もあります。
次に,式($\ref{主題2}$)を証明します。1.を利用して変形すると,
\begin{align}
&\Cov [AX_{1}+BY_{1}, CX_{2}+DY_{2}]\notag\\[0.7em]
&=
E[(AX_{1}+BY_{1}-E[AX_{1}+BY_{1}])(CX_{2}+DY_{2}-CX_{2}+DY_{2})^{T}] \\[0.7em]
&=
E[A(X_{1}-E[X_{1}])(Y_{1}-E[Y_{1}])C^{T}]+E[A(X_{1}-E[X_{1}])(Y_{2}-E[Y_{2}])D^{T}]\notag\\[0.7em]
&\quad\quad E[B(X_{2}-E[X_{2}])(Y_{1}-E[Y_{1}])C^{T}]+E[B(X_{2}-E[X_{2}])(Y_{2}-E[Y_{2}])D^{T}]\\[0.7em]
&=
AE[(X_{1}-E[X_{1}])(Y_{1}-E[Y_{1}])]C^{T}+AE[(X_{1}-E[X_{1}])(Y_{2}-E[Y_{2}])]D^{T}\notag\\[0.7em]
&\quad\quad BE[(X_{2}-E[X_{2}])(Y_{1}-E[Y_{1}])]C^{T}+BE[(X_{2}-E[X_{2}])(Y_{2}-E[Y_{2}])]D^{T}\\[0.7em]
&=
A\Cov[X_{1}, Y_{1}]C^{T}+A\Cov[X_{1}, Y_{2}]D^{T}+B\Cov[X_{2}, Y_{1}]C^{T}+B\Cov[X_{2}, Y_{2}]D^{T}
\end{align}
&\Cov [AX_{1}+BY_{1}, CX_{2}+DY_{2}]\notag\\[0.7em]
&=
E[(AX_{1}+BY_{1}-E[AX_{1}+BY_{1}])(CX_{2}+DY_{2}-CX_{2}+DY_{2})^{T}] \\[0.7em]
&=
E[A(X_{1}-E[X_{1}])(Y_{1}-E[Y_{1}])C^{T}]+E[A(X_{1}-E[X_{1}])(Y_{2}-E[Y_{2}])D^{T}]\notag\\[0.7em]
&\quad\quad E[B(X_{2}-E[X_{2}])(Y_{1}-E[Y_{1}])C^{T}]+E[B(X_{2}-E[X_{2}])(Y_{2}-E[Y_{2}])D^{T}]\\[0.7em]
&=
AE[(X_{1}-E[X_{1}])(Y_{1}-E[Y_{1}])]C^{T}+AE[(X_{1}-E[X_{1}])(Y_{2}-E[Y_{2}])]D^{T}\notag\\[0.7em]
&\quad\quad BE[(X_{2}-E[X_{2}])(Y_{1}-E[Y_{1}])]C^{T}+BE[(X_{2}-E[X_{2}])(Y_{2}-E[Y_{2}])]D^{T}\\[0.7em]
&=
A\Cov[X_{1}, Y_{1}]C^{T}+A\Cov[X_{1}, Y_{2}]D^{T}+B\Cov[X_{2}, Y_{1}]C^{T}+B\Cov[X_{2}, Y_{2}]D^{T}
\end{align}
が得られます。
参考文献
本稿の執筆にあたり参考にした文献は,以下でリストアップしております。
コメント