【徹底解説】相関係数の性質

本記事は「これなら分かる!はじめての数理統計学」シリーズに含まれます。

不適切な内容があれば,記事下のコメント欄またはお問い合わせフォームよりご連絡下さい。

目次

相関係数の性質

確率変数$X,Y$の相関係数$\rho_{XY}$は

\begin{align}
-1\leq\rho_{XY}\leq 1\label{主題1}
\end{align}

を満たし,

\begin{alignat}{2}
\rho_{XY}&=1&&\iff Y=a+bX\quad(b>0)\label{主題2}\\[0.7em]
\rho_{XY}&=-1&&\iff Y=a+bX\quad(b<0)\label{主題3}
\end{alignat}

となる。

データ分析でよく用いられる性質です。

証明

コーシーシュワルツの不等式において$a_{i}=x_{i}-\ox,b_{i}=y_{i}-\oy$とおくと,

\begin{align}
\left\{\sum_{i=1}^{n}(x_{i}-\ox)^{2}\right\}\left\{\sum_{i=1}^{n}(y_{i}-\oy)^{2}\right\}
\geq \left\{\sum_{i=1}^{n}(x_{i}-\ox)(y_{i}-\oy)\right\}^{2}
\end{align}

が得られます。分散の定義共分散の定義より,

\begin{align}
V[X]V[Y]\geq \Cov[X,Y]^{2}
\end{align}

となりますので,相関係数の定義より$\rho_{XY}^{2}\leq 1$が分かります。ゆえに,式($\ref{主題1}$)が示されます。等号成立条件は,すべての$i=1,2,\ldots,n$に対して

\begin{align}
y_{i}-\oy &= b(x_{i}-\ox)\label{等号成立条件}
\end{align}

が成り立つ$b$が存在することですので,$(x_{i},y_{i})$は直線($\ref{等号成立条件}$)上に存在します。$\rho_{XY}{=}1$となるのは,$V[X]V[Y]$は非負であることから$\Cov[X,Y]{=}1$のときですので,共分散の定義より$x_{i}-\ox$と$y_{i}-\oy$は同符号となります。ゆえに,$b>0$となります。同様に,$\rho_{XY}{=}-1$となるのは,$V[X]V[Y]$は非負であることから$\Cov[X,Y]{=}-1$のときですので,共分散の定義より$x_{i}-\ox$と$y_{i}-\oy$は異符号となります。ゆえに,$b<0$となります。$b=0$のときは$y_{i}-\oy=0$となり,分散も共分散も$0$となります。したがって,相関係数を定義することができなくなり,不適切です。以上の議論を

\begin{align}
X=x_{i},\quad Y=y_{i},\quad a=\oy-b\ox
\end{align}

と置き直すと,式($\ref{主題2}$)および式($\ref{主題3}$)が得られます。

参考文献

本稿の執筆にあたり参考にした文献は,以下でリストアップしております。

シェアはこちらからお願いします!

コメント

コメントする

※ Please enter your comments in Japanese to distinguish from spam.

目次