【徹底解説】カイ二乗分布と正規分布からの無作為標本

本記事は「これなら分かる!はじめての数理統計学」シリーズに含まれます。

不適切な内容があれば,記事下のコメント欄またはお問い合わせフォームよりご連絡下さい。

目次

カイ二乗分布と正規分布からの無作為標本

正規分布からの無作為標本における不偏分散$V$を用いて表される以下の統計量

\begin{align}
\frac{(n-1)V}{\sigma^2}
\end{align}

は,自由度$n-1$のカイ二乗分布に従う。

分母は真の値である母分散であり,分子は観測値の二乗和(実測値)になります。本定理がカイ二乗分布が「理論値とのズレ」を表す分布である所以となっているとも言えます。

証明

やや唐突ですが,以下のような恒等式を考えます。

\begin{align}
\sum_{i=1}^n \left( \frac{X_i - \mu}{\sigma} \right)^2 &=
\left( \sqrt{n}\frac{\overline{X} - \mu}{\sigma} \right)^2 + \frac{(n - 1)V}{\sigma^2} \label{恒等式}
\end{align}

式($\ref{恒等式}$)の導出は後ほど行います。

カイ二乗分布の定義より,標準化された変数の二乗和である式($\ref{恒等式}$)の左辺は自由度$n$のカイ二乗分布に従います。私たちが示したい目標は,右辺の第二項目がカイ二乗分布に従うことでしたので,右辺の第一項目がカイ二乗分布に従うことを示せばよいです。右辺の第一項目をよく見ると,左辺の二乗の中身とよく似ています。それゆえ,左辺を「ある変換」によって右辺第一項目のような形に変形できれば,右辺第一項目がカイ二乗分布に従うことを示すことができそうです。

ここで,式($\ref{恒等式}$)の導出を確認しておきましょう。右辺を計算して左辺になることを確認します。分母の$\sigma^2$は両辺で等しいため,$\sigma^2$を除いて考えます。

\begin{align}
\left\{ \sqrt{n}\left(\overline{X} - \mu\right) \right\}^2 + (n - 1)V &= n\left( \overline{X}^2-2\mu\overline{X}+\mu^2 \right) + \sum_{i=1}^{n}\left(X_i-\overline{X}\right)^2 \\[0.7em]
&= n\left( \overline{X}^2-2n\mu\sum_{i=1}^{n}X_i+\mu^2 \right) + \sum_{i=1}^{n} X_i^2-2n\overline{X}^2+n\overline{X}^2 \\[0.7em]
&= \sum_{i=1}^{n} X_i^2-2n\mu\sum_{i=1}^{n}X_i +n\mu^2 \\[0.7em]
&= \sum_{i=1}^{n}\left( X_i^2-2\mu X_i + \mu^2 \right) \\[0.7em]
&= \sum_{i=1}^{n}\left( X_i-\mu \right)^2
\end{align}

式($\ref{恒等式}$)が導出できました。さて,議論を簡潔にするため,行列を用いた表記を導入していきます。まず,$Z_i$を並べたベクトルを$\mZ$とおきます。

\begin{align}
\mZ &= \left[ (X_1 - \mu) / \sigma, \ldots, (X_n - \mu) / \sigma \right]
\end{align}

すると,各成分は標準正規分布に従うため,

\begin{align}
\mZ \sim \N(\vzero_n, I_n)
\end{align}

となります。ただし,$\vzero_n$を$n$次元ゼロベクトル,$I_n$を$n$次元単位行列を表します。次に,$\mZ$を用いて確率変数$Y$を表します。ここでは,「直交変換前後のノルムは変わらない」という性質を用いるために,直交変換を用いて確率変数$\mY$を作りましょう。左辺の中身である$Z_i$と右辺第一項目の形に注目すると,直交変換を行う行列を

\begin{align}
\mH &= \frac{1_{n}}{\sqrt{n}}
\end{align}

とすれば,$\mY=\mH^T \mZ$と表すことができそうです。ただし,$1_{n}$は全ての要素が$1$である$n$次正方行列を表します。実際に確認してみましょう。

\begin{align}
\mY
&= \mH^T \mZ \\[0.7em]
&= \mH^T \cdot [(X_1-\mu)/\sigma, \ldots, (X_n - \mu)/\sigma] \\[0.7em]
&=\left[ \frac{\sum_{i=1}^n (X_i - \mu)}{\sqrt{n}\sigma}, \ldots, \frac{\sum_{i=1}^n (X_i - \mu)}{\sqrt{n}\sigma} \right] \\[0.7em]
&= \left[ \frac{n(\overline{X} - \mu)}{\sqrt{n}\sigma}, \ldots, \frac{n(\overline{X} - \mu)}{\sqrt{n}\sigma} \right] \\[0.7em]
&= \left[ \sqrt{n}\frac{n(\overline{X} - \mu)}{\sigma}, \ldots, \sqrt{n}\frac{(\overline{X} - \mu)}{\sigma} \right] \\[0.7em]
\end{align}

右辺第一項目の形が出現しました。すると,式($\ref{恒等式}$)は以下のように表されます。

\begin{align}
\| \mZ \|^2 &= Y_1^2 + \frac{(n - 1)V}{\sigma^2} \label{1}
\end{align}

一方,$\mY$は$\mZ$を直交変換することで得られるのでした。直交変換はノルムの大きさを変えませんので,以下が成り立ちます。

\begin{align}
\| \mY \|^2 &= \| \mZ \|^2 \label{2}
\end{align}

式($\ref{1}$)と式($\ref{2}$)より,以下が成り立ちます。

\begin{align}
\| \mY \|^2 &= Y_1^2 + \frac{(n - 1)V}{\sigma^2}
\end{align}

したがって,

\begin{align}
\frac{(n - 1)V}{\sigma^2} &= Y_2^2 + \cdots + Y_n^2 \label{Y}
\end{align}

が得られます。さて,多変量正規分布の線形変換に関する定理より,多変量標準正規分布に従う$\mZ$を直交変換して得られた$\mY$は,多変量標準正規分布に従うことが分かります。

\begin{align}
\mH^T \mZ &\sim \calN(\mH^T\vzero_n, \mH^T I_n \mH) \\[0.7em]
&= \N(\vzero_n, I_n)
\end{align}

したがって,カイ二乗分布の定義より式($\ref{Y}$)の右辺は自由度$n-1$のカイ二乗分布に従いますので,

\begin{align}
\frac{(n - 1)V}{\sigma^2}
\end{align}

は自由度$n-1$のカイ二乗分布に従うことが分かりました。

参考文献

本稿の執筆にあたり参考にした文献は,以下でリストアップしております。

シェアはこちらからお願いします!

コメント

コメントする

※ Please enter your comments in Japanese to distinguish from spam.

目次