【過去問解答】統計検定1級2013年問2

zuka

こんにちは。
zuka(@beginaid)です。

本記事は「これなら分かる!はじめての数理統計学」シリーズに含まれます。

もし不適切な内容があれば,記事下のコメント欄又はお問い合わせフォームよりご連絡下さい。

問題

統計検定1級の過去問からの出題になります。統計検定の問題の著作権は日本統計学会に帰属していますので,本書にて記載することはできません。「演習問題を俯瞰する」で詳しく紹介している公式の過去問題集をご購入いただきますようお願い致します。

解答

小問1

ある確率変数$Z_1$と$Z_2$が独立であることを示すためには,

\begin{align}
P(Z_1 Z_2) &= P(Z_1)P(Z_2)
\end{align}

を示せばよいです。しかし,$Z_1$と$Z_2$が正規分布に従う場合にはもっと簡単な方法があります。一般に,$2$つの確率変数$Z_1$,$Z_2$がそれぞれ(独立とはかぎらずに)正規分布に従うとき,すなわち$(Z_1, Z_2)$が$2$変量正規分布に従うとき,独立と無相関は同値になるのです。小問1はこの性質を利用します。

正規分布の再生性より,$Y_n$もまた正規分布に従います。同様に,$X_1 – Y_n/n$も正規分布に従います。このことから,$Y_n$と$X_1 – Y_n/n$が独立であることを示すためには,$Y_n$と$X_1 – Y_n/n$が無相関であること,すなわち$Y_n$と$X_1 – Y_n/n$の共分散が$0$であることを利用すれば良いです。共分散の線形性を利用して,$X_1, \ldots, X_n$が独立であることに注意すれば,

\begin{align}
\Cov[Y_n, X_1 – Y_n/n] &= \Cov[Y_n, X_1] – \frac{1}{n}\Cov[Y_n, Y_n] \\[0.7em]
&= \Cov[X_1, X_1] – \frac{1}{n}\Cov[Y_n, Y_n] \\[0.7em]
&= V[X_1] – \frac{1}{n}V[Y_n] \\[0.7em]
&= \sigma^2 – \frac{1}{n}\cdot n\sigma^2 \\[0.7em]
&= 0
\end{align}

ゆえに,$Y_n$と$X_1 – Y_n/n$が独立であることを示すことができました。

小問2

語弊を恐れずに言うと,条件付きされる変数が普通の変数と違うのは「定数と扱うか・そうでないか」という部分です。今回の問題で言えば,$Y_n = y_n$という条件が与えられていますので,総和$Y_n$の値が具体的に$y_n$という定数として与えられているという状況を想定すれば良いです。

さて,「条件付き分布を求めよ」というのはどういう意味なのでしょうか。それは,以下の2ステップのことを指しています。

  1. 分布の形を求める(分布名を求める)
  2. パラメータを求める

それぞれ見ていきましょう。まず,分布の形ですが,多変量正規分布の条件付き分布に関する公式は1変量正規分布にも応用できますので,正規分布に従う確率変数に条件づけられた正規分布に従う確率変数もまた,正規分布に従います。しかし,具体的な期待値と分散はまだ分かっていないため,平均を$m$,分散を$s^2$とおきましょう。数式で表すと以下のようになります。

\begin{align}
X_1 &\sim \calN(\mu, \sigma^2) \\[0.7em]
Y_n &\sim \calN(n\mu, n^2\sigma^2) \\[0.7em]
X_1 | Y_n &\sim \calN(m, s^2)
\end{align}

したがって,先ほどのステップ1で導かれる分布名は「正規分布」ということになります。したがって,次に求めるべきは正規分布のパラメータである期待値$m$と分散$s^2$です。それぞれ計算していきます。ポイントは小問1で示した内容を使うことです。$Y_n$ と$X_1 – Y_n/n$が独立であることを利用するのです。独立であるということは,片方がもう片方に条件付けられていても,それは無視してよいということを意味しています。

さて,まずは$m$から計算していきましょう。小問1の答えを使うため,$X_1-Y_n/n$の形を無理やり作ってしまいます。

\begin{align}
m &= E[X_1 | Y_n = y_n] \\[0.7em]
&= E[X_1 – Y_n/n + Y_n/n | Y_n = y_n] \\[0.7em]
&= E[X_1 – Y_n/n | Y_n = y_n] + E[ Y_n/n | Y_n = y_n] \\[0.7em]
&= E[X_1 – Y_n/n] + E[y_n / n] \quad (\because \text{小問1の結果}) \\[0.7em]
&= E[X_1] – \frac{1}{n} E[Y_n] + \frac{y_n}{n} \\[0.7em]
&= \mu – \frac{n\mu}{n} + \frac{y_n}{n} \\[0.7em]
&= \frac{y_n}{n}
\end{align}

次は分散$s^2$を求めましょう。$m$と同様に$X_1 – Y_n/n$の形を作ってしまいます。その際,分散は定数項を足しても変わらないことを利用します。$Y_n = y_n$に条件付けられた$Y_n / n$は定数項として扱ってよいこと,そして分散には期待値のように線形性がなく共分散の項が出現することに注意しましょう。

\begin{align}
V[X_1 | Y_n = y_n]
&= V[X_1 – Y_n / n | Y_n = y_n] \quad (\because \text{分散は定数項を足しても変わらない}) \\[0.7em]
&= V[X_1 – Y_n / n] \quad (\because \text{小問1の結果}) \\[0.7em]
&= V[X_1] – \frac{2}{n} \Cov[X_1, Y_n] + \frac{1}{n^2} V[Y_n] \quad (\because \text{分散には線形性がない}) \\[0.7em]
&= \sigma^2 – \frac{2}{n} V[X_1] + \frac{n\sigma^2}{n^2} \quad (\because \text{各}X_i\text{は無相関}) \\[0.7em]
&= \left( \frac{n – 1}{n} \right) \sigma^2
\end{align}

ただし,途中で

\begin{align}
V[Y_n] &= V[X_1 + \ldots + X_n] \\[0.7em]
&= V[X_1] + \ldots + V[X_n] + \Cov[X_1, X_2] + \ldots + \Cov[X_n, X_{n-1}] \\[0.7em]
&= V[X_1] + \ldots + V[X_n] \quad (\because \text{各}X_i\text{は無相関})
\end{align}

を利用しました。以上で,小問2の答えを求めることができました。

\begin{align}
X_1 | Y_n &\sim \calN(m, s^2) \\[0.7em]
\end{align}

すなわち,

\begin{align}
X_1 | Y_n &\sim \calN\left(\frac{y_n}{n},\frac{n – 1}{n} \sigma^2 \right)
\end{align}

が求める答えです。

小問3

流れは小問2と同様です。

  1. 分布の形を求める(分布名を求める)
  2. パラメータを求める

小問2と同様に考えると,$Y_k = y_k$で条件づけられた$Y_{k-1}$もまた正規分布に従うことが分かります。したがって,あとはその平均と分散を求めればよいだけです。先ほど同様に計算してもよいのですが,以下の関係式を使うことで簡単に計算することができます。

\begin{align}
Y_{k-1} &= Y_k – X_k \\[0.7em]
\end{align}

また,小問2の結果より以下が分かります。

\begin{align}
X_k | Y_k &\sim \calN\left(\frac{y_k}{k}, \frac{k – 1}{k} \sigma^2 \right)
\end{align}

実際に求めたい分布の平均を計算していきましょう。

\begin{align}
E[Y_{k-1} | Y_k = y_k]
&= E[Y_k – X_k | Y_k = y_k] \\[0.7em]
&= E[y_k – X_k] \\[0.7em]
&= y_k – \frac{y_k}{k} \\[0.7em]
&= \frac{k – 1}{k} y_k
\end{align}

同様に,求めたい分布の期待値を計算していきましょう。

\begin{align}
V[Y_{k-1} | Y_k = y_k]
&= V[Y_k – X_k | Y_k = y_k] \\[0.7em]
&= V[y_k – X_k] \\[0.7em]
&= V[- X_k] \quad (\because \text{分散は定数項を足しても不変}) \\[0.7em]
&= V[X_k] \\[0.7em]
&= \frac{k – 1}{k} \sigma^2
\end{align}

したがって,求める答えは以下です。

\begin{align}
Y_{k-1} | Y_k &\sim \calN\left(\frac{k – 1}{k} y_k, \frac{k – 1}{k} \sigma^2 \right)
&= f_{k-1}(y_{k-1} | y_k)
\end{align}

小問4

これは難問です。何が難しいかというと,見通しの良い方針が立てづらいということです。まずは,問題文の意味を咀嚼してみましょう。一旦左辺に掛かっている$g_n (y_n)$を除いて考えてみると,小問3で求めた条件付き分布を以下のように掛け合わせた形を考えていますね。

\begin{align}
\prod_{k=2}^n f_{k-1} (y_{k-1} | y_k)
&= f_1 (y_1 | y_2)\cdots f_{n-1} (y_{n-1} | y_n)
\end{align}

これは,微分のチェーンルールならぬ,条件付き分布のチェーンルールのようになっています。このようなチェーンルールの形は,$n=k$における関係性を逐次的に書き出して積を取ることで示すことができそうです。何を言っているのかというと,

\begin{align}
f_1 (y_1 | y_2) &= h(x_2)\text{で表される形} \\[0.7em]
f_2 (y_2 | y_3) &= h(x_3)\text{で表される形} \\[0.7em]
\ldots \notag \\[0.7em]
f_{n-1} (y_{n-1} | y_n) &= h(x_n)\text{で表される形}
\end{align}

のように関係性を書き出していって,両辺の積を取ることで求める関係式の形に近づけることができそうだということです。しかし,このままでは両辺に$g_n (y_n)$の形が出現しないので,左辺の形を少し修正することで以下のような形を目指します。

\begin{align}
f_1 (y_1 | y_2) g(y_2) &= h(x_2)\text{で表される形} \\[0.7em]
f_2 (y_2 | y_3) g(y_3) &= h(x_3)\text{で表される形} \\[0.7em]
\ldots \notag \\[0.7em]
f_{n-1} (y_{n-1} | y_n) g(y_n) &= h(x_n)\text{で表される形}
\end{align}

実際に$n$が小さい方から計算していきましょう。条件付き分布の定義を利用します。

\begin{align}
f_1 (y_1 | y_2) g(y_2) &= \frac{f_1 (y_1, y_2)}{g_(y_2)} g(y_2) \\[0.7em]
&= f(y_1, y_2)
\end{align}

さて,右辺を「$h(x_2)$で表される形」に近づけるために,$Y_2 = Y_1 + X_2$の関係を利用します。つまり,$Y_1$と$Y_2$の同時分布から$Y_2 = Y_1 + X_2$の関係式を使うことで$Y_2$を消して,$Y_1$と$X_2$の同時分布にするのです。このとき,何も考えずに

\begin{align}
f(y_1, y_2) &= f(y_1, x_2)
\end{align}

としてはいけないことに気付きますでしょうか。一般に,確率変数の変数変換を行いたいとき,拡大率であるヤコビアンを使って帳尻を合わせる必要があるのでした。いま,

\begin{align}
y_1 &= y_1 \\[0.7em]
y_2 &= y_1 + x_1
\end{align}

という変数変換を施していますので,ヤコビアンは

\begin{align}
|J| &=
\mathrm{abs}
\begin{vmatrix}
\frac{\partial y_1}{\partial y_1} & \frac{\partial y_1}{\partial x_1} \\
\frac{\partial y_2}{\partial y_1} & \frac{\partial y_2}{\partial x_1} \\
\end{vmatrix} \\[0.7em]
&=
\mathrm{abs}
\begin{vmatrix}
1 & 0 \\
1 & 1 \\
\end{vmatrix} \\[0.7em]
&= 1
\end{align}

となります。結果としては先ほどの結果で間違いはなかったのですが,変数変換の際にはヤコビアンと条件反射で構えられるようにしておきましょう。さて,結局$Y_1$と$Y_2$の同時分布から$Y_2 = Y_1 + X_2$の関係式を使うことで$Y_2$を消して,$Y_1$と$X_2$の同時分布にすると,

\begin{align}
f(y_1, y_2) &= f(y_1, x_2) \cdot 1 \\[0.7em]
&= f(y_1)f(x_2) \quad (\because y_1\text{と}x_2\text{は独立}) \\[0.7em]
&= g(y_1)h(x_2)
\end{align}

となり,望んでいた「$h(x_2)$で表される形」になりました。これを$f(y_{n-1} | y_n)g(y_n)$まで続けると,以下のようになります。

\begin{align}
f_1 (y_1 | y_2) g(y_2) &= g(y_1)h(x_2) \\[0.7em]
f_2 (y_2 | y_3) g(y_3) &= g(y_2)h(x_3) \\[0.7em]
\ldots \notag \\[0.7em]
f_{n-1} (y_{n-1} | y_n) g(y_n) &= g(y_{n-1})h(x_n)
\end{align}

全ての両辺を掛け合わせることで,$g(y_2)$から$g(y_{n-1})$が消えてくれますので,以下のようにキレイな形になります。

\begin{align}
\left\{ \prod_{k=2}^n f_{k-1} (y_{k-1} | y_k) \right\} g(y_n) &= g(y_1) \prod_{i=2}^n h(x_i)
\end{align}

$y_1=x_1$であることに注意すれば,最終的に与えられた式に帰着することを示すことができました。

\begin{align}
\left\{ \prod_{k=2}^n f_{k-1} (y_{k-1} | y_k) \right\} g(y_n) &= g(x_1) \prod_{i=2}^n h(x_i) \\[0.7em]
&= h(x_1) \prod_{i=2}^n h(x_i) \\[0.7em]
&= \prod_{i=1}^n h(x_i)
\end{align}

シェアはこちらからお願いします!
URLをコピーする
URLをコピーしました!

コメント

コメントする