統計検定1級の過去問解答解説を行います。目次は以下をご覧ください。
不適切な内容があれば,記事下のコメント欄またはお問い合わせフォームよりご連絡下さい。
問題
統計検定1級の過去問からの出題になります。統計検定の問題の著作権は日本統計学会に帰属していますので,本稿にて記載することはできません。「演習問題を俯瞰する」で詳しく紹介している公式の過去問題集をご購入いただきますようお願い致します。
解答
(1)
順序統計量の分布の公式を利用する。$[-1/2,1/2]$上の一様分布は$x\in[-1/2,1/2]$で確率密度関数が$f(x)=1$で累積分布関数が$F(x)=1/2+x$であるため,
\begin{cases}
\displaystyle
f_{1}(x_{1}) = 3\left\{1-\left(\frac{1}{2}+x_{1}\right)\right\}^{2} = 3\left(\frac{1}{2}-x_{1}\right)^{2}\\[0.7em]
\displaystyle
f_{2}(x_{2})
= {}_{3-1}C_{2-1}\cdot 3\cdot \left(\frac{1}{2}+x_{2}\right)\left(\frac{1}{2}-x_{2}\right)
= 6\left(\frac{1}{4}-x_{2}^{2}\right)\\[0.7em]
\displaystyle
f_{3}(x_{3}) = 3\left(\frac{1}{2}+x_{3}\right)^{2}\\[0.7em]
\end{cases}
が得られる。左右対称の積分区間において奇関数の積分値は$0$になることから,$X_{1}$の期待値は
E[X_{(1)}]
&= \int_{-1/2}^{1/2}x\cdot 3\left(\frac{1}{2}-x_{1}\right)^{2}dx
= -3\int_{-1/2}^{1/2}x^{2}dx = -\left[x^{3}\right]_{-1/2}^{1/2} = -\frac{1}{4}
\end{align}
となる。同様に,$X_{(2)}$の期待値は
E[X_{(2)}]
&= \int_{-1/2}^{1/2}x\cdot 6\left(\frac{1}{4}-x_{2}^{2}\right)dx
= 0
\end{align}
となる。また,$f_{3}(x_{3})=f_{1}(-x_{1})$より,
E[X_{(3)}] &= \int_{-1/2}^{1/2}xf_{3}(x)dx
= \int_{-1/2}^{1/2}xf_{1}(-x)dx
= \int_{1/2}^{-1/2}(-y)f_{1}(y)(-dy)\\[0.7em]
&= -\int_{-1/2}^{1/2}yf_{1}(y)dy
= -E[X_{(1)}] = \frac{1}{4}
\end{align}
となる。
もちろん$E[X_{3}]$も奇関数に着目して計算してもよいです。
(2)
確率変数を順序付けない場合,$3$つの確率変数は$[-1/2,1/2]$を取るため確率変数が取り得る値の範囲は原点を中心とする長さ$1$の立方体$D$になる。$3$つの実現値を$x_{1},x_{2},x_{3}$とおくと,同時確率密度関数$g$は立方体の密度を意味し,
g(x_{1},x_{2},x_{3}) &=
\begin{cases}
1\quad (x_{1},x_{2},x_{3}\in D)\\[0.7em]
0\quad \text{otherwise}
\end{cases}
\end{align}
と表される。確率変数を順序付ける場合,実現値が$x_{1}\leq x_{2}\leq x_{3}$を満たす確率は$1/3!{=}1/6$となるため,確率変数は立方体の$1/6$に相当する部分の値を取り得る。この範囲を$D^{\prime}$とおくと,
D^{\prime} &= \{(x_{1},x_{2},x_{3})|x_{1},x_{2},x_{3}\in[-1/2,1/2],~x_{1}\leq x_{2}\leq x_{3}\}
\end{align}
と表される。全確率を$1$とするためには立方体の密度を$6$倍にする必要があるため,
f(x_{1},x_{2},x_{3}) &=
\begin{cases}
6\quad (x_{1},x_{2},x_{3}\in D^{\prime})\\[0.7em]
0\quad \text{otherwise}
\end{cases}
\end{align}
が得られる。
(3)
(1)より,
\begin{cases}
\displaystyle
E[Y_{(1)}] = E[X_{(1)}+\theta] = -\frac{1}{4}+\theta\\[0.7em]
\displaystyle
E[Y_{(2)}] = E[X_{(2)}+\theta] = \theta\\[0.7em]
\displaystyle
E[Y_{(3)}] = E[X_{(3)}+\theta] = \frac{1}{4}+\theta\\[0.7em]
\end{cases}
となる。これより,
E[\hat{\theta}_{c}]
&= cE[Y_{(1)}]+(1-2c)E[Y_{(2)}]+cE[Y_{(3)}]\\[0.7em]
&= c\left(-\frac{1}{4}+\theta\right)+(1-2c)\theta + c\left(\frac{1}{4}+\theta\right)\\[0.7em]
&= \theta
\end{align}
が得られるため,$\hat{\theta}_{c}$は$\theta$の不偏推定量である。
(4)
順序統計量$Y_{(1)},Y_{(2)},Y_{(3)}$の同時確率密度関数は,(2)の結果を$\theta$平行移動させることにより,
f(y_{1},y_{2},y_{3}) &=
\begin{cases}
6\quad (y_{1},y_{2},y_{3}\in E)\\[0.7em]
0\quad \text{otherwise}
\end{cases}
\end{align}
となる。ただし,
E
&= \{(y_{1},y_{2},y_{3})|y_{1},y_{2},y_{3}\in[-1/2+\theta,1/2+\theta],~y_{1}\leq y_{2}\leq y_{3}\}\\[0.7em]
&= \{(y_{1},y_{2},y_{3})|y_{1},y_{3}\in[-1/2+\theta,1/2+\theta],~y_{1}\leq y_{2}\leq y_{3}\}
\end{align}
である。これより,$E$において$\theta$に依存しているのは$\{Y_{(1)},Y_{(3)}\}$だけであり,$\{Y_{(1)},Y_{(3)}\}$が$\theta$に関する条件を満たす限り$Y_{(2)}$の$\theta$に関する条件は満たされることが分かる。したがって,フィッシャー・ネイマンの分解定理より$\{Y_{(1)},Y_{(3)}\}$は$\theta$の十分統計量であることが示された。
(5)
f_{Y_{(2)}|\{Y_{(1)},Y_{(3)}\}}(y_{2}|\{y_{1},y_{3}\})
&= \frac{f_{Y_{(1)},Y_{(2)},Y_{(3)}}(y_{1},y_{2},y_{3})}{f_{Y_{(1)},Y_{(3)}}(y_{1},y_{3})}
\end{align}
となる。ここで,(4)より同時確率密度関数を$y_{2}$について周辺化すると,
f_{Y_{(1)},Y_{(3)}}(y_{1},y_{3})
&= \int_{y_{1}}^{y_{3}}6dy = 6(y_{3}-y_{1})
\end{align}
となるため,
f_{Y_{(2)}|\{Y_{(1)},Y_{(3)}\}}(y_{2}|\{y_{1},y_{3}\})
&= \frac{6}{6(y_{3}-y_{1})} = \frac{1}{y_{3}-y_{1}}
\end{align}
が得られる。すなわち,$Y_{(2)}|\{Y_{(1)},Y_{(3)}\}$は区間$[y_{1},y_{3}]$の一様分布に従うことが分かる。これより,
E[Y_{(2)}|\{Y_{(1)},Y_{(3)}\}]
&= \frac{Y_{(1)}+Y_{(3)}}{2}
\end{align}
が得られる。ここで,ラオ・ブラックウェルの定理より,不偏推定量を十分統計量で条件付けた期待値として定義される推定量は他の不偏推定量の分散より大きくなることはない。すなわち,
\theta^{\ast}
&= E[\hat{\theta}_{c}|\{Y_{(1)},Y_{(3)}\}]\\[0.7em]
&= cE[Y_{(1)}|\{Y_{(1)},Y_{(3)}\}]+(1-2c)E[Y_{(2)}|\{Y_{(1)},Y_{(3)}\}]+cE[Y_{(3)}|\{Y_{(1)},Y_{(3)}\}]\\[0.7em]
&= cY_{(1)}+(1-2c)\frac{Y_{(1)}+Y_{(3)}}{2}+cY_{(3)}
= \frac{Y_{(1)}+Y_{(3)}}{2}
\end{align}
で定義される$\theta^{\ast}$は,$V[\hat{\theta}_{c}]$の分散を最小にする。つまり,$\hat{\theta}_{c}=\theta^{\ast}$を満たす$c$が存在すれば,その$c$が$V[\hat{\theta}_{c}]$の分散を最小にする。実際,
cY_{(1)}+(1-2c)Y_{(2)}+cY_{(3)} &= \frac{Y_{(1)}+Y_{(3)}}{2}
\end{align}
を解くと$c=1/2$となるため,$c=1/2$が$V[\hat{\theta}_{c}]$の分散を最小にすることが分かる。
ラオ・ブラックウェルの定理は「任意の不偏推定量と十分統計量に基づく条件付き期待値を取ることで,元の不偏推定量以上に良い(分散が小さい)不偏推定量が得られる」と理解しましょう。
コメント