統計検定1級の過去問解答解説を行います。目次は以下をご覧ください。
不適切な内容があれば,記事下のコメント欄またはお問い合わせフォームよりご連絡下さい。
問題
統計検定1級の過去問からの出題になります。統計検定の問題の著作権は日本統計学会に帰属していますので,本稿にて記載することはできません。「演習問題を俯瞰する」で詳しく紹介している公式の過去問題集をご購入いただきますようお願い致します。
解答
分散分析モデルの検定と欠損値に関する出題でした。
(1)
D_{i} &\sim \N(\theta, 2\sigma^{2})
\end{align}
正規分布の再生性より$D_{i}$の従う分布は正規分布であり,平均と分散は下記のように計算されます。
\begin{cases}
E[D_{i}] = E[Y_{i}]-E[X_{i}] = \theta\\[0.7em]
V[D_{i}] = V[Y_{i}]+V[X_{i}] = 2\sigma^{2}
\end{cases}
(2)
\nu = \bar{\mu}+\frac{\theta}{2},\quad
a_{i} = \mu_{i}-\bar{\mu},\quad
b_{1} = -\frac{\theta}{2},\quad
b_{2} = \frac{\theta}{2}
\end{align}
与式(1)の両辺の期待値をとることにより,
\begin{cases}
E[Z_{i1}] = E[X_{i}] = \nu+a_{i}+b_{1} = \mu_{i}\\[0.7em]
E[Z_{i2}] = E[Y_{i}] = \nu+a_{i}+b_{2} = \mu_{i}+\theta
\end{cases}
が得られます。制約条件を使うために両辺の$i{=}1,\ldots,n$に関する総和を考えると,
\begin{cases}
b_{1} = \bar{\mu}-\nu\\[0.7em]
b_{2} = \bar{\mu}+\theta-\nu
\end{cases}
が得られます。ただし,$\bar{\mu}{=}\mu/n$とおきました。二つの式の和を考えることにより,
\nu &= \bar{\mu}+\frac{\theta}{2}
\end{align}
が得られます。これを元の式に代入することにより,
\begin{cases}
\displaystyle
b_{1} = -\frac{\theta}{2}\\[0.7em]
\displaystyle
b_{2} = \frac{\theta}{2}\\[0.7em]
\displaystyle
a_{i} = \mu_{i}-(\nu+b_{1}) = \mu_{i}-\bar{\mu}
\end{cases}
が得られます。
(3)
- (a): 統計量は$(S_{B}/\phi_{B})/(S_{E}/\phi_{E})$で,帰無分布は$\F(\phi_{B},\phi_{E})$
- (b): 統計量は$(S_{A}/\phi_{A})/(S_{E}/\phi_{E})$で,帰無分布は$\F(\phi_{A},\phi_{E})$
$m{=}\sum_{i,j}Z_{ij}/(2n)$,パラメータ$a_{1},\ldots,a_{n}$の因子を$A$,パラメータ$b_{1},b_{2}$の因子を$B$とおき,
m_{Ai} &= \frac{Z_{i1}+Z_{i2}}{2},\quad m_{Bj} = \frac{\sum_{i=1}^{n}Z_{ij}}{n}
\end{align}
とおくとき,総平方和$S$は$A$間平方和$S_{A}$,$B$間平方和$S_{B}$,残差平方和$S_{E}$を用いて
S &= S_{A}+S_{B}+S_{E}
\end{align}
と分解されます。
自分自身の二乗和以外の項は$0$の項が出現して消えてしまうからです。
$S_{A}$,$S_{B}$,$S_{E}$はそれぞれ
\begin{cases}
\displaystyle
S_{A} = 2\sum_{i=1}^{n}(m_{Ai}-m)^{2}\\[0.7em]
\displaystyle
S_{B} = n\sum_{j=1}^{2}(m_{Bj}-m)^{2}\\[0.7em]
\displaystyle
S_{E} = \sum_{i=1}^{n}\sum_{j=1}^{2}(Z_{ij}-m_{Ai}-m_{Bj}+m)^{2}
\end{cases}
と表され,自由度はそれぞれ$\phi_{A}{=}n{-}1$,$\phi_{B}{=}2{-}1{=}1$,$\phi_{E}{=}2n{-}n{-}2{+}1{=}n{-}1$となります。
$\phi_{A}{=}n{-}1$で「$-1$」されているのは,$n{-}1$群の平均が分かれば残りの$1$群の平均も分かるからです。同様に,$\phi_{B}{=}2{-}1$で「$-1$」されているのは,$2{-}1$群の平均が分かれば残りの$1$群の平均も分かるからです。同様に,$\phi_{E}{=}2n{-}n{-}2{+}1{=}n{-}1$で「${-}(n{+}2{-}1)$」されているのは,$n{+}2{-}1$群の平均が分かれば残りの$1$群の平均も分かるからです。
帰無仮説(a)について,$\theta{=}0$は$b_{1}{=}b_{2}{=}0$と同値になりますので,統計量$(S_{B}/\phi_{B})/(S_{E}/\phi_{E})$で要因$B$に関する検定を行えばよく,帰無分布は$\F(\phi_{B},\phi_{E})$となります。同様にして,帰無仮説(b)について,$\mu_{1}{=}\cdots{=}\mu_{n}{=}0$は$a_{1}{=}\cdots{=}a_{n}{=}0$と同値になりますので,統計量$(S_{A}/\phi_{A})/(S_{E}/\phi_{E})$で要因$A$に関する検定を行えばよく,帰無分布は$\F(\phi_{A},\phi_{E})$となります。
(4)
まず,$X_{i}$と$Y_{i}$がそれぞれ従う分布から,$X_{i}$は$\mu_{i}$,$Y_{i}$は$\mu_{i}$と$\theta$に関する情報を保持している。そのため,$X_{1}$が欠損した場合は$\mu_{i}$の情報を得ることができず,たとえ$Y_{1}$を得たとしても帰無仮説(a)で扱う$\theta$の推定量に$Y_{1}$が貢献することはできない。したがって,$Y_{1}$を除く$n-1$個のデータを用いた分散分析に基づく検定を行えばよいことが分かる。
具体的に最尤推定量を求めて議論できますが,too muchな印象を受けます。
(5)
前問(4)と同様に,$X_{i}$と$Y_{i}$がそれぞれ従う分布から,$X_{i}$は$\mu_{i}$,$Y_{i}$は$\mu_{i}$と$\theta$に関する情報を保持している。そのため,$X_{1}$が欠損した場合は$\mu_{i}$の情報を得ることができないが,代わりに$Y_{1}$の保持する$\mu_{i}$の情報を用いて帰無仮説(a)で扱う$\mu_{1}$の推定量に貢献することができる。例えば,$Y_{1}$の値が$Y_{2},\ldots,Y_{n}$の値と大きくかけ離れている場合は,$\mu_{1}$の値と$\mu_{2},\ldots,\mu_{n}$の値は異なる値で推定した方が合理的である。このように,$Y_{1}$を除く$n-1$個のデータを用いた分散分析に基づく検定を行うよりも,$Y_{1}$も含めた$n$個のデータを用いた分散分析に基づく検定を行った方が,合理的な推定を行うことができる。
前問同様,具体的に最尤推定量を求めて議論できますが,too muchな印象を受けます。
コメント
コメント一覧 (3件)
式(10)のSAとSBが理解できないです。
例えば要因Aに関するF検定ならば、水準Aの平方和を用いて計算を行うので
\begin{align}
2\sum_{i=1}^{n}(m_{Ai}-m)^{2}
\end{align}
ではないのでしょうか。
ご質問ありがとうございます。
$m_{Ai}$を代入して$S_{A}$を$Z_{i1}$と$Z_{i2}$だけで表すと等価であることが示せます。
ただ,ご指摘の表記が平方和として一般的であるため本文を修正しました。
ありがとうございました。