【過去問解答】2016年統計検定1級<統計数理5>

統計検定1級の過去問解答解説を行います。目次は以下をご覧ください。

不適切な内容があれば,記事下のコメント欄またはお問い合わせフォームよりご連絡下さい。

目次

問題

統計検定1級の過去問からの出題になります。統計検定の問題の著作権は日本統計学会に帰属していますので,本稿にて記載することはできません。「演習問題を俯瞰する」で詳しく紹介している公式の過去問題集をご購入いただきますようお願い致します。

解答

欠損メカニズムの検定に関する出題でした。

(1)

与えられた$\barX$の定義より,

\begin{align}
\barX_{(1)}-\barX
&= \frac{(n-m)\barX_{(1)}-(n-m)\barX_{(0)}}{n}
= \frac{(n-m)}{n}(\barX_{(1)}-\barX_{(0)})
\end{align}

および

\begin{align}
\barX_{(0)}-\barX
&= \frac{m\barX_{(0)}-m\barX_{(1)}}{n}
= -\frac{m}{n}(\barX_{(1)}-\barX_{(0)})
\end{align}

が得られるため,

\begin{align}
d^{2}
&= \frac{1}{S^{2}}\left\{m(\barX_{(1)}-\barX)^{2}+(n-m)(\barX_{(0)}-\barX)^{2}\right\}\\[0.7em]
&= \frac{1}{S^{2}}\left\{\frac{m(n-m)^{2}}{n^{2}}(\barX_{(1)}-\barX_{(0)})^{2}+\frac{(n-m)m^{2}}{n^{2}}(\barX_{(0)}-\barX)^{2}\right\}\\[0.7em]
&= \frac{1}{S^{2}}\frac{m(n-m)}{n^{2}}\left\{(n-m+m)(\barX_{(1)}-\barX_{(0)})^{2}\right\}
= \frac{1}{S^{2}}\frac{m(n-m)}{n}(\barX_{(1)}-\barX_{(0)})^{2}
\end{align}

となる。

(2)

本問で示したい関係は

\begin{align}
\frac{SS_{B}}{SS_{T}/(n-1)}
&= \frac{(n-1)F}{n-2+F}\label{2_1}
\end{align}

である。左辺を変形して$F$を出現させてもよいが,右辺に$F$を代入して左辺となることを確認した方が簡単である。実際,総平方和が群内平方和と群間平方和の和で表される

\begin{align}
SS_{T} &= SS_{W}+SS_{B}
\end{align}

という関係を利用すると,

\begin{align}
\frac{(n-1)F}{n-2+F}
&= \frac{(n-1)SS_{B}/\{SS_{W}/(n-2)\}}{n-2+SS_{B}/\{SS_{W}/(n-2)\}}
= \frac{(n-1)(n-2)SS_{B}}{(n-2)SS_{W}+(n-2)SS_{B}}\\[0.7em]
&= \frac{(n-1)SS_{B}}{SS_{W}+SS_{B}} = \frac{SS_{B}}{SS_{T}/(n-1)}
= d^{2}
\end{align}

が示される。

公式解答では式($\ref{2_1}$)の左辺を変形して右辺と等しくなることを示しています。

(3)

F分布とt分布の関係より,自由度$(1,n-2)$の$F$分布に従う確率変数$F$は,自由度$n-2$の$t$分布に従う確率変数$T$を用いて$F=T^{2}$と表される。$d^{2}$は$F$の狭義単調増加関数であることから,$F$が定まれば$d^{2}$も一意に定まるため,$T$と$d^{2}$は一対一対応する。自由度$n-2$の$t$分布は標本数が$2$であることから,検定統計量$d^{2}$に基づく検定は$2$標本両側$t$検定と同等であることが示された。

F分布とt分布の関係を知らないと解答は難しい問題でした。試験時間中に証明を行なってもよいですが,時間的に厳しいでしょう。なお,$d^{2}$が$F$の狭義単調増加関数であることに言及しないと,等価性は証明できません。

(4)

統計検定量$d^{2}$に基づく検定が有意であったとき,帰無仮説は棄却されるため,観測部分における$X$の分布と欠損部分における$X$の分布の平均は等しくない。これより,欠損のメカニズムはMCARではないと結論付けられる。一方,統計検定量$d^{2}$に基づく検定が有意でなかったとき,帰無仮説は棄却されないため,観測部分における$X$の分布と欠損部分における$X$の分布の平均は異なるとは言えない。ここで,帰無仮説が棄却されない場合は,あくまでも「平均は異なるとは言えない」ことしか分からず,平均が等しいとは言えないことに注意する。これより,欠損のメカニズムはMCARとまでは言えないと結論付けられる。

仮説検定の原則に逆らって,無理やり「帰無仮説が棄却されなかったから平均は同じだ」という暴論を考えたとしても,問題文にある通り今回は両分布の分散が等しいという強い仮定を置いているため,暴論を受け入れることは難しいでしょう。

(5)

両分布の分散比に関しては,$F$検定が利用できる。両分布が一致しているかどうかに関しては,コルモゴロフ・スミルノフ検定が利用できる。ただし,コルモゴロフ・スミルノフ検定では,十分なサンプルサイズを確保できないと他の検定と比べて検出力が低くなってしまうため,欠損データが多い場合は注意が必要である。

シェアはこちらからお願いします!

コメント

コメントする

※ Please enter your comments in Japanese to distinguish from spam.

目次