統計検定1級の過去問解答解説を行います。目次は以下をご覧ください。
不適切な内容があれば,記事下のコメント欄またはお問い合わせフォームよりご連絡下さい。
問題
統計検定1級の過去問からの出題になります。統計検定の問題の著作権は日本統計学会に帰属していますので,本稿にて記載することはできません。「演習問題を俯瞰する」で詳しく紹介している公式の過去問題集をご購入いただきますようお願い致します。
解答
対称性のある尤度比検定に関する出題でした。
(1)
各セルの観測度数は多項分布に従うと考えられるため,
P(X_{ij}=x_{ij};~i,j=1,\ldots,I)
&= \frac{N!}{\prod_{i,j=1}^{I}x_{ij}!}\prod_{i,j=1}^{I}p_{ij}^{x_{ij}}
\end{align}
と表される。ただし,$x_{ij}\geq 0$は$\sum_{i,j=1}^{I}x_{ij}=N$を満たす。
(2)
小問(1)より,最尤推定関数$L$は
L &= \log\left(\frac{N!}{\prod_{i,j=1}^{I}x_{ij}!}\right)+\sum_{i,j=1}^{I}x_{ij}\log p_{ij}
\end{align}
となる。$\sum_{i,j=1}^{I}p_{ij}=1$の下で$L$を最大にする$p_{ij}$を求めるため,ラグランジュ関数$J$をおくと,
J &= \log\left(\frac{N!}{\prod_{i,j=1}^{I}x_{ij}!}\right)+\sum_{i,j=1}^{I}x_{ij}\log p_{ij}+\lambda\left(\sum_{i,j=1}^{I}p_{ij}-1\right)
\end{align}
と表される。ここで,対称性の仮説$H_{0}:p_{ij}=p_{ji}~(i\neq j)$を利用すると,$J$は
J &{=} \log\left(\frac{N!}{\prod_{i,j=1}^{I}x_{ij}!}\right){+}\sum_{i=1}^{I}x_{ii}\log p_{ii}{+}\sum_{i>j}(x_{ij}+x_{ji})\log p_{ij}{+}\lambda\left(\sum_{i=1}^{I}p_{ii}+2\sum_{i>j}p_{ij}-1\right)
\end{align}
と変形されるため,$p_{kk}$と$p_{kl}$で偏微分して$0$とおくと,
\begin{cases}
\displaystyle
\frac{\partial L}{\partial p_{kk}}
= \frac{x_{kk}}{p_{kk}}+\lambda = 0&(k=l)\\[0.7em]
\displaystyle
\frac{\partial L}{\partial p_{kl}}
= \frac{x_{kl}+x_{lk}}{p_{kl}}+2\lambda = 0&(k>l)
\end{cases}
が得られる。上式を変形して両辺で$k,l$に関する総和をとることにより,
\lambda\sum_{k=1}^{I}p_{kk} &= \lambda = -\sum_{k=1}^{I}x_{kk} = -N
\end{align}
となるため,$L$を最大にする$p_{kk}$と$p_{kl}$は
\begin{cases}
\displaystyle
\hat{p}_{kk} = \frac{x_{kk}}{N}&(k=l)\\[0.7em]
\displaystyle
\hat{p}_{kl} = \frac{x_{kl}+x_{lk}}{2N}&(k\neq l)
\end{cases}
となる。ただし,対称性の仮説より$k>l$は$k\neq l$としてもよいことに注意する。以上より,各セルの期待度数は標本の大きさ$N$に対してセル確率をかければよいため,
\begin{cases}
\displaystyle
m_{ii} = N\cdot\frac{x_{ii}}{N} = x_{ii}&(i=j)\\[0.7em]
\displaystyle
m_{ij} = N\cdot\frac{x_{ij}+x_{ji}}{2N} = \frac{x_{ij}+x_{ji}}{2}&(i\neq j)
\end{cases}
となる。
(3)
尤度比統計検定量$\Lambda$は,パラメータに帰無仮説で設定された値を代入した尤度と最尤推定値を代入した尤度の比で,小問(1)と小問(2)の結果を踏まえると以下のように表される。
\Lambda &=
\frac{\prod_{i=1}^{I}(x_{ii}/N)^{x_{ii}}\prod_{i\neq j}\{(x_{ij}+x_{ji})/(2N)\}^{x_{ij}}}{\prod_{i=1}^{I}(x_{ii}/N)^{x_{ii}}\prod_{i\neq j}(x_{ij}N)^{x_{ij}}}
= \prod_{i\neq j}\left(\frac{x_{ij}+x_{ji}}{2x_{ij}}\right)^{x_{ij}}
\end{align}
分母に最尤推定量を設定したときは,尤度比検定の統計検定量は$G^{2}=-2\log \Lambda$となる。
G^{2} &= -2\log \Lambda = 2\sum_{i\neq j}x_{ij}\log\left(\frac{2x_{ij}}{x_{ij}+x_{ji}}\right)
\equiv 2\sum_{i\neq j}y_{ij}
\end{align}
$G^{2}$は$x_{ij}$が大きいと近似的に自由度$I(I-1)/2$のカイ二乗分布に従う。表1のデータより,
(i,j) | (1,2) | (1,3) | (1,4) | (2,3) | (2,4) | (3,4) | (2,1) | (3,1) | (4,1) | (3,2) | (4,2) | (4,3) |
---|---|---|---|---|---|---|---|---|---|---|---|---|
$x_{ij}$ | $266$ | $124$ | $66$ | $432$ | $78$ | $205$ | $234$ | $117$ | $36$ | $362$ | $82$ | $179$ |
$y_{ij}$ | $0.062$ | $0.029$ | $0.258$ | $0.084$ | $-0.025$ | $0.066$ | $-0.066$ | $-0.029$ | $-0.348$ | $-0.092$ | $0.025$ | $-0.070$ |
$x_{ij}y_{ij}$ | $16.492$ | $3.596$ | $17.028$ | $36.288$ | $-1.95$ | $13.53$ | $-15.444$ | $-3.393$ | $-12.528$ | $-33.304$ | $2.05$ | $-12.53$ |
が得られるため,$G^{2}=19.67$となる。$I=4$より収束先のカイ二乗分布の自由度は$4\cdot(4-1)/2=6$となり,自由度$6$のカイ二乗分布の上側$1$%点は表より$16.81$となるため,$P$-値は$0.01$よりも小さくなることが分かる。
$x_{ij}$が大きいと$-2\log \Lambda$が近似的に自由度$I(I-1)/2$のカイ二乗分布に従う証明は,別ページにて準備中です。試験本番では特に証明不要です。
(4)
問題文で$(p_{11},p_{i1},p_{1j},p_{ij})\rarr(\theta_{i},\phi_{j},\lambda_{ij})$の変換が与えられているため,逆変換が存在すればこのパラメータ変換は一意であることが示される。実際,$\sum_{i,j}p_{ij}=1$に注意すると
\begin{cases}
\displaystyle
p_{11}=\frac{1}{1+\sum_{i=2}^{I}e^{\theta_{i}}+\sum_{i=2}^{I}e^{\phi_{j}}+\sum_{i=2}^{I}e^{\theta_{i}+\phi_{j}+\lambda_{ij}}}\\[0.7em]
p_{i1}=p_{11}e^{\theta_{i}}\quad(i=2,\cdots,I)\\[0.7em]
p_{1j}=p_{11}e^{\phi_{j}}\quad(i=2,\cdots,I)\\[0.7em]
p_{ij}=p_{11}e^{\theta_{i}+\phi_{j}+\lambda_{ij}}\quad(i=2,\cdots,I)
\end{cases}
のような逆変換が得られるため,このパラメータ変換は一意となる。
(5)
帰無仮説$H_{0}$が成り立つとき,$i,j=2,\cdots,I$かつ$i\neq j$に対し
\lambda_{ij}
&= \log\frac{p_{ij}p_{11}}{p_{i1}p_{1j}}
= \log\frac{p_{ji}p_{11}}{p_{j1}p_{1i}}
= \lambda_{ji}
\end{align}
となるため,同様の$i,j$に対し$\lambda_{ij}=\lambda_{ji}$が成り立つ。逆に,$\lambda_{ij}=\lambda_{ji}$のとき帰無仮説$H_{0}$が成り立つかに関しては,反例を$1$つでも見つけることができれば成り立たないことを示すことができる。そこで,例えば$I=3$のとき$(i,j)=(2,3)$を考えると,
\log\frac{p_{23}p_{11}}{p_{21}p_{13}}
&= \log\frac{p_{32}p_{11}}{p_{31}p_{12}}
\end{align}
より$p_{12}p_{23}p_{31}=p_{13}p_{21}p_{32}$が得られるが,この条件からは$i\neq j$に対して$p_{ij}=p_{ji}$であることは導かれないため,逆については成り立たないことが示された。
コメント