統計検定1級の過去問解答解説を行います。目次は以下をご覧ください。
不適切な内容があれば,記事下のコメント欄またはお問い合わせフォームよりご連絡下さい。
問題
統計検定1級の過去問からの出題になります。統計検定の問題の著作権は日本統計学会に帰属していますので,本稿にて記載することはできません。「演習問題を俯瞰する」で詳しく紹介している公式の過去問題集をご購入いただきますようお願い致します。
解答
二項分布におけるパラメータ依存の分布関数に関する出題です。
(1)
E[X] &= G_{X}^{\prime}(1),\quad
V[X] = G_{X}^{\prime\prime}(1)+G_{X}^{\prime}(1)-\left\{G_{X}^{\prime}(1)\right\}^{2}\label{解答_1}
\end{align}
確率母関数の性質より,$E[X]$と$V[X]$は式($\ref{解答_1}$)のように表されます。
(2)
E[X] &= np,\quad
V[X] = np(1-p)
\end{align}
二項分布の確率質量関数は,
f_{X}(x) &= {}_n C_x~p^x(1-p)^{1-x}
\end{align}
で表されますので,二項分布の確率母関数は,
G_{X}(t) &= \sum_{k=0}^{n}{}_n C_k~(pt)^{k}(1-p)^{1-k} = (pt+1-p)^{n}\label{2-1}
\end{align}
で表されます。いま,確率母関数の一階微分と二階微分は
G_{X}^{\prime}(t) &= np(pt+1-p)^{n-1},\quad
G_{X}^{\prime\prime}(t) = n(n-1)p^{2}(pt+1-p)^{n-2}
\end{align}
と計算できますので,二項分布の期待値は,
E[X] &= G_{X}^{\prime}(1) = np\
\end{align}
と計算でき,分散は
V[X] &= G_{X}^{\prime\prime}(1)+G_{X}^{\prime}(1)-\left\{G_{X}^{\prime}(1)\right\}^{2}
= n(n-1)p^{2}+np-(np)^{2}
= np(1-p)
\end{align}
と計算できます。
(3)
$G_{X}(t)$の定義より,
t^{-r}G_{X}(t) &= \sum_{k}t^{k-r}P(X=k)\\[0.7em]
&= \sum_{k\leq r}t^{k-r}P(X=k)+\sum_{k>r}t^{k-r}P(X=k)\\[0.7em]
&\geq \sum_{k\leq r}t^{k-r}P(X=k)\label{3-1}
\end{align}
と変形できる。いま,$k\leq r$のとき$k-r\leq 0$であり,$0<t\leq 1$であることから$t^{k-r} \geq 1$が得られる。これを式($\ref{3-1}$)に代入すると,
t^{-r}G_{X}(t) &\geq \sum_{k\leq r}P(X=k)
= P(X\leq r)\label{3-2}
\end{align}
が得られる。
実際の問題では,$k$に関する和を$r$を境界として分解するというヒントが与えられています。ヒントが与えられていなくても,目的が$k=r$までの累積確率であることに注目すれば,似たような解答には辿り着けるはずです。
(4)
式($\ref{3-2}$)に二項分布の確率母関数($\ref{2-1}$)を代入すればよい。$r$は$X$の定義域内の実数,すなわち非負の実数であれば存在することから$r=an$としてよく,
P(X\leq an) &\leq t^{-an}G_{X}(t)
= t^{-an}(pt+1-p)^{n}\label{4-1}
\end{align}
が得られる。よって,式($\ref{4-1}$)の右辺の最小値を調べればよい。対数を取る前後で関数の増減が変化しないことから,右辺の対数関数を
\ln f(t) &= \ln\left\{t^{-an}(pt+1-p)^{n}\right\}\\[0.7em]
&= -an\ln t + n\ln(pt+1-p)
\end{align}
とおいて$\ln f(t)$の最小値を調べる。$\ln f(t)$の導関数は
\frac{d}{dt}\ln f(t) &= -\frac{an}{t}+\frac{np}{pt+1-p}\\[0.7em]
&= \frac{-an(pt+1-p)+npt}{t(pt+1-p)}\\[0.7em]
&= n\cdot\frac{pt(1-a)-a(1-p)}{t(pt+1-p)}
\end{align}
となるため,導関数が$0$となる点は
\hat{t} &= \frac{a(1-p)}{p(1-a)}
\end{align}
となる。実際に,$t$の定義域である$0<t\leq 1$に$\hat{t}$が存在することを確認しておく。$\hat{t}$は
\hat{t} &= \frac{(1-p)/p}{(1-a)/a}
\end{align}
と変形でき,$0<a<p$であることから,$\hat{t}$は正かつ分母の方が分子より大きくなるため,$0<\hat{t}\leq 1$となる。増減表を用いて$f(\hat{t})$が最小値であることを確認するのは割愛するが,$f(t)$の最小値は
f(\hat{t}) &= \left\{\frac{a(1-p)}{p(1-a)}\right\}^{-an}\left\{\frac{a(1-p)}{(1-a)}+1-p\right\}^{n}\\[0.7em]
&=\left\{\frac{a(1-p)}{p(1-a)}\right\}^{-an}\left\{(1-p)\frac{a+(1-a)}{(1-a)}\right\}^{n}\\[0.7em]
&=\left(\frac{p}{a}\right)^{an}\left(\frac{1-p}{1-a}\right)^{-an}\left(\frac{1-p}{1-a}\right)^{n}\\[0.7em]
&=\left(\frac{p}{a}\right)^{an}\left(\frac{1-p}{1-a}\right)^{(1-a)n}
\end{align}
となる。以上より,
P(X\leq an) &\leq \left(\frac{p}{a}\right)^{an}\left(\frac{1-p}{1-a}\right)^{(1-a)n}
\end{align}
が示された。
積で表されている関数の最大最小は,対数を取って考えると分かりやすいです。これは尤度関数の最大化問題である最尤推定でも頻出の考え方なので,必ずおさえておくようにしたいです。
コメント