統計検定1級の過去問解答解説を行います。目次は以下をご覧ください。
不適切な内容があれば,記事下のコメント欄またはお問い合わせフォームよりご連絡下さい。
問題
統計検定1級の過去問からの出題になります。統計検定の問題の著作権は日本統計学会に帰属していますので,本稿にて記載することはできません。「演習問題を俯瞰する」で詳しく紹介している公式の過去問題集をご購入いただきますようお願い致します。
解答
一様分布と完備十分統計量に関する出題です。
(1)
フィッシャー・ネイマンの因子分解定理より,$Y$がパラメータ$\theta$に関する十分統計量であることを示すためには,$p_{\theta}$を$X_{1},\ldots,X_{n}$の同時確率密度関数としたときに,
p_{\theta}(x) &= g_{\theta}(Y)h(x)\label{フィッシャー・ネイマン}
\end{align}
と分解できることを示せばよい。$X_{1},\ldots,X_{n}$は独立であることと一様分布の確率密度関数から,同時確率密度関数は
p_{\theta}(x_{1},\ldots,x_{n}) &=
\begin{cases}
\displaystyle
\frac{1}{\theta^{n}}&(0<x_{1},\ldots,x_{n}<\theta)\\[0.7em]
\displaystyle
0&(\text{その他})
\end{cases}
\end{align}
となる。いま,$0<x_{1},\ldots,x_{n}<\theta$は$0<y<\theta$と同値であることから,$p_{\theta}$は$y$の関数となるため,式($\ref{フィッシャー・ネイマン}$)において
g_{\theta}(Y) &=
\begin{cases}
\displaystyle
\frac{1}{\theta^{n}}&(0<y<\theta)\\[0.7em]
\displaystyle
0&(\text{その他})
\end{cases},\quad
h(x) = 1
\end{align}
とおくことができる。したがって,フィッシャー・ネイマンの因子分解定理より,$Y$はパラメータ$\theta$の十分統計量であることが示された。
十分統計量の証明にはフィッシャー・ネイマンの因子分解定理を利用しましょう。
(2)
順序統計量の分布の性質より,$Y$の確率密度関数は
g(y) &= nf(y)F(y)^{n-1}
\end{align}
で表される。一様分布の累積密度関数は,$0<x<\theta$の範囲で
F(x) &= \int_{0}^{x}\frac{1}{\theta}du = \frac{x}{\theta}
\end{align}
となることに注意すると,$0<y<\theta$の範囲で
g(y) &= \frac{n}{\theta}\left(\frac{y}{\theta}\right)^{n-1} = \frac{n}{\theta^{n}}y^{n-1}
\end{align}
が得られる。
順序統計量の分布の性質は統計検定では頻出のトピックですので,必ずおさえるようにしてください。
(3)
f(x_{1},\ldots,x_{n}|y) &= \frac{1}{y^{n-1}}
\end{align}
条件付き確率関数の定義より,
f(x_{1},\ldots,x_{n}|y) &= \frac{f(x_{1},\ldots,x_{n},y)}{g(y)}\label{3-1}
\end{align}
となります。いま,$Y$は$X_{1},\ldots,X_{n}$のうちいずれかとなるため,選び方は$n$通り存在します。そこで,$X_{1},\ldots,X_{n}$のうち$Y$以外の確率変数を改めて$X_{1},\ldots,X_{n-1}$とおくと,
f(x_{1},\ldots,x_{n},y) &= nf(x_{1},\ldots,x_{n-1},y) = \frac{n}{\theta^{n}}\label{3-2}
\end{align}
となります。ただし,$X_{1},\ldots,X_{n-1},Y$がそれぞれ独立に一様分布に従うことを利用しました。式($\ref{3-1}$)に前問(2)の結果と式($\ref{3-2}$)を代入すると,
f(x_{1},\ldots,x_{n}|y) &= \frac{n}{\theta^{n}}\cdot \frac{\theta^{n}}{ny^{n-1}}
= \frac{1}{y^{n-1}}
\end{align}
が得られます。
問(1)ではフィッシャー・ネイマンの因子分解定理を用いて$Y$が十分統計量であることを示しましたが,本問では定義に基づいて$Y$が十分統計量であることが示されます。十分統計量の定義は,$Y=y$で条件付けたときの$X_{1},\ldots,X_{n}$の同時確率密度関数がパラメータ$\theta$に依存しないというものでした。
(4)
$Y$の期待値は
E[Y] &= \frac{n}{n+1}\theta
\end{align}
となる。ゆえに,
\tilde{\theta} &= \frac{n+1}{n}Y
\end{align}
と構成すれば,$E[\tilde{\theta}]=\theta$を満たすような$\theta$の不偏推定量を構成できる。
期待値の定義と問(2)の答えを利用すると,$Y$の期待値は
E[Y] &= \int_{0}^{\theta}y\cdot\frac{n}{\theta^{n}}y^{n-1}dy
= \frac{n}{\theta^{n}}\left[\frac{1}{n+1}y^{n+1}\right]_{0}^{\theta}
= \frac{n}{\theta^{n}}\cdot \frac{\theta^{n+1}}{n+1}
= \frac{n}{n+1}\theta
\end{align}
となります。あとは,$E[\tilde{\theta}]=\theta$となるような$\tilde{\theta}$を$Y$の関数で表すだけです。
(5)
条件より,
E[u(Y)] &= \int_{0}^{\theta}u(y)\frac{n}{\theta^{n}}y^{n-1}dy
= \frac{n}{\theta^{n}}\int_{0}^{\theta}u(y)y^{n-1}dy
= 0
\end{align}
が得られる。すなわち,積分の項が$0$となる必要があるため,
\int_{0}^{\theta}u(y)y^{n-1}dy &= 0\label{5-1}
\end{align}
が得られる。さて,ここではなめらかな関数を「$Y$の定義域において$C^{\infty}$級である関数」と解釈する。すると,微分可能である関数は連続であること,そして任意の連続関数には原始関数が存在することから,$u(Y)$には$Y$の定義域において原始関数が存在する。このとき,式(\ref{5-1})を$\theta$で微分すると,
u(\theta)\theta^{n-1} &= 0\label{5-2}
\end{align}
が得られる。したがって,式(\ref{5-2})がすべての$\theta>0$で成り立つならば,常に$u=0$でなくてはならない。
$Y$の関数$u(Y)$の期待値が恒等的に$0$となるものは定数$0$に限るという本問の結論より,統計量$Y$は完備であることが示されました。問(1)より$Y$は十分統計量ですから,$Y$は完備十分統計量であることが分かります。
本問では,「なめらかな関数」の解釈に困った人が多そうです。統計検定は稀に「厳密な理解をそこそこ要する数学的概念」を持ち出しますが,本番では上記解答まで厳密な議論が求められてはいないと思います。実際に,公式回答では「$C^{\infty}$級である関数」という文言は一切使われておらず,水を濁しています。本稿では,関数のなめらかさを敢えて明確に言語化することで,分かりやすさを意識しました。
もしかすると,統計検定の出題者は敢えて曖昧な用語を用いることで,受験者の解答にマルを付ける余地を与えてくれているのかもしれません。受験者が関数のなめらかさを理解していなくても,当てずっぽうで「関数$h$がなめらかならば,任意の$a>0$に対して$ah=0$を満たすときに$h=0$となる」というような内容の解答を書くことができれば,おそらく丸がもらえると思います。
(6)
$\theta$の不偏推定量を$v(Y)$とすると,すべての$\theta$に対して
E[v(Y)] &= \theta\label{6-1}
\end{align}
を満たす。期待値の線形性に注意すると,すべての$\theta$に対して,問(4)で導出した$\tilde{\theta}$を用いて,
E[v(Y)-\tilde{\theta}] &= E[v(Y)]-E[\tilde{\theta}] = \theta-\theta = 0
\end{align}
が成り立つ。ここで,問(5)の結果を利用すると,
v(Y)-\tilde{\theta} &= 0
\end{align}
が成り立つ。すなわち,$v(Y)=\tilde{\theta}$となるため,$\tilde{\theta}$は唯一の不偏推定量である。
これだけ小問が多ければ,いままで導出してきた答えを利用する誘導問題である可能性は非常に高いです。今回の問題の全体的な構成も,前の問題の答えを使って徐々に進んでいく形の出題でした。
コメント
コメント一覧 (2件)
いつも分かりやすい情報整理ありがとうございます,大変参考にさせていただいております.
(3)において,Y=yの選び方はn通りあるとのことですが,「最大値を取る確率変数は一つである」という前提は,どこから導かれるものでしょうか.
複数の確率変数X_i,X_jが同じ値をとり,それが最大値となるケースも考える必要があるのではと思っての質問になります.
お手隙でご回答いただけますと幸いです.
PICA様
ご質問ありがとうございます。問題で「$Y=\max(X_{1},\ldots,X_{n})$とする」と書かれている時点で$Y$は一意に定まるものと捉えてよいと考えています。仮に$X_{i}$と$X_{j}$が同一の値をとったとしても,例えばランダムに最大値を定めたときには$Y$の選び方は$n$通りとなることに変わりはありません。「$X_{i}$と$X_{j}$が重複するというエッジケースも含めて$X_{1},\ldots,X_{n}$は一様に分布しているため最大値の選び方は$n$通りである」というご説明で納得いただけますでしょうか。