【問題演習】二項分布の正規近似と第一種の過誤

zuka

こんにちは。
zuka(@beginaid)です。

本記事は「これなら分かる!はじめての数理統計学」シリーズに含まれます。

もし不適切な内容があれば,記事下のコメント欄又はお問い合わせフォームよりご連絡下さい。

問題

Aさんは,あるコインを投げたときに表と裏の出る確率が等しいといえるかどうかを調べようとしています。コインを$400$回投げ,表の出る回数を$X$とするとき,以下の問いに答えなさい。ただし,正規分布表は自分でググること(後日記載予定です)。

  • 「表と裏の出る確率が異なる」と結論できるような$X$の範囲を求めなさい。ただし,有意水準は$0.02$とする。
  • 実際にコインを投げたところ表が$181$回出ました。このとき,第一種の過誤を犯す確率を求めなさい。

解答

検定では,まず以下の観点に注目するのでした。

  • 母集団が従う分布は何か?
    • サンプル数は十分($30$〜$40$以上)に大きいか(→正規分布)
    • 誤差を対象にしているかどうか(→正規分布)
    • 問題文で指定されているか
  • 母分散が既知か?

今回はコインを複数回投げるという試行は二項分布で表すことができますが,サンプル数が十分に大きいため正規分布で近似することを考えます。

最初の問題は「表と裏の出る確率が異なる」と結論できるような$X$の範囲を求めることでした。まず,行う検定の帰無仮説と対立仮説を確認しましょう。表と裏の出る確率が等しいことを帰無仮説におけば,対立仮説を示したい「表と裏の出る確率が異なる」と設定することができます。表の出る確率を$p$とおきます。

  • 帰無仮説$H_0$:$p = 1/2$
  • 対立仮説$H_1$:$p \neq 1/2$

さて,「表と裏の出る確率が異なる」と結論できる状況,つまり対立仮説が正しいという状況を数式で表してみましょう。対立仮説が正しいということは,帰無仮説が棄却されるということですので,正規分布に関する統計量$Z$が上側$0.01$点である$z\left(0.01\right)$を超えるか,下側$0.01$点である$-z\left(0.01\right)$を下回るかのいずれかになります。

\begin{align}
Z < -z\left(0.01\right)\; \text{または}\; z\left(0.01\right) < Z
\end{align}

もしくは,与えられた正規分布表が$P(0\leq X \leq u)$を示している場合は,以下を考えます。

\begin{align}
P(Z < |z|) &= 1 – 0.02 \\[0.7em]
&= 0.98 \\[0.7em]
\therefore\; P(0 \leq Z < z) &= 0.49
\end{align}

今回は,正規分布表が$P(0\leq X < u)$を表している場合を考えます。$P(0 \leq Z < z) = 0.49$に一番近い$z$を見つけると,$z=2.33$であることが分かります。ここで,帰無仮説の元では二項分布の平均と分散は

\begin{align}
E[X] &= 400 \cdot 1/2 = 200 \\[0.7em]
V[X] &= 400 \cdot 1/2 \cdot 1/2 = 100
\end{align}

となりますので,表の出る回数$X$は正規分布$\calN(200, 100)$に従うと仮定します。これより,検定量$Z$は以下のように計算されます。

\begin{align}
Z &= \frac{X – 200}{\sqrt{100}}
\end{align}

したがって,

\begin{align}
|Z| > 2.33 \\[0.7em]
\frac{X – 200}{\sqrt{100}} > 2.33 \\[0.7em]
X \leq 176,\; 224 \leq X
\end{align}

さて,問題の後半に移りましょう。第一種の過誤はと第二種の過誤はそれぞれ以下のようなものでした。

  • 第一種の過誤:帰無仮説が正しいのに棄却する
  • 第二種の過誤:対立仮説が正しいのに帰無仮説を棄却しない

本問題では,帰無仮説が正しいのに棄却してしまう第一種の過誤を犯す確率を求めます。これは有意水準とも呼ばれていますね。ここでも正規分布表が$P(0\leq X < u)$を表している場合を考えます。すると,第一種の過誤を犯す確率を求めるためには,帰無仮説が正しいという状況下における$\alpha$点を計算すればよいことが分かります。

\begin{align}
Z &= \frac{181 – 200}{\sqrt{100}} \\[0.7em]
&= -1.9
\end{align}

この$1.9$という値が,$\alpha$点の$\alpha$になるということです。したがって,第一種の過誤を起こす確率は以下のように計算することができます。

\begin{align}
P(|Z| > 1.9) &= P(z < -1.9) + P(1.9 < z) \\[0.7em]
&= 2 \cdot P(1.9 < z) \\[0.7em]
&= 2\cdot \left\{ 0.5 – P(0 \leq z < 1.9) \right\} \\[0.7em]
&= 2\cdot \left( 0.5 – 0.47128 \right) \\[0.7em]
&= 2\cdot \left( 0.02872 \right) \\[0.7em]
&\approx 0.058
\end{align}

シェアはこちらからお願いします!
URLをコピーする
URLをコピーしました!

コメント

コメントする