本記事は「これなら分かる!はじめての数理統計学」シリーズに含まれます。
不適切な内容があれば,記事下のコメント欄またはお問い合わせフォームよりご連絡下さい。
有限母集団の母平均と母分散
大きさ$N$の有限母集団を考え,各個体の特性値を$a_1, \ldots, a_N$とする。この有限母集団の母平均$\mu$と母分散$\sigma^2$は以下のように定義される。
\mu &= \frac{1}{N} \sum_{i=1}^N a_i \\[0.7em]
\sigma^2 &= \frac{1}{N} \sum_{i=1}^N (a_i-\mu )^2
\end{align}
なお,有限母集団から$1$個の観測値$X_1$を無作為抽出すると,無限母集団のときと同様に母平均$\mu$と母分散$\sigma^2$は以下のように定義される。
\mu &= E[X_1] \\[0.7em]
\sigma^2 &= V[X_1]
\end{align}
復元抽出の場合には,独立かつ同一の分布から抽出された確率変数が観測されるとみなすことができるため,有限母集団と無限母集団の区別をする必要はありませんでした。一方で,非復元抽出の場合には,有限母集団と無限母集団の区別をする必要があるため,上記定義が持ち込まれるという訳です。ただし,結局のところ,非復元抽出でも母平均・母分散の定義に関しては有限母集団と無限母集団の整合性は取れています。
無限母集団の定義との整合性
有限母集団の母平均と母分散は,無限母集団における定義と整合性がとれています。その理由をお伝えしていきます。無限母集団から$1$個の観測値を無作為抽出する場合,平均と分散は以下で表されます。
\mu &= \sum_{i=1}^{\infty} a_i \cdot P(X_1=a_i) \\[0.7em]
\sigma^2 &= \sum_{i=1}^{\infty} (a_i-\mu)^2 \cdot P(X_1=a_i)
\end{align}
ただし,母集団から抽出された観測値を$X_1$とおきました。
観測値が大文字の$X_1$を使って表されていることからも分かる通り,観測値$X_1$は確率変数であることに注意してください。無限母集団の場合は観測値を$x$のように小文字を用いて表していましたが,有限母集団の場合は抽出操作自体が確率的な操作とみなされますので,観測値が確率変数とみなされます。
無限母集団の母平均と母分散を有限母集団の場合に置き換えると,総和の範囲を変えることにより
\mu &= \sum_{i=1}^{N} a_i \cdot P(X_1=a_i) \label{def_mu}\\[0.7em]
\sigma^2 &= \sum_{i=1}^{N} (a_i-\mu)^2 \cdot P(X_1=a_i) \label{def_variance}
\end{align}
となります。さて,$P(X_1=a_i)$にはどのような値が入るのでしょうか。各個体の特性値$a_1, \ldots, a_N$の選び方は$N$通りありますので,
P(X_1=a_i) &= \frac{1}{N} \label{eq_p_x_a}
\end{align}
となります。式($\ref{eq_p_x_a}$)を式($\ref{def_mu}$)と式($\ref{def_variance}$)に代入します。
\mu &= \sum_{i=1}^{N} a_i \cdot \frac{1}{N} \\[0.7em]
&= \frac{1}{N} \sum_{i=1}^{N} a_i \\[0.7em]
\sigma^2 &= \sum_{i=1}^{N} (a_i-\mu)^2 \cdot \frac{1}{N} \\[0.7em]
&= \frac{1}{N} \sum_{i=1}^{N} (a_i-\mu)^2
\end{align}
以上より,有限母集団における母平均と母分散の定義が,無限母集団において$1$個の観測値を無作為抽出する場合の定義と整合性がとれていることが確認できました。
参考文献
本稿の執筆にあたり参考にした文献は,以下でリストアップしております。
コメント