本記事は「これなら分かる!はじめての数理統計学」シリーズに含まれます。
不適切な内容があれば,記事下のコメント欄またはお問い合わせフォームよりご連絡下さい。
順序統計量の分布
$X_1,\ldots,X_n$が独立に累積分布関数$F$,密度関数$f$を持つ連続分布に従うとする。このとき,第$i$順序統計量$X_{(i)}$の累積分布関数と確率密度関数は,$F$と$f$を用いて以下のように表される。
F_{X_{(i)}}(x) &= \sum_{k=i}^{n} {}_{n} C_{k}~F(x)^{k}\left\{1-F(x)\right\}^{n-k} \label{F_i} \\[0.7em]
f_{X_{(i)}}(x) &= {}_{n-1} C_{i-1}~ nf(x)F(x)^{i-1}\left\{1-F(x)\right\}^{n-i}\label{f_i}
\end{align}
特に,最大値$X_{(n)}$の累積分布関数と確率密度関数は以下のように表される。
F_{X_{(n)}}(x) &= F(x)^{n} \label{F_n}\\[0.7em]
f_{X_{(n)}}(x) &= nf(x)F(x)^{n-1} \label{f_n}
\end{align}
同様に,最小値$X_{(1)}$の累積分布関数と確率密度関数は以下のように表される。
F_{X_{(1)}}(x) &= 1-\left\{1-F(x)\right\}^{n} \label{F_1}\\[0.7em]
f_{X_{(1)}}(x) &= nf(x)\left\{1-F(x)\right\}^{n-1}\label{f_1}
\end{align}
累積分布関数の結果を見ても分かる通り,順序統計量はベルヌーイ分布の考え方を利用します。最大値と最小値に関する結果は直感的にも立式できますので,$i=1$と$i=n$の結果もおさえておきましょう。
証明
確率密度関数は累積分布関数の微分として求められますので,まずは$X_{(i)}$の累積分布関数から求めていきましょう。累積分布関数の定義より,$X_{(i)}\leq x$となる事象を考えます。この事象を言い換えると,$X_1,\ldots,X_n$の中で$x$以下となる確率変数の数が$i$個以上になる事象となります。そこで,事象$A_i$を以下のように設定します。
A_i &= \{X_1,\ldots,X_n~\text{のうち}i\text{個が}x\text{以下} \}
\end{align}
すると,累積分布関数は以下のように変形できます。
F_{X_{(i)}}(x) &= P(X_{(i)}\leq x) \\[0.7em]
&= \sum_{k=i}^{n} P(A_k)
\end{align}
ここで,各$X_k$は確率$F(x)$で$X_k \leq x$となることから,$P(A_k)$はパラメータ$p=F(x)$のベルヌーイ分布に従うと考えられます。したがって,
F_{X_{(i)}}(x) &= \sum_{k=i}^{n} {}_{n} C_{k}~F(x)^{k}\left\{1-F(x)\right\}^{n-k}
\end{align}
となります。すなわち,式($\ref{F_i}$)が示されました。続いて,$X_{(i)}$の確率密度関数を導出します。簡単のため,
g(n, k) &=
\begin{cases}
{}_{n} C_{k}~F(x)^{k}\left\{1-F(x)\right\}^{n-k} & (0 \leq k \leq n)\\[0.7em]
0 & (n < k)
\end{cases}\label{g}
\end{align}
と置きます。ただし,$n<k$となる二項分布は定義されないため$0$と定義している点に注意して下さい。式($\ref{F_i}$)を$x$で微分しましょう。
\frac{d}{dx}F_{X_{(i)}}(x) &= \frac{dF(x)}{dx}\cdot \frac{dF_{X_{(i)}}(x)}{dF(x)} \\[0.7em]
&= f(x)\cdot \sum_{k=i}^{n} \left\{ \frac{n!}{(k-1)!(n-k)!}F(x)^{k-1}\left\{1-F(x)\right\}^{n-k}\right.\notag\\[0.7em]
&\quad\quad\quad\quad\left.-\frac{n!}{k!(n-k-1)!}F(x)^{k}\left\{1-F(x)\right\}^{n-k-1} \right\} \\[0.7em]
&= f(x)\cdot n\sum_{k=i}^{n} \left\{ g(n-1, k-1)-g(n-1,k) \right\} \\[0.7em]
&= f(x)\cdot n\left\{ g(n-1, i-1)-g(n-1,n) \right\} \\[0.7em]
&= nf(x)g(n-1, i-1) \\[0.7em]
&= {}_{n-1} C_{i-1}~ nf(x)F(x)^{i-1}\left\{1-F(x)\right\}^{n-i}
\end{align}
ただし,$g(n-1,n)=0$を利用しました。以上より,式($\ref{f_i}$)が示されました。式($\ref{F_n}$)と式($\ref{f_n}$)は,式($\ref{F_i}$)と式($\ref{f_i}$)で$i=n$とおくと導出できます。同様に,式($\ref{F_1}$)と式($\ref{f_1}$)は,式($\ref{F_i}$)と式($\ref{f_i}$)で$i=1$とおくと導出できます。
式($\ref{F_n}$)は$X_1,\ldots,X_n$の全てが$x$以下である確率$P(X_{(n)}\leq x)$そのものを表しています。同様に,式($\ref{F_1}$)は$X_1,\ldots,X_n$の全てが$x$より大きい確率$P(X_{(1)} > x)$そのものを表しています。すなわち,式($\ref{F_n}$)と式($\ref{F_1}$)は直感的な立式とも整合性が取れていることが分かります。
参考文献
本稿の執筆にあたり参考にした文献は,以下でリストアップしております。
コメント