本記事は「これなら分かる!はじめての数理統計学」シリーズに含まれます。
不適切な内容があれば,記事下のコメント欄またはお問い合わせフォームよりご連絡下さい。
分位点関数とパーセント点
確率変数$X$の分布関数$F$が連続かつ狭義単調増加のとき,$0<u<1$に対して$F^{-1}(u)$は一位に定まる。この$F^{-1}$を$X$の分位点関数と呼び,
x_{u} &= F^{-1}(u)
\end{align}
で定義される$x_{u}$を下側$u$点,または下側$100u$パーセント点という。上の定義および分布関数の定義から明らかなように,$x_{u}$は
P(X\leq x_{u})=u,\quad P(X\geq x_{u})=1-u
\end{align}
を満たす。次に,分布関数$F$が連続かつ狭義単調増加でないとき,$F^{-1}$は自明に定義されないため,下側確率に対する分位点関数$F_{L}^{-1}(u)$と上側確率に対する分位点関数$F_{R}^{-1}(u)$を以下のように定義する。
F_{L}^{-1}(u) = \inf \left\{ x\mid F(x)\geq u \right\},\quad
F_{R}^{-1}(u) = \sup\left\{ x\mid P(X\geq x)\geq 1-u \right\}
\end{align}
このとき,
x_{u} &= \frac{F_{L}^{-1}(u) + F_{R}^{-1}(u) }{2}\label{厳密な定義}
\end{align}
で定義される$x_{u}$を下側$u$点,または下側$100u$パーセント点という。
区間推定や検定で利用される概念です。$u$を$\alpha$として「上側$100\alpha$パーセント点」や「下側$100\alpha$パーセント点」と呼ばれることも多いです。また,確率関数が偶関数であれば上側$\alpha$点と下側$\alpha$点の絶対値は等しくなりますので,上側$\alpha$点を両側$2\alpha$点と呼ぶことも多いです。
補足1
式($\ref{厳密な定義}$)は離散変数に対する整合性も担保しています。例えば,$100$個の離散変数に対しては,下側$25$パーセント点は上側$76$パーセント点と一致します。そのため,下側$25$パーセント点としては$25$番目の値と$26$番目の値の算術平均として定義されると整合性が担保されます。
補足2
分位点関数が一意に定められない場合,下側確率と上側確率に着目するだけでよいのか,という疑問が浮かんでくるかもしれません。現時点での筆者の考えは,上側確率と下側確率を考えているのは「$F^{-1}(u)$が定められない$u$」に対するものであり,全ての定義域にを議論の対象にしている訳ではないからだと理解しています。したがって,$F^{-1}$に不連続な箇所や平坦な箇所があったとしても,上と同様の議論をその点ごとに適用すればよいと考えています。具体的には,不連続な点に関しては連続性が途切れる直前と直後の値の算術平均,平坦な箇所に関してはその値自体がパーセント値として採用されるような定義になっているはずです。
参考文献
本稿の執筆にあたり参考にした文献は,以下でリストアップしております。
コメント