本記事は「これなら分かる!はじめての数理統計学」シリーズに含まれます。
不適切な内容があれば,記事下のコメント欄またはお問い合わせフォームよりご連絡下さい。
チェビシェフの不等式
任意の確率変数$Z$と正の実数$\varepsilon$に対して
P\left( \left| Z - E[Z] \right| \geq \varepsilon \right) \leq \frac{V[Z]}{\varepsilon^2}
\end{align}
たまーに高校数学の証明問題でも出てくるチェビシェフの不等式ですが,統計学では大活躍をします。チェビシェフの不等式は「平均からある値以上離れた値をとる確率には上限がある」ということを意味します。例えば,$\varepsilon=2\sigma$を代入すると,チェビシェフの不等式は「平均から標準偏差の$2$倍離れた値をとる確率は$1/4$以下である」ということを主張しています。これが後の大数の弱法則に繋がっていくのです。
証明
証明は腰を抜かしてしまうほど簡単です。以下の方法を一度試してしまえば,チェビシェフの不等式は「なんだ。ほとんど自明やんけ!」となるはずです。
さて,証明に移ります。$Z$を連続型確率変数とします。離散型の場合も証明は同様にして行えます。$|Z - E[Z]| \geq \varepsilon$が成立していれば$1$,成立していなければ$0$を与える関数を$G(Z, \varepsilon)$と書きます。このとき
\varepsilon^2 G(Z, \varepsilon) \leq \left| Z - E[Z] \right|^2 G(Z, \varepsilon)
\end{align}
が成り立ちます。これは,$\varepsilon$が$\varepsilon \leq |Z - E[Z]|$のときには$G(Z, \varepsilon)=1$となることと,$\varepsilon > |Z - E[Z]|$のときには$G(Z, \varepsilon)=0$になることから導かれます。さらに,$G(Z, \varepsilon)\geq 1$であることから,
\left| Z - E[Z] \right|^2 G(Z, \varepsilon) \leq \left| Z - E[Z] \right|^2
\end{align}
が成り立ちます。ゆえに,
\varepsilon^2 G(Z, \varepsilon) \leq \left| Z - E[Z] \right|^2
\end{align}
が成り立ちます。$\varepsilon \leq |Z - E[Z]|$を満たす$Z$の領域を$A$,$\varepsilon > |Z - E[Z]|$を満たす$Z$の領域を$B$とおくと,両辺の期待をとることで,
&\quad E \left[ \varepsilon^2 G(Z, \varepsilon) \right] \leq E \left[ |Z - E[Z]|^2 \right] \\[0.7em]
&\Longleftrightarrow \int_{A} \varepsilon^2 G(Z, \varepsilon) P(A)dZ +
\int_{B} \varepsilon^2 G(Z, \varepsilon) P(B)dZ \leq V[Z]\\[0.7em]
&\Longleftrightarrow \int_{A} \varepsilon^2 G(Z, \varepsilon) P(A)dZ \leq V[Z]~ (\because Z \in B \Rightarrow G(Z, \varepsilon)=0)\\[0.7em]
&\Longleftrightarrow \varepsilon^2 P(A) \leq V[Z]\\[0.7em]
&\Longleftrightarrow P\left( \varepsilon \leq |Z - E[Z]| \right) \leq \frac{V[Z]}{\varepsilon^2 }
\end{align}
となり,チェビシェフの不等式が示されました。
参考文献
本稿の執筆にあたり参考にした文献は,以下でリストアップしております。
コメント