【これなら分かる!】標準コーシー分布とは

zuka

こんにちは。
zuka(@beginaid)です。

本記事は「これなら分かる!はじめての数理統計学」シリーズに含まれます。

もし不適切な内容があれば,記事下のコメント欄又はお問い合わせフォームよりご連絡下さい。

標準コーシー分布

連続一様分布$U(-\pi/2, \pi/2)$に従う確率変数$Y$に対して,以下の変数変換

\begin{align}
X &= \tan Y
\end{align}

を考えたときに,$X$が従う分布が標準コーシー分布です。標準正規分布よりも裾が重い分布として有名です。導入方法からも分かる通り,$X \in \bbR$です。標準コーシー分布では,期待値や分散,モーメント母関数が定義されません。コーシー分布には再生性はありません。ただし, 独立にコーシー分布に従う確率変数の算術平均に関しては再生性を持ちます。ロードマップ中では,コーシー分布は$T$分布の特殊な場合(自由度$1$)に相当しています。

\begin{align}
f_{X}(x) &= \frac{1}{\pi}\frac{1}{x^2 + 1}
\end{align}

確率密度関数

コーシー分布は$T$分布の特殊な場合ではありますが,確率密度関数を導出する際は異なるアプローチをとります。実は,連続一様分布$U(-\pi/2, \pi/2)$に従う確率変数$X$に対して,以下の変数変換

\begin{align}
X &= \tan Y
\end{align}

を考えたとき,$X$が従う分布がコーシー分布になります。実際に確率密度変数を導出しましょう。逆変換$y=\arctan x$のヤコビアンは

\begin{align}
\frac{dy}{dx} &= \frac{1}{x^2+1}
\end{align}

になるので,$x\in \mathbb{R}$において,コーシー分布の確率密度関数$f(x)$は以下のようになります。

\begin{align}
f(x) &= \frac{1}{\pi}\frac{1}{x^2+1}
\end{align}

モーメント母関数・平均・分散

通常,モーメント母関数を求めるときはモーメント母関数の定義に従って計算していきます。しかし,実数領域についてコーシー分布では期待値が定義されないため,期待値を利用して定義されるモーメント母関数もまた定義することはできません。そこで,ここではコーシー分布の期待値が存在しないことを示してみましょう。

\begin{align}
E[X] &= \int_{-\infty}^{\infty} \frac{1}{\pi}\frac{x}{x^2+1} dx \\[0.7em]
&= \frac{1}{\pi}\left\{ \lim_{b\rightarrow\infty}\frac{1}{2}\log(1+b^2) – \lim_{a\rightarrow-\infty}\frac{1}{2}\log(1+a^2) \right\}
\end{align}

このように,期待値を計算すると広義積分が登場するため,期待値は定義されないのです。それゆえ,分散も存在しません。

ちなみに,大数の法則は期待値の存在を仮定しているために,コーシー分布では大数の法則が成り立ちません。このことから,コーシー分布では中心極限定理も成り立たないことが分かります。実際,コーシー分布は外れ値をとる確率が高い分布として知られていて,この性質を「裾が重い」と呼びます。そのため,いくらサンプル数を増やしたからといって,期待値は特定の値に収束することはないのです。

再生性

再生性を示すためには,再生性を示したい分布に従う独立な二つの確率変数を考え,その和のモーメント母関数(離散分布の場合はモーメント母関数)を計算したときに,パラメータが和の形になっていることを示します。

実数領域においては,コーシー分布には再生性はありません。しかし,算術平均に関しては再生性があります。このことを以下で示していきたいと思います。ここでは,モーメント母関数の複素拡張バージョンである特性関数を使ってコーシー分布の算術平均に関する再生性を証明していこうと思います。まず,特性関数の定義は以下の通りです。

特性関数

特性関数$\phi_X(t)$は以下のように定義される。

\begin{align}
\phi_X(t) &= E\left[e^{itX}\right]
\end{align}

なお,特性関数の複素共役を利用すると,以下が成り立つ。

\begin{align}
\overline{\phi_X(-t)}
&= \overline{E[e^{-itX}]} = E\overline{[e^{-itX}]} \notag \\[0.7em]
&= E[e^{itX}] = \phi_X(t) \label{特性関数の複素共役}
\end{align}

定義に従うと,コーシー分布の特性関数は以下のように計算されます。

\begin{align}
\phi_X(t) &= \int_{-\infty}^{\infty}e^{itx}\frac{1}{\pi}\frac{1}{x^2+1} dx
\end{align}

これは複素平面上の積分です。複素関数論の世界では,複素平面上の積分を周回積分を通して計算するという操作を行います。周回積分というのは,語弊に恐れずに言えば,積分領域が複素平面上において一周するような積分のことを指します。なぜ周回積分を利用するのかというと,孤立特異点(後述します)を含む周回積分自体は以下の留数定理という非常に便利な定理を利用して簡単に求めることができるからです。

留数定理

閉曲線$C$と,$C$が囲む領域$D$を考える。$D$上で定義される関数$f(z)$が$D$内に孤立特異点$a_1, \ldots, a_n$をもち,それ以外で正則であるなら,

\begin{align}
\oint_{C} f(z) d z=2 \pi i \sum_{i=1}^{n} \mathrm{Res}_{z=a{i}} f(z)
\end{align}

が成り立つ。ただし,積分は$C$を反時計回りに進む方向に計算する。

さて,いくつか未知語が出てきましたね。孤立特異点というのは,$f(z)$が正則でない点,つまり例えば$f(z)$が分数の場合分母が$0$になるような$z$の値のことを指します。Resというのは留数を表します。留数の定義は以下の通りです。

留数

$f(z)$を孤立点$z=a$のまわりにローラン展開(テーラー展開の一般形)したときの$1/(z-a)$の係数を留数と呼び,$\mathrm{Res}_{z=a}f(z)$と書く。孤立点が1位の極のときは以下のように求められる。

\begin{align}
\mathrm{Res}_{z=a} f(z) &= \lim_{z\rightarrow a}(z-a)f(z)
\end{align}

ただし,1位の極というのは,$f(z)=g(z)/(z-a)^n$における$n$のことを指す。

今回は孤立点が1位の極の場合のみを扱うため,2位以上の極の場合の求め方は割愛します。さて,準備は整いました。特性関数の積分の中身の関数を改めて$g(z)$とおきます。

\begin{align}
\phi_X(t) &= \int_{-\infty}^{\infty}e^{itx}\frac{1}{\pi}\frac{1}{x^2+1} dx\\[0.7em]
&= \int_{-\infty}^{\infty}e^{itx}\frac{1}{\pi}\frac{1}{(x+i)(x-i)} dx\\[0.7em]
&= \int_{-\infty}^{\infty} g(z) dz
\end{align}

$g(z)$の形から,$g(z)$は孤立点$z=i$をもち,$1$位の極であることが分かります。特性関数の計算を以下の直線$C_1$と曲線$C_2$で構成される閉曲線$C$に沿って行います。閉曲線の選び方はどのように選んでもよいのですが,$g(z)$の孤立点を含めなくては留数定理の旨味を利用することができない点に注意してください。$g(z)$の孤立点を含め,コーシー分布の特性関数の形が得られる閉曲線の中で,一番シンプルなものは以下の閉曲線でしょう。

最もシンプルな閉曲線

$R\rightarrow \infty$のとき,直線$C_1$に沿った積分が所望の特性関数になっています。ですので,$C_2$に沿った積分が0に収束することを示すことが目標です。まずは,留数定理より,一周積分の値を求めておきます。

\begin{align}
\oint_{C} f(z)dz &= 2\pi i \mathrm{Res}_{z=i}f(z)
\end{align}

ここで,$f(z)$は1位の極でしたから,留数は以下のように求められます。

\begin{align}
\mathrm{Res}_{z=i}f(z) &= \lim_{z\rightarrow i}(z-i)f(z) \\[0.7em]
&= \frac{e^{-t}}{2\pi i}
\end{align}

したがって,一周積分は以下の値になります。

\begin{align}
\oint_{C} f(z)dz &= e^{-t}
\end{align}

さて,一周積分を2つの積分に分解した後に,$R\rightarrow \infty$の極限をとりましょう。

\begin{align}
\lim_{R\rightarrow \infty}\oint_{C} f(z)dz
&= \lim_{R\rightarrow \infty} \left(\int_{C_1} f(z)dz + \int_{C_2} f(z)dz \right)\\[0.7em]
&=\lim_{R\rightarrow \infty} \int_{-R}^{R} f(z)dz + \lim_{R\rightarrow \infty}\int_{C_2} f(z)dz
\end{align}

先ほどもお伝えした通り,第一項目は特性関数そのものです。第二項目の絶対値に関して不等式を用いて評価して収束性を示したいと思います。曲線$C_2$は極座標表示で$z=Re^{i\theta}$かつ$0\leq\theta\leq\pi$と表せます。すると,第二項目の極限の中身は以下のように表されます。

\begin{align}
\int_{C_2} f(z)dz
&= \int_0^{\pi}\frac{e^{itRe^{i\theta}}}{\pi (R^2e^{2i\theta}+1)} iRe^{i\theta}d\theta
\end{align}

ここで,$e^{itRe^{i\theta}}$に関する評価を行います。オイラーの公式$e^{i\theta}=\cos\theta + i\sin\theta$を用います。

\begin{align}
e^{itRe^{i\theta}}
&= e^{itR(\cos\theta + i\sin\theta)}\\[0.7em]
&= e^{itR\cos\theta} + e^{-tR\sin\theta}\\[0.7em]
&\leq e^{-tR\sin\theta}\quad (\because e^{itR\cos\theta} \geq 0)
\end{align}

したがって,十分大きい$R$に対して$|R^2e^{2i\theta}+1|>R^2+1$となることに注意すれば,第二項目の絶対値は以下のように評価されます。

\begin{align}
\left|\int_{C_2} g(z) d z\right| &=\left|\int_{0}^{\pi} \frac{e^{i t R e^{i \theta}}}{\pi\left(R^{2} e^{2 i \theta}+1\right)} i R e^{i \theta} d \theta\right| \\[0.7em]
& \leq \int_{0}^{\pi}\left|\frac{e^{i t R e^{i \theta}}}{\pi\left(R^{2} e^{2 i \theta}+1\right)} i R e^{i \theta}\right| d \theta \\[0.7em]
& \leq \int_{0}^{\pi} \frac{e^{-R t \sin \theta}}{\pi(R^{2}+1)} R d \theta \\[0.7em]
& \leq \frac{R}{\pi\left(R^{2}+1\right)} \int_{0}^{\pi} e^{-R t \sin \theta} d \theta
\end{align}

ここで,$t>0$のときを先に考えます。$R>0$に注意すれば,$e^{-R t \sin \theta}\leq 1$より,

\begin{align}
\lim_{R\rightarrow \infty}\left|\int_{C_2} g(z) d z\right|
&\leq \lim_{R\rightarrow \infty} \frac{R}{R^2-1}
\rightarrow 0
\end{align}

したがって,$t>0$のときは$\phi_X(t)=e^{-t}$となります。$t\leq0$のときは,式(\ref{特性関数の複素共役})を利用して,$\phi_X(t)=\overline{e^{-(-t)}}=e^t$となります。以上をまとめると,コーシー分布の特性関数は以下のようになります。

\begin{align}
\phi_X(t) &= e^{-|t|}
\end{align}

さて,本題に戻ります。コーシー分布の算術平均に関する再生性を証明していきましょう。$X_i\;(i=1,\ldots,n)$をそれぞれ独立にコーシー分布に従う確率変数とします。以下の算術平均

\begin{align}
\overline{X} &= \frac{\sum_i X_i}{n}
\end{align}

に関する特性関数を考えると,以下のようになります。

\begin{align}
\phi_{\overline{X}}(t)
&= E[e^{i\overline{X}t}]\\[0.7em]
&= E[e^{iX_1t/n}\ldots e^{iX_nt/n}]\\[0.7em]
&= E[e^{iX_1t/n}]\ldots E[e^{iX_nt/n}]\\[0.7em]
&= \left(e^{-|t/n|}\right)^n\\[0.7em]
&= e^{-|t|}
\end{align}

これは,コーシー分布の特性関数と一致します。したがって,コーシー分布に独立に従う確率変数の算術平均はコーシー分布に従うことが示されました。

ロードマップ

確率分布のロードマップ

さて,ロードマップに戻りましょう。 本記事ではコーシー分布は一様分布に従う確率変数に対して変数変換を施すことで導出しました。再生性に関しては,独立にコーシー分布に従う確率変数の算術平均に関してのみ有することも確認しました。ロードマップ中ではコーシー分布は$T$分布の特殊な場合に相当していますが,これは$T$分布のページで詳しく解説することにします。

シェアはこちらからお願いします!
URLをコピーする
URLをコピーしました!

コメント

コメントする