【これなら分かる!】確率分布ロードマップ

zuka

こんにちは。
zuka(@beginaid)です。

本記事は「これなら分かる!はじめての数理統計学」シリーズに含まれます。

内容は統計検定1級に準拠しています。もし不適切な内容や誤植があれば,記事下のコメント欄もしくはお問い合わせフォームよりご連絡いただけますと幸いです。

目次

マクロな視点

確率分布をマクロな視点で眺める

統計学の勉強をしていると,たいていの人は出てくる確率分布の多さに嫌気がさしてしまうと思います。挙げ句の果てには$F$分布の定義などを覚えさせられて,確率分布などよく理解しないままに検定パートに突入です。本資料では,そのような事態を避けるべく,まずはマクロな視点で種々の確率分布を眺めてみたいと思います。

まず,大事な観点として「二項分布から出発させる」というものがあります。種々の確率分布を統一的にまとめる方法は流派がありますが,筆者は二項分布を源流としてそこから流れる川を考えていく方法が最も理解しやすいと感じています。具体的には,上図のようなマクロな視点で二項分布からの流れを捉えてください。

真ん中に位置する「二項系」には,コイントスやなどの試行を表すような確率分布が含まれます。そこから,サイコロ投げなどに「拡張」する流れ,「ベイズ共役」の確率分布定義する流れ,極限を考えることで「ポアソン分布」や自然界によく起こるような「正規分布」を持ち出す流れ,そしてある「イベント」の発生に関する分布を考える流れがあります。「拡張系」と「共役系」の共通領域に相当する確率分布もあります。「ベイズ共役」というのは,事前分布として設定すると事後分布もそのもの自身になるという性質をもつ確率分布になります。詳細は後述します。

ミクロな視点

確率分布のロードマップ

さて,もう少し具体的に中身をみていきましょう。上図はマクロな視点で見たときの箱に,それぞれどのような確率分布が格納されているのかを表しています。角が尖っている四角は離散型確率変数をとる分布,角が丸い四角は連続型確率変数をとる分布です。一様分布は離散型確率変数も連続型確率変数もとるため,少しいびつな四角になっています。矢印の添字は,どのようにして矢印の先の分布が導かれるのかに関するキーワードです。「非復元」は,抽出するという試行を続けて行う(非復元)のか,毎回リセットして行う(復元)のか,という違いです。

「極限」は何らかの条件下である変数に対して極限を取るような操作,「多変量」は変数を拡張する操作,「ベイズ共役」は共役事前分布,「特殊」は矢印の先が矢印の元の分布の特殊な場合であること,「一般」は逆に矢印の先が矢印の元の分布の一般形であること,「混合」は複数の分布に従う確率変数を混合する操作,「変数変換」や「標準化」は変数を定義し直す操作,「連続」は変数を連続型確率変数とみなす操作,「自由度」はある特定のパラメータの対応を表しています。なお,上図は必ずしも全ての確率分布同士の関係性を網羅できているわけではないため,注意してください。

シェアはこちらからお願いします!
URLをコピーする
URLをコピーしました!

コメント

コメントする

目次
閉じる