本記事は「これなら分かる!はじめての数理統計学」シリーズに含まれます。
不適切な内容があれば,記事下のコメント欄またはお問い合わせフォームよりご連絡下さい。
はじめに
インターネットの発達は,誰もが気軽に情報を発信できるプラットフォームを醸成しました。ツイッターやインスタグラムなどのSNSはもちろんのこと,Youtubeやブログを始める敷居は一昔前と比べて格段に低くなっています。このような状況では,良質なコンテンツと共に,ニセモノの情報も玉石混交に飛び交います。多くの国では言論の自由が保障されていますので,プラットフォーマーはむやみに情報を規制することができないのです。
デジタル化の流れは日本も例外ではありません。2021年9月にはデジタル庁が発足され,2022年度からは高等学校学習指導要領で情報が必須科目として組み込まれました。2025年度からは大学入学共通テストに情報が導入されようとしています。このように,データを数理的に扱う能力がますます問われる時代になっています。
適切な情報を正確にキャッチアップするためには,統計学の力が必要になります。データを平均値で語ってしまうことの危うさ,各種検定法の濫用,相関と因果の関係性などなど。統計学を身に付けなければ大きな過ちを犯してしまう危険性があります。他者と建設的な議論を行うためにはデータに基づくことが必要とされますが,それは決して,データを持ち出すことが目的なのではありません。データを利用することはあくまでも手段です。データを平均値で語ることで,データに基づいた議論を行っている気になってはいけません。
情報化社会においては,大量のデータを意思決定に活用する「攻めの統計学」と,ニセモノの情報に騙されない「守りの統計学」があると著者は考えています。たとえ,仕事で攻めの統計学を利用する場面がなくとも,守りの統計学としての側面を学ぶことで,大きな誤解や勘違いを防ぐことができます。無機質な数字をひたすらExcelに打ち込み,よく理解も出来ていない謎の関数を呼び出して描画されるグラフを読み取って,よく分からない結論を導き出す世界からは一刻も早く脱出しましょう。
そして何より,統計学を学ぶことは愉しいです。データの裏側に隠れている理論を知ることは,世界の解像度が上がることに繋がります。なぜ誤差の分布が正規分布になるのか。なぜ$t$検定では$t$分布が利用されるのか。独立と無相関にはどのような違いがあるのか。それらを知ることは,攻め・守りという側面を越えて学ぶことの愉しみという領域にまで染み出していきます。
巷には統計学に関する資料や書籍が数多く存在します。そのような資料の多くは,定理を証明なしで提示したり,多種多様な確率分布を体系付けずに乱立させたりしています。筆者自身がこのような資料に課題を感じたことが,当サイトで「これなら分かる!はじめての数理統計学」を執筆するに至った直接的なキッカケです。大学院相当の厳密な数理統計学を学ぼうとすると測度論が必要とされますが,情報化社会において攻め・守りの統計学を身に付けるという文脈では,学部相当の数学を前提とした数理統計学で十分だと著者は考えています。当サイトでは学部レベルの数学的な厳密さは最低限担保するように心掛けますが,測度論には踏み込まないことに注意してください。
当サイトが,皆さんが統計学を身に付けるための一助となれることを祈っております。
参考文献
本稿の執筆にあたり参考にした文献は,以下でリストアップしております。
コメント