統計学

Statistics

このシリーズについて

統計学はデータから情報を抽出し、不確実性のもとで意思決定を行うための学問である。本シリーズでは、記述統計の基礎から始めて、推測統計、最尤推定、ベイズ統計まで段階的に学習する。

統計学は科学研究、ビジネス分析、機械学習など、データを扱うあらゆる分野で必須の知識となっている。

レベル別学習

学習の流れ

入門 高校数学 初級 大学1-2年 中級 大学3-4年 上級 大学院 入門:データ整理、代表値、分散、相関 初級:確率分布、中心極限定理、推定、検定 中級:最尤推定、回帰、分散分析、多変量 上級:ベイズ統計、EMアルゴリズム、モデル選択 統計学の2つのアプローチ 頻度論的統計 パラメータは固定値 繰り返しサンプリング 信頼区間、$p$値 ベイズ統計 パラメータも確率変数 事前分布→事後分布 信用区間、事後確率

主な学習内容

記述統計

データの整理、代表値、散布度、相関など、データを要約する技法。

推測統計

標本から母集団の特性を推測する、区間推定と仮説検定。

回帰分析

変数間の関係をモデル化し、予測に活用する手法。

ベイズ統計

事前知識とデータを組み合わせて推論を行うベイズ的アプローチ。

個別トピック

混合正規分布モデル(GMM)とEMアルゴリズム

複数の正規分布の混合モデルと、EMアルゴリズムによるパラメータ推定を詳しく解説する。