統計分析の手法まとめ
統計分析手法のまとめページです。
まず「記述統計」「推計統計」の2つに大別し、それぞれについて手法を整理しました。
「回帰分析」「決定木分析」などの分析手法については「機械学習」のページに整理しています。
全ては網羅できていない上、統計解析と機械学習の分類については一概に正解が言えず、多少の主観が混ざっておりますことをご了承下さい。
記述統計
記述統計とは、データの代表値を調べたり、データの全体像を知るための手法です。
2変数の関係性を調べる相関分析などもここに含めます。
データの代表値
データの全体傾向を1つの数値で端的に言い表すための手法です。
- 平均値
- 順序統計量(最大値・中央値・最小値・四分位点)
- 最頻値
- 分散・標準偏差
- 歪度・尖度
データの全体像
データの全体像を把握しやすくする、「集計」の手法です。
- ヒストグラム
- クロス集計
- 散布図
相関分析
2つのデータの関連性の大きさを測る尺度です。
- ピアソンの相関分析
- スピアマンの相関分析
- ケンドールの相関分析
推計統計
推計統計とは、「手元にある一部分のデータ」から、「データの全体像」を把握するための手法です。
区間推定
手元にある一部分のデータから、データ全体像の傾向を「およそこのくらい」と範囲推測するための手法です。
仮説検定
手元にある一部分のデータから、データの全体像についての仮説を立て、その仮説の確からしさを統計学的に調べる手法です。
- t検定
- ウィルコクソンの符号順位検定
- ウィルコクソンの順位和検定(マン・ホイットニーのU検定)
- カイ二乗検定
- フィッシャーの正確確率検定
- マクネマー検定
- 分散分析
- フリードマン検定
- クラスカル・ウォリス検定
- F検定
それぞれの使い分けについては下記ページに整理しています。
以上、統計分析手法についてのまとめでした。