統計分析の手法まとめ

統計分析手法のまとめページです。
まず「記述統計」「推計統計」の2つに大別し、それぞれについて手法を整理しました。

「回帰分析」「決定木分析」などの分析手法については「機械学習」のページに整理しています。
全ては網羅できていない上、統計解析と機械学習の分類については一概に正解が言えず、多少の主観が混ざっておりますことをご了承下さい。

記述統計

記述統計とは、データの代表値を調べたり、データの全体像を知るための手法です。
2変数の関係性を調べる相関分析などもここに含めます。

データの代表値

データの全体傾向を1つの数値で端的に言い表すための手法です。

  • 平均値
  • 順序統計量(最大値・中央値・最小値・四分位点)
  • 最頻値
  • 分散・標準偏差
  • 歪度・尖度

Pythonによるデータの代表値(平均値、中央値など)の計算

データの全体像

データの全体像を把握しやすくする、「集計」の手法です。

  • ヒストグラム
  • クロス集計
  • 散布図

相関分析

2つのデータの関連性の大きさを測る尺度です。

推計統計

推計統計とは、「手元にある一部分のデータ」から、「データの全体像」を把握するための手法です。

区間推定

手元にある一部分のデータから、データ全体像の傾向を「およそこのくらい」と範囲推測するための手法です。

仮説検定

手元にある一部分のデータから、データの全体像についての仮説を立て、その仮説の確からしさを統計学的に調べる手法です。

  • t検定
  • ウィルコクソンの符号順位検定
  • ウィルコクソンの順位和検定(マン・ホイットニーのU検定)
  • カイ二乗検定
  • フィッシャーの正確確率検定
  • マクネマー検定
  • 分散分析
  • フリードマン検定
  • クラスカル・ウォリス検定
  • F検定

それぞれの使い分けについては下記ページに整理しています。

仮説検定の手法一覧と、それらの使い分け方

以上、統計分析手法についてのまとめでした。