統計学– tag –
-
「t検定」の意味とExcelでの実行方法
ある会社の社員に「あなたにとってこの会社は100点中何点ですか?」というアンケートを取ったとします。その結果、全社員の平均値が昨年60点だったのが、今年は80点に上がりました。この結果を見ると、多くの方は社員満足度が向上したと考えると思います。... -
「分散」「標準偏差」を正しく理解しよう
データ分析や統計学を学ぶと、「分散」や「標準偏差」という言葉は極めて序盤に出てきます。なんとなく、「データのばらつき具合の指標」であることは分かっているですが、解釈が分かりづらいためか、実際にこれらの指標が用いられている事は少ないように... -
「相関係数」の意味とエクセルでの実行方法
「相関」とは、ある2つのデータが互いにどれほど影響を及ぼしているかを表す指標です。 例えば、ある売店において、「入り口から陳列棚までの距離」と「その商品の売上数」に相関関係があることが分かったとします。そうすると、売りたい商品は入り口付近... -
Pythonで相関係数を求めて可視化する方法
相関分析をPythonで実行し、可視化まで行ってみます。Excelでも相関分析は可能ですが、Pythonで実行すれば一度に全データの分布の傾向が一気に見れたり、視覚的に美しい図を作成したりと、ハイレベルな分析が簡単にできます。 データの読み込み 今回は以下... -
仮説検定の手法一覧と、それらの使い分け方
「仮説検定」というのは、「ある仮説」が正しいのか間違えているのかを統計学的に検証する方法の事を言います。 調べたい事柄がどんな事でも同じ手法を適用すれば良い訳ではなく、一体どんな仮説を検証したいかによって適切な手法は変わってきます。 そこ... -
アンケート調査の必要サンプル数計算ツール
統計学的に充分となるアンケート調査人数をブラウザ上で計算できます。「全体数」に全対象者人数を入れ、「計算」ボタンをクリックして下さい。 「許容誤差」「信頼度」「回答比率」について特にこだわりがないor良く分からなければデフォルトの値を用いて... -
Pythonによるロジスティック回帰分析
例えば、スマホアプリを作ってリリースはしたものの、一体、どんなユーザが登録してくれるのか。性別、年齢・・・など、一体どんな傾向を持った人がユーザ登録してくれる傾向にあるのか。それが分かれば様々なマーケティングの手が打てます。 そんな課題を... -
Pythonによる重回帰分析
Pythonで重回帰分析を行ってみます。 先にPythonによる単回帰分析の記事を読んでいただいたほうが分かりやすいかもしれませんが、こちらのみ読んでいただいても分かるようにはしております。また、今回もstatsmodelsライブラリを使用します。 https://anal... -
エクセルによる重回帰分析
以前、回帰分析を用いて気温とアイスクリームの売上の関係について推測しました。 https://analysis-navi.com/?p=1217 「気温」の情報だけでもなかなか良い推測が出来たようですが、気温だけでなく、もっと色々なデータがあったとしたらどうでしょうか。例... -
Pythonによる回帰分析と結果の可視化
Pythonを使って回帰分析を行ってみましょう。理論や用語についてはこちらをご覧ください。 https://analysis-navi.com/?p=1217 データの読み込み まずは何はともあれ、データを読み込みます。今回は「気温とアイスクリームの売上」データを読み込み、その... -
Pythonによるデータの代表値(平均値、中央値など)の計算
Pythonでデータを読み込み、列ごとに平均値や中央値などの「データの代表値」を計算してみましょう。 データ分析の初めの一歩は、何はともあれ平均値、中央値などの「代表値」を求めることです。Excelでも計算は可能ですが、ファイルサイズが巨大な場合や... -
犯罪者の70%以上が食べた食べ物って?
突然ですがクイズです。 以下の食べ物は何でしょうか?・心筋梗塞で亡くなった日本人の95%以上がこの食べ物を食べていた。・犯罪者の70%以上は、この食べ物を食べてから24時間以内に犯罪を犯している。・江戸時代、明治時代はこの食べ物が原因でたびたび暴...