統計学– tag –
-
Pythonによる回帰分析と結果の可視化
Pythonを使って回帰分析を行ってみましょう。理論や用語についてはこちらをご覧ください。 https://analysis-navi.com/?p=1217 データの読み込み まずは何はともあれ、データを読み込みます。今回は「気温とアイスクリームの売上」データを読み込み、その... -
Pythonによるデータの代表値(平均値、中央値など)の計算
Pythonでデータを読み込み、列ごとに平均値や中央値などの「データの代表値」を計算してみましょう。 データ分析の初めの一歩は、何はともあれ平均値、中央値などの「代表値」を求めることです。Excelでも計算は可能ですが、ファイルサイズが巨大な場合や... -
犯罪者の70%以上が食べた食べ物って?
突然ですがクイズです。 以下の食べ物は何でしょうか?・心筋梗塞で亡くなった日本人の95%以上がこの食べ物を食べていた。・犯罪者の70%以上は、この食べ物を食べてから24時間以内に犯罪を犯している。・江戸時代、明治時代はこの食べ物が原因でたびたび暴... -
「カイ二乗検定」の意味とエクセルによる計算方法
以下は、第40代以降の歴代内閣総理大臣経験者(東條英機〜安倍晋三)の血液型比率を表したグラフと、日本人全体の血液型比率を表したグラフです。 この結果を見て、"内閣総理大臣になるような人物"と、その血液型に関連性があるのかどうか分かるでしょうか?... -
回帰分析の意味とエクセルによる実行方法
以下は、「2015年から2017年の、月別平均気温(℃)とアイスクリームの売上(円/世帯)」のグラフです。 ※参考https://www.icecream.or.jp/biz/data/expenditures.htmlhttp://www.data.jma.go.jp/obd/stats/etrn/view/monthly_s3.php?prec_no=44&block_no=4... -
病気を99%当てる医者の話は信じて良い?
よく考えないと騙されてしまいそうな、確率・統計のトリックの中でも有名なもののひとつです。 まずは、以下の文章をご覧ください。 ある病気かどうかを99%の確率で当てる医者がいる。その医者に診察を受けると、「あなたは病気なので、今すぐこの薬を購入... -
A君がテストで2連勝。でも合計点数はB君の方が高い?
まずは以下の文章をお読みください。 A君とB君が、1回目と2回目で合わせて100問解くというテストで勝負した。1回目のテストでは、A君の正解率は90%、B君の正解率は80%だった。2回目のテストでは、A君の正解率は50%、B君の正解率は40%だった。 どう見てもA... -
適切な近似曲線を選んでいますか?
以下は2004年〜2018年の日本にある公衆電話台数の推移を表したグラフです。 (※参考:総務省HP) さて、この情報を元に、5年後(2023年)の、日本にある公衆電話の台数を予測してみましょう。 そのために、このグラフの傾向を表す「近似線」を引くことになる...