コンテンツに移動 ナビゲーションに移動

データと正しく付き合おう。

  • TOP
  • ABOUT
  • CONTACT

データ分析Navi

数量データ

  1. HOME
  2. データの分析
  3. 数量データ
2019年10月6日 / 最終更新日 : 2020年8月5日 Takuma Nishimaki 数量データ

仮説検定の手法一覧と、それらの使い分け方

「仮説検定」というのは、「ある仮説」が正しいのか間違えているのかを統計学的に検証する方法の事を言います。 調べたい事柄がどんな事でも同じ手法を適用すれば良い訳ではなく、一体どんな仮説を検証したいかによって適切な手法は変わ […]

2019年9月15日 / 最終更新日 : 2020年8月4日 Takuma Nishimaki 数量データ

アンケート調査の必要サンプル数計算ツール

統計学的に充分となるアンケート調査人数をブラウザ上で計算できます。 「全体数」に全対象者人数を入れ、「計算」ボタンをクリックして下さい。 「許容誤差」「信頼度」「回答比率」について特にこだわりがないor良く分からなければ […]

2019年8月5日 / 最終更新日 : 2020年8月5日 Takuma Nishimaki 数量データ

統計分析の手法まとめ

統計分析手法のまとめページです。 まず「記述統計」「推計統計」の2つに大別し、それぞれについて手法を整理しました。 「回帰分析」「決定木分析」などの分析手法については「機械学習」のページに整理しています。 全ては網羅でき […]

2019年6月3日 / 最終更新日 : 2020年8月5日 Takuma Nishimaki 数量データ

Pythonによるデータの代表値(平均値、中央値など)の計算

Pythonでデータを読み込み、列ごとに平均値や中央値などの「データの代表値」を計算してみましょう。 データ分析の初めの一歩は、何はともあれ平均値、中央値などの「代表値」を求めることです。 Excelでも計算は可能ですが […]

2019年5月28日 / 最終更新日 : 2020年8月5日 Takuma Nishimaki 数量データ

犯罪者の70%以上が食べた食べ物って?

突然ですがクイズです。 以下の食べ物は何でしょうか? ・心筋梗塞で亡くなった日本人の95%以上がこの食べ物を食べていた。 ・犯罪者の70%以上は、この食べ物を食べてから24時間以内に犯罪を犯している。 ・江戸時代、明治時 […]

2019年5月25日 / 最終更新日 : 2020年8月5日 Takuma Nishimaki 数量データ

「カイ二乗検定」の意味とエクセルによる計算方法

以下は、第40代以降の歴代内閣総理大臣経験者(東條英機〜安倍晋三)の血液型比率を表したグラフと、日本人全体の血液型比率を表したグラフです。 この結果を見て、“内閣総理大臣になるような人物”と、その […]

2019年3月9日 / 最終更新日 : 2020年8月5日 Takuma Nishimaki 数量データ

病気を99%当てる医者の話は信じて良い?

よく考えないと騙されてしまいそうな、確率・統計のトリックの中でも有名なもののひとつです。 まずは、以下の文章をご覧ください。 ある病気かどうかを99%の確率で当てる医者がいる。 その医者に診察を受けると、「あなたは病気な […]

2019年2月23日 / 最終更新日 : 2020年8月5日 Takuma Nishimaki 数量データ

A君がテストで2連勝。でも合計点数はB君の方が高い?

まずは以下の文章をお読みください。 A君とB君が、1回目と2回目で合わせて100問解くというテストで勝負した。 1回目のテストでは、A君の正解率は90%、B君の正解率は80%だった。 2回目のテストでは、A君の正解率は5 […]

2018年12月5日 / 最終更新日 : 2020年8月10日 Takuma Nishimaki 数量データ

データは綺麗に作ろう〜データクレンジングの基本〜

データの集計を行う際には、まず初めにきちんとデータ形式を確定させてからにしないと後々面倒になります。 例えば以下のような、10名の身長データがあるとします。 この表を見て、どう思われるでしょうか。 なんとなく「いい加減に […]

2018年11月17日 / 最終更新日 : 2020年4月8日 Takuma Nishimaki 数量データ

「平均値」は正しく使おう

データ”分析”とまでは行かなくても、データ”集計”の機会は殆どの方が仕事でもプライベートでもあるかと思います。 それは仕事での原価管理・工数管理に始まり、プライベートでの家 […]

投稿ナビゲーション

  • «
  • ページ 1
  • ページ 2

スポンサーリンク

YouTubeチャンネル



サイト内検索

カテゴリー

  • データの分析 (31)
    • 数量データ (20)
    • テキストデータ (7)
    • 生命科学データ (4)
  • AI(人工知能) (38)
    • AIを知る (7)
    • 機械学習 (25)
    • 性能評価 (6)
  • データ操作入門 (10)
    • データフレーム (2)
    • Tips (6)
    • Python入門 (2)

アクセスランキング

  • 機械学習
    適切な近似曲線を選んでいますか?
  • 数量データ
    「t検定」を正しく理解しよう
  • 数量データ
    アンケート調査の必要サンプル数計算ツール
  • テキストデータ
    Pythonで文章中の頻出単語を抽出する方法
  • 性能評価
    2クラス混同行列とその評価指標〜再現率、適合率、F値、など〜
  • 性能評価
    多クラス混同行列とその評価指標〜マクロ平均、マイクロ平均〜
  • 性能評価
    適切な誤差指標の選び方
  • 数量データ
    「カイ二乗検定」の意味とエクセルによる計算方法
  • 数量データ
    Pythonで相関係数を求めて可視化する方法
  • テキストデータ
    Pythonで文章の類似度を計算する方法〜TF-IDFとcos類似度〜

タグ

Excel Python YouTube

スポンサーリンク

Copyright © データ分析Navi All Rights Reserved.

MENU