2019年8月5日 / 最終更新日 : 2020年8月5日 Takuma Nishimaki データ分析ノウハウ 統計分析の手法まとめ 統計分析手法のまとめページです。 まず「記述統計」「推計統計」の2つに大別し、それぞれについて手法を整理しました。 「回帰分析」「決定木分析」などの分析手法については「機械学習」のページに整理しています。 全ては網羅でき […]
2019年6月16日 / 最終更新日 : 2021年2月20日 Takuma Nishimaki データ分析の手法 階層型クラスタリング(ウォード法、群平均法など)の計算過程 クラスタリング手法のうち、階層型クラスタリングの計算過程について整理しました。 階層型クラスタリングには様々な方法があるのですが、本記事では代表的な4手法について説明を行わせて頂きます。 クラスタリングの概要については以 […]
2019年5月28日 / 最終更新日 : 2020年8月5日 Takuma Nishimaki データ分析ノウハウ 犯罪者の70%以上が食べた食べ物って? 突然ですがクイズです。 以下の食べ物は何でしょうか? ・心筋梗塞で亡くなった日本人の95%以上がこの食べ物を食べていた。 ・犯罪者の70%以上は、この食べ物を食べてから24時間以内に犯罪を犯している。 ・江戸時代、明治時 […]
2019年5月12日 / 最終更新日 : 2021年1月23日 Takuma Nishimaki データ分析の手法 ディープラーニングの学習の仕組み 2015年あたりから、「AIと言えばディープラーニング(深層学習)」というくらい、ディープラーニングの実力やその可能性・発展性が浸透してきたように感じます。 確かに画像認識を行いたいのなら今やディープラーニング一択に近い […]
2019年4月1日 / 最終更新日 : 2020年8月7日 Takuma Nishimaki データ分析の手法 進化距離・その2〜Poisson distance編〜 「進化距離」の続編です。 前回は「進化距離」の意味から、最も単純な進化距離の計算手法である「P-distance(P距離)」についてご説明させて頂きました。 進化距離(evolutionary distance)の意味と […]
2019年3月9日 / 最終更新日 : 2020年8月5日 Takuma Nishimaki データ分析ノウハウ 病気を99%当てる医者の話は信じて良い? よく考えないと騙されてしまいそうな、確率・統計のトリックの中でも有名なもののひとつです。 まずは、以下の文章をご覧ください。 ある病気かどうかを99%の確率で当てる医者がいる。 その医者に診察を受けると、「あなたは病気な […]
2019年3月2日 / 最終更新日 : 2020年8月7日 Takuma Nishimaki データ分析の手法 進化距離(evolutionary distance)の意味と計算方法 進化距離とは 「進化距離(evolutionary distance)」という言葉をご存知でしょうか。 「距離」という言葉は、広く使われている用法としては「家から病院までの距離」のように、その道の長さなどを測るために使わ […]
2019年2月23日 / 最終更新日 : 2020年8月5日 Takuma Nishimaki データ分析ノウハウ A君がテストで2連勝。でも合計点数はB君の方が高い? まずは以下の文章をお読みください。 A君とB君が、1回目と2回目で合わせて100問解くというテストで勝負した。 1回目のテストでは、A君の正解率は90%、B君の正解率は80%だった。 2回目のテストでは、A君の正解率は5 […]
2019年2月9日 / 最終更新日 : 2021年1月20日 Takuma Nishimaki データ分析ノウハウ 適切な近似曲線を選んでいますか? 以下は2004年〜2018年の日本にある公衆電話台数の推移を表したグラフです。 (※参考:総務省HP) さて、この情報を元に、5年後(2023年)の、日本にある公衆電話の台数を予測してみましょう。 そのために、このグラフ […]
2019年1月12日 / 最終更新日 : 2021年1月23日 Takuma Nishimaki データ分析の手法 非階層型クラスタリング「k-means法」の計算過程 クラスタリング手法の中でおそらく最も広く使用されている手法、k-means法(k-平均法)について説明します。 クラスタリングの概要については以下に整理しています。 「クラスタリング」とは何に使える?どんな手法がある? […]