2019年7月14日 / 最終更新日 : 2021年1月23日 Takuma Nishimaki Pythonデータ分析 Pythonによる階層型クラスタリングの実行方法 階層型クラスタリングをPythonで実行してみましょう。 scipyのclusterというパッケージを使えば非常に簡単に作成することが出来ます。 階層型クラスタリングの理論についてはこちらをご覧ください。 階層型クラスタ […]
2019年7月9日 / 最終更新日 : 2023年8月16日 Takuma Nishimaki Pythonデータ分析 Pythonによる重回帰分析 Pythonで重回帰分析を行ってみます。 先にPythonによる単回帰分析の記事を読んでいただいたほうが分かりやすいかもしれませんが、こちらのみ読んでいただいても分かるようにはしております。 また、今回もstatsmod […]
2019年7月7日 / 最終更新日 : 2023年8月16日 Takuma Nishimaki Excelデータ分析 エクセルによる重回帰分析 以前、回帰分析を用いて気温とアイスクリームの売上の関係について推測しました。 エクセルによる回帰分析 「気温」の情報だけでもなかなか良い推測が出来たようですが、気温だけでなく、もっと色々なデータがあったとしたらどうでしょ […]
2019年6月29日 / 最終更新日 : 2023年8月16日 Takuma Nishimaki Pythonデータ分析 Pythonによる回帰分析と結果の可視化 Pythonを使って回帰分析を行ってみましょう。 理論や用語についてはこちらをご覧ください。 エクセルによる回帰分析 データの読み込み まずは何はともあれ、データを読み込みます。 今回は「気温とアイスクリームの売上」デー […]
2019年6月21日 / 最終更新日 : 2021年1月23日 Takuma Nishimaki Pythonデータ分析 Pythonによる多クラス混同行列の作成と評価指標の計算 Pythonを使って多クラス混同行列を作り、評価指標を計算してみましょう。 混同行列はsklearn.metricsパッケージを使うと非常に簡単に計算することができますので、Excelで計算させるよりもパッとPython […]
2019年6月3日 / 最終更新日 : 2020年8月5日 Takuma Nishimaki Pythonデータ分析 Pythonによるデータの代表値(平均値、中央値など)の計算 Pythonでデータを読み込み、列ごとに平均値や中央値などの「データの代表値」を計算してみましょう。 データ分析の初めの一歩は、何はともあれ平均値、中央値などの「代表値」を求めることです。 Excelでも計算は可能ですが […]
2019年6月1日 / 最終更新日 : 2020年8月15日 Takuma Nishimaki Pythonデータ分析 プログラミングしてみたい人のためのPython入門 「プログラミングをやってみたいけど、何から初めたら良いか分からない」という声は良く聞かれます。 「プログラミング」というと、ゲームやスマホアプリを作るプログラマーの姿が想像されがちです。 しかし、プログラマーやエンジニア […]
2019年5月25日 / 最終更新日 : 2020年8月5日 Takuma Nishimaki Excelデータ分析 「カイ二乗検定」の意味とエクセルによる計算方法 以下は、第40代以降の歴代内閣総理大臣経験者(東條英機〜安倍晋三)の血液型比率を表したグラフと、日本人全体の血液型比率を表したグラフです。 この結果を見て、“内閣総理大臣になるような人物”と、その […]
2019年5月19日 / 最終更新日 : 2021年1月23日 Takuma Nishimaki Excelデータ分析 エクセルによる回帰分析 以下は、「2015年から2017年の、月別平均気温(℃)とアイスクリームの売上(円/世帯)」のグラフです。 ※参考 https://www.icecream.or.jp/biz/data/expenditures.htm […]
2019年2月2日 / 最終更新日 : 2021年1月23日 Takuma Nishimaki Pythonデータ分析 Pythonで文章の類似度を計算する方法〜TF-IDFとcos類似度〜 Pythonで、2つの文章の類似度計算をしてみます。 理論編は以下をご覧ください。 2文章の類似度の計算〜Bag-of-wordsとcos類似度のしくみ〜 今回は例題として、以下の3つの文章について、それぞれの類似度を計 […]