2019年7月27日 / 最終更新日 : 2024年9月17日 Takuma Nishimaki 学習用記事 Pythonによるロジスティック回帰分析 例えば、スマホアプリを作ってリリースはしたものの、一体、どんなユーザが登録してくれるのか。 性別、年齢・・・など、一体どんな傾向を持った人がユーザ登録してくれる傾向にあるのか。 それが分かれば様々なマーケティングの手が打 […]
2019年7月14日 / 最終更新日 : 2024年6月16日 Takuma Nishimaki 学習用記事 Pythonによる階層型クラスタリングの実行方法 階層型クラスタリングをPythonで実行してみましょう。 scipyのclusterというパッケージを使えば非常に簡単に作成することが出来ます。 階層型クラスタリングの理論についてはこちらをご覧ください。 階層型クラスタ […]
2019年7月9日 / 最終更新日 : 2024年9月17日 Takuma Nishimaki 学習用記事 Pythonによる重回帰分析 Pythonで重回帰分析を行ってみます。 先にPythonによる単回帰分析の記事を読んでいただいたほうが分かりやすいかもしれませんが、こちらのみ読んでいただいても分かるようにはしております。 また、今回もstatsmod […]
2019年6月29日 / 最終更新日 : 2024年9月17日 Takuma Nishimaki 学習用記事 Pythonによる回帰分析と結果の可視化 Pythonを使って回帰分析を行ってみましょう。 理論や用語についてはこちらをご覧ください。 エクセルによる回帰分析 データの読み込み まずは何はともあれ、データを読み込みます。 今回は「気温とアイスクリームの売上」デー […]
2019年6月21日 / 最終更新日 : 2024年6月16日 Takuma Nishimaki 学習用記事 Pythonによる多クラス混同行列の作成と評価指標の計算 Pythonを使って多クラス混同行列を作り、評価指標を計算してみましょう。 混同行列はsklearn.metricsパッケージを使うと非常に簡単に計算することができますので、Excelで計算させるよりもパッとPython […]
2019年6月3日 / 最終更新日 : 2024年6月16日 Takuma Nishimaki 学習用記事 Pythonによるデータの代表値(平均値、中央値など)の計算 Pythonでデータを読み込み、列ごとに平均値や中央値などの「データの代表値」を計算してみましょう。 データ分析の初めの一歩は、何はともあれ平均値、中央値などの「代表値」を求めることです。 Excelでも計算は可能ですが […]
2019年2月2日 / 最終更新日 : 2024年6月16日 Takuma Nishimaki 学習用記事 Pythonで文章の類似度を計算する方法〜TF-IDFとcos類似度〜 Pythonで、2つの文章の類似度計算をしてみます。 理論編は以下をご覧ください。 2文章の類似度の計算〜Bag-of-wordsとcos類似度のしくみ〜 今回は例題として、以下の3つの文章について、それぞれの類似度を計 […]
2018年12月1日 / 最終更新日 : 2024年9月17日 Takuma Nishimaki 学習用記事 PythonによるCSV/TSVの読み込みとデータの取得方法 Pythonでデータ分析をする為の「第一歩」として、CSV/TSVデータをPythonに読み込む方法を見ていきます。 ※ちなみに、CSVは「Comma Separated Values」つまりカンマで区切られたデータとい […]
2018年11月9日 / 最終更新日 : 2024年6月16日 Takuma Nishimaki 学習用記事 Pythonで配列の一部を取り出す「スライス」の方法 Pythonで配列の一部を色々な形で抽出する方法、通称「スライス」のまとめです。 「数値配列の一部分のみの合計値を求めたい」ですとか、「文字列の一部分のみ抽出したい」なんていう時にスライスの記法を知っておくと、簡素かつス […]