学習用記事– category –
統計学・機械学習などの理論や、プログラミングの学習に活用できる記事です。
-
Pythonによる非階層型クラスタリング(k-means法)
非階層型クラスタリングの代表的手法である「k-means法」をPythonで実行してみます。k-means法の理論についてはこちらの記事をご覧ください。 https://analysis-navi.com/?p=618 ファイルの読み込み、k-means法の実行 今回は理論編で使用したデータとほぼ... -
「次元削減」の意味と活用方法
様々な場面で大活躍するデータ分析手法、「次元削減(次元圧縮)」とは一体何でしょうか。また、どのように使うのでしょうか。本記事では、次元削減の基本的な内容について整理しました。 Pythonで次元削減を行う方法については、別の記事に整理しています。... -
Pythonで文章中の頻出単語を抽出する方法
文章の中に出てくる頻出単語のカウント方法です。シンプルな分析ではありますが、頻出単語が分かるだけでもその文章データの持つ傾向を大まかに知ることができます。 今回は例題として、夏目漱石「こころ」に出てくる頻出単語ランキングをPythonで作成して... -
Pythonによる決定木分析の実行方法
データ分析手法のひとつ「決定木分析」をPythonで実行してみます。 決定木分析は経営の意思決定などビジネスで活躍することの多い手法です。しかし、Excelでは実行できないためか一般的に用いられているシーンはそこまで見ません。 しかし、決定木分析は非... -
Pythonによるロジスティック回帰分析
例えば、スマホアプリを作ってリリースはしたものの、一体、どんなユーザが登録してくれるのか。性別、年齢・・・など、一体どんな傾向を持った人がユーザ登録してくれる傾向にあるのか。それが分かれば様々なマーケティングの手が打てます。 そんな課題を... -
Pythonによる階層型クラスタリングの実行方法
階層型クラスタリングをPythonで実行してみましょう。scipyのclusterというパッケージを使えば非常に簡単に作成することが出来ます。 階層型クラスタリングの理論についてはこちらをご覧ください。 https://analysis-navi.com/?p=1805 データの読み込み 今... -
Pythonによる重回帰分析
Pythonで重回帰分析を行ってみます。 先にPythonによる単回帰分析の記事を読んでいただいたほうが分かりやすいかもしれませんが、こちらのみ読んでいただいても分かるようにはしております。また、今回もstatsmodelsライブラリを使用します。 https://anal... -
エクセルによる重回帰分析
以前、回帰分析を用いて気温とアイスクリームの売上の関係について推測しました。 https://analysis-navi.com/?p=1217 「気温」の情報だけでもなかなか良い推測が出来たようですが、気温だけでなく、もっと色々なデータがあったとしたらどうでしょうか。例... -
Pythonによる回帰分析と結果の可視化
Pythonを使って回帰分析を行ってみましょう。理論や用語についてはこちらをご覧ください。 https://analysis-navi.com/?p=1217 データの読み込み まずは何はともあれ、データを読み込みます。今回は「気温とアイスクリームの売上」データを読み込み、その... -
Pythonによる多クラス混同行列の作成と評価指標の計算
Pythonを使って多クラス混同行列を作り、評価指標を計算してみましょう。 混同行列はsklearn.metricsパッケージを使うと非常に簡単に計算することができますので、Excelで計算させるよりもパッとPythonでやってしまいましょう。 混同行列についてはこちら...