【Pythonデータサイエンス超入門2-2】機械学習の基本〜教師なし学習編〜【YouTube】

動画で学べるPythonによるデータサイエンスの基礎シリーズ、5本目です。いよいよ機械学習を扱っていきます。
まずは「教師なし学習」の手法と実装方法を会得しましょう。

動画

アジェンダ

時間 内容
0:00 イントロダクション
2:17 機械学習とは?
12:40 次元削減
18:02 ├ Pythonによる次元削減の実行
24:08 ├ 寄与率の計算
26:06 ├ 結果の図示
28:10 ├ 結果の解釈
33:14 └ PCA以外の手法
42:24 クラスタリング
45:43 ├ Pythonによるクラスタリングの実行
46:06 ├ 階層クラスタリング
50:06 ├ 非階層クラスタリング(K-means)
54:43 ├ 結果の図示
58:05 ├ クラスタ数の推測(エルボー法)
1:01:39 └ X-means
1:09:36 アソシエーション分析(バスケット分析)
1:13:47 ├ Pythonによるアソシエーション分析の実行
1:19:46 └ ネットワーク図の作成
1:24:39 クロージング

シリーズ一覧

CSVのダウンロード

skill_level.csv
fruits_sales.csv

ソースコード

ライブラリ・データの読み込み

次元削減

PCA(主成分分析)

SVD(特異値分解)

t-SNE

UMAP

寄与率の計算

※PCA/SVDのみ

結果の2次元表示

Y軸の意味の推察

※PCA/SVDのみ

クラスタリング

階層クラスタリング

・単結合法(最短距離法) (method = “single”)
・完全結合法(最長距離法) (method = “complete”)
・郡平均法 (method = “average”)
・ウォード法 (method = “ward”)

非階層クラスタリング(K-means++)

クラスタ別集計

クラスタリング結果の確認 (クラスタリング×次元削減)

K-meansの最適なクラスタ数推測(エルボー法)

非階層クラスタリング(X-means)

アソシエーション分析(バスケット分析)

分析の実行

ネットワーク図の作成