YouTubeで学ぶPython機械学習入門

Pythonで様々な機械学習の手法の実行方法を学びましょう。

チャンネル登録

動画紹介

#1:次元削減

初めは教師なし学習の手法から。
まずは、データの情報をなるべく損なわないように変数の数を現象させる「次元削減」です。
PCA(主成分分析)、t-SNEなど色々な手法がありますが、この動画では「この2つを覚えておけばとりあえず困らない」と思われる、「特異値分解」「UMAP」をご紹介します。

#2:クラスタリング(非階層型)

データを近いもの同士でグループ分けするクラスタリングです。
「非階層型」「階層型」の2種類ありますが、まずは非階層型の代表的手法、K-means法を扱います。

#3:クラスタリング(階層型)

続いては階層型です。階層型は非階層型と比べると様々な手法があり、どの手法が優れるのかは一概には言えません。
この動画では、特に使用頻度が高いと思われるウォード法についてご紹介しています。

#4:回帰分析・重回帰分析

ここからは教師あり学習です。
(重)回帰分析は簡単なものならExcelでも実行可能な手法ですが、Pythonを用いればより複雑な分析をすることができます。

#5:ロジスティック回帰分析

続いては目的変数が「確率」となる回帰分析、ロジスティック回帰分析です。
実行方法は回帰分析と似ていますが、結果の見方などが少し異なりますので、押さえておきましょう。

#6:決定木分析

ツリー構造を用いてデータを分類していく決定木分析(decision tree)です。
回帰問題、分類問題、どちらにも使用でき、かつ視覚的に分かりやすい結果が得られる、使い勝手の良いデータ分析手法です。

#7:SVM(サポートベクターマシン)

未知データのカテゴリ予測に用いられるSVMです。ここからいよいよ「AI」っぽくなってきます。
データの分割手法(Hold Out法)や性能指標についても簡単に触れています。

#8:ランダムフォレスト

決定木分析の理論を応用したランダムフォレストです。
複数の決定木を作成し、最後に多数決で最終結果を決定する「バギング」の考え方を用いています。
決定木分析と同様、分類にも回帰にも使用することができます。

#9:勾配ブースティング(GBDT)

こちらも決定木分析の理論を利用した方法ですが、
1つ作って結果を評価し、少し調整して結果を評価し・・・と、逐一結果を更新していく「ブースティング」の考え方を用いています。
「数量データの予測をする際には、まずこの手法を使っておけば良い」と言えるほど、性能が良いモデルができる可能性が高い手法です。
合わせて、性能をより正確に計測するための交差検証(クロスバリデーション)の方法もご紹介しています。

sponsored link