2020年12月13日 / 最終更新日 : 2024年6月16日 Takuma Nishimaki 学習用記事 Pythonで都道府県別の色分け日本地図を作成する方法〜japanmap〜 都道府県別の情報を日本地図にマッピングして、可視化する方法です。 以下のような図の作成ができます。 都道府県名-色名の一覧作成 基本的には、都道府県-色名(orカラーコード)の一覧をSeries型で作成し、japanma […]
2020年9月6日 / 最終更新日 : 2024年6月16日 Takuma Nishimaki 学習用記事 BioPythonによるバイオデータ分析入門 BioPythonパッケージを使うと、Pythonで生物データ分析を簡単に取り扱うことができます。 この記事ではその入門編として、BioPythonを用いたDNA配列データの基本操作について整理しました。 BioPyth […]
2020年8月14日 / 最終更新日 : 2024年8月7日 Takuma Nishimaki 学習用記事 【Python】正規分布に従っているかを調べる手法3種 t検定の適用の可否を調べたい時など、データが正規分布に従っているかどうかを調べたい時があります。 ヒストグラムを書いてみれば、見た目でなんとなく正規分布っぽいかどうかは分かりますが、それは正確ではありません。 データが正 […]
2020年7月11日 / 最終更新日 : 2024年6月16日 Takuma Nishimaki 学習用記事 Pythonによる綺麗な散布図の作成方法 Pythonを使って、綺麗な散布図を作る方法です。 seabornライブラリの、scatterplot、jointplot、pairplotを使用します。 使用データの読み込み この記事では以下のデータを使用して、様々な […]
2020年6月1日 / 最終更新日 : 2024年6月16日 Takuma Nishimaki 学習用記事 Pythonによる綺麗なヒストグラムの作成方法 Pythonを使って、綺麗なヒストグラムを作りましょう。 seabornライブラリのdistplotを使用していきます。 また、環境はJupyter notebookを使用していることを想定しています。 使用データの読み […]
2020年5月21日 / 最終更新日 : 2024年6月16日 Takuma Nishimaki 学習用記事 Pythonによる仮説検定の実行方法 Pythonで仮説検定を行う方法です。 t検定、ウィルコクソンの符号順位検定、ウィルコクソンの順位和検定(マン・ホイットニーのU検定)、カイ二乗検定についてご紹介しています。 どういう時にどの手法を使えば良いのかについて […]
2020年5月10日 / 最終更新日 : 2024年7月16日 Takuma Nishimaki 学習用記事 Pythonによる4種の次元削減と可視化 以下4つの次元削減アルゴリズムをPythonで実行し、それぞれで2次元のグラフを作成してみます。 PCA(Principal Component Analysis:主成分分析) SVD(Singular Value De […]
2020年4月18日 / 最終更新日 : 2024年6月16日 Takuma Nishimaki 学習用記事 機械学習とは何か?どんな種類があるのか? 「機械学習」と言うと、「AIを作るために必要な技術」・・・という認識の方も多いです。 しかし、機械学習はAI開発のためだけのものではありません。 機械学習はIT企業だけではなくいかなる業種・職種でも有用なデータ分析の武器 […]
2020年3月24日 / 最終更新日 : 2024年6月16日 Takuma Nishimaki 学習用記事 Pythonによる勾配ブースティング(GBDT)の実行方法 機械学習手法「勾配ブースティング」は、データ分析コンペティション「Kaggle」で良い性能を出す事が多く、一気に多用されるようになりました。 個人の主観としても「数量データ分析における最強の機械学習手法」ではないかと考え […]
2020年3月8日 / 最終更新日 : 2024年9月17日 Takuma Nishimaki 学習用記事 Pythonによるテキストデータの表記揺れ対策あれこれ アンケートデータなどのテキスト情報を集計・分析する時、“表記揺れ”には非常に悩まされます。 例えば、同じ単語でも「Windows10」「Windows10」「WINDOWS10」「Windows- […]