2022年9月10日 / 最終更新日 : 2022年9月10日 Takuma Nishimaki Pythonデータ分析 【Pythonデータサイエンス超入門2-1】回帰分析の基本【YouTube】 YouTubeによるPythonデータサイエンス超入門シリーズ「回帰分析の基本」で紹介したソースコードを掲載しているページです。 ご自由に動画で使用したCSVのダウンロードやソースコードのコピー&ペーストなどし […]
2020年9月6日 / 最終更新日 : 2020年10月3日 Takuma Nishimaki Pythonデータ分析 BioPythonによるバイオデータ分析入門 BioPythonパッケージを使うと、Pythonで生物データ分析を簡単に取り扱うことができます。 この記事ではその入門編として、BioPythonを用いたDNA配列データの基本操作について整理しました。 BioPyth […]
2020年8月14日 / 最終更新日 : 2020年11月3日 Takuma Nishimaki Pythonデータ分析 【Python】正規分布に従っているかを調べる手法3種 t検定の適用の可否を調べたい時など、データが正規分布に従っているかどうかを調べたい時があります。 ヒストグラムを書いてみれば、見た目でなんとなく正規分布っぽいかどうかは分かりますが、それは正確ではありません。 データが正 […]
2020年7月11日 / 最終更新日 : 2020年7月11日 Takuma Nishimaki Pythonデータ分析 Pythonによる綺麗な散布図の作成方法 Pythonを使って、綺麗な散布図を作る方法です。 seabornライブラリの、scatterplot、jointplot、pairplotを使用します。 使用データの読み込み この記事では以下のデータを使用して、様々な […]
2020年6月1日 / 最終更新日 : 2020年6月1日 Takuma Nishimaki Pythonデータ分析 Pythonによる綺麗なヒストグラムの作成方法 Pythonを使って、綺麗なヒストグラムを作りましょう。 seabornライブラリのdistplotを使用していきます。 また、環境はJupyter notebookを使用していることを想定しています。 使用データの読み […]
2020年5月21日 / 最終更新日 : 2020年8月5日 Takuma Nishimaki Pythonデータ分析 Pythonによる仮説検定の実行方法 Pythonで仮説検定を行う方法です。 t検定、ウィルコクソンの符号順位検定、ウィルコクソンの順位和検定(マン・ホイットニーのU検定)、カイ二乗検定についてご紹介しています。 どういう時にどの手法を使えば良いのかについて […]
2020年5月10日 / 最終更新日 : 2020年11月30日 Takuma Nishimaki Pythonデータ分析 Pythonによる4種の次元削減と可視化 以下4つの次元削減アルゴリズムをPythonで実行し、それぞれで2次元のグラフを作成してみます。 PCA(Principal Component Analysis:主成分分析) SVD(Singular Value De […]
2020年3月24日 / 最終更新日 : 2021年1月23日 Takuma Nishimaki Pythonデータ分析 Pythonによる勾配ブースティング(GBDT)の実行方法 機械学習手法「勾配ブースティング」は、データ分析コンペティション「Kaggle」で良い性能を出す事が多く、一気に多用されるようになりました。 個人の主観としても「数量データ分析における最強の機械学習手法」ではないかと考え […]
2020年3月8日 / 最終更新日 : 2021年2月20日 Takuma Nishimaki Pythonデータ分析 Pythonによるテキストデータの表記揺れ対策あれこれ アンケートデータなどのテキスト情報を集計・分析する時、“表記揺れ”には非常に悩まされます。 例えば、同じ単語でも「Windows10」「Windows10」「WINDOWS10」「Windows- […]
2020年1月25日 / 最終更新日 : 2020年8月5日 Takuma Nishimaki Pythonデータ分析 はじめてのPythonによるDataFrame処理 データ分析するためのツールの代表といえばExcelですが、複雑な処理をしたい場合にはExcelでは難しくなってきます。 そんな時はPythonの出番です。Pythonでのデータ操作を使いこなせば、どんな複雑な処理であって […]