Python– tag –
-
Pythonによる綺麗な散布図の作成方法
Pythonを使って、綺麗な散布図を作る方法です。 seabornライブラリの、scatterplot、jointplot、pairplotを使用します。 使用データの読み込み この記事では以下のデータを使用して、様々なパターンの散布図を作成してみます。 まずは、以下のようにread_c... -
Pythonによる綺麗なヒストグラムの作成方法
Pythonを使って、綺麗なヒストグラムを作りましょう。seabornライブラリのdistplotを使用していきます。また、環境はJupyter notebookを使用していることを想定しています。 使用データの読み込み 今回は、以下のテストの成績データを使ってみます。 まず... -
Pythonによる仮説検定の実行方法
Pythonで仮説検定を行う方法です。t検定、ウィルコクソンの符号順位検定、ウィルコクソンの順位和検定(マン・ホイットニーのU検定)、カイ二乗検定についてご紹介しています。 どういう時にどの手法を使えば良いのかについては、「仮説検定の使い分け方」... -
Pythonによる4種の次元削減と可視化
以下4つの次元削減アルゴリズムをPythonで実行し、それぞれで2次元のグラフを作成してみます。 PCA(Principal Component Analysis:主成分分析) SVD(Singular Value Decomposition:特異値分解) t-SNE(t-distributed Stochastic Neighbor Embedding) UMAP(Un... -
Pythonによるテキストデータの表記揺れ対策あれこれ
アンケートデータなどのテキスト情報を集計・分析する時、"表記揺れ"には非常に悩まされます。例えば、同じ単語でも「Windows10」「Windows10」「WINDOWS10」「Windows-10」・・・といって、人によって様々な書き方があります。このような表記揺... -
はじめてのPythonによるDataFrame処理
データ分析するためのツールの代表といえばExcelですが、複雑な処理をしたい場合にはExcelでは難しくなってきます。そんな時はPythonの出番です。Pythonでのデータ操作を使いこなせば、どんな複雑な処理であっても自由自在にデータ分析することができます... -
Pythonで化学式を構成元素に分解する
Pythonを用いて、化学式(組成式)を構成元素とその数に分割する方法です。例えば、「C16H10ClN3」というように記載された化学式を、{C:16,H:10,Cl:1,N:3}という辞書データに分解することをゴールとしています。 関数の作成 化学式を入力して、構成要素を... -
Pythonで相関係数を求めて可視化する方法
相関分析をPythonで実行し、可視化まで行ってみます。Excelでも相関分析は可能ですが、Pythonで実行すれば一度に全データの分布の傾向が一気に見れたり、視覚的に美しい図を作成したりと、ハイレベルな分析が簡単にできます。 データの読み込み 今回は以下... -
Pythonによる日付・時刻の計算
Pythonによる日付や時刻の計算方法を整理しました。 現在時刻の取得 まずはdatetimeライブラリをインポートします。現在日時の取得は簡単で、nowメソッドを呼び出します。 [crayon-684da70425152475012991/] [crayon-684da70425153356209513/] これで、現... -
Pythonでランダムフォレストを実行する方法
Pythonを使ってランダムフォレストを実行してみます。決定木分析を基調とした手法なので、先に決定木分析の記事を読んで頂いてからの方が分かりやすいかもしれません。 https://analysis-navi.com/?p=2007 ランダムフォレストとは 一言で言えば決定木分析...