2020年3月8日 / 最終更新日 : 2023年8月16日 Takuma Nishimaki Pythonデータ分析 Pythonによるテキストデータの表記揺れ対策あれこれ アンケートデータなどのテキスト情報を集計・分析する時、“表記揺れ”には非常に悩まされます。 例えば、同じ単語でも「Windows10」「Windows10」「WINDOWS10」「Windows- […]
2020年1月25日 / 最終更新日 : 2020年8月5日 Takuma Nishimaki Pythonデータ分析 はじめてのPythonによるDataFrame処理 データ分析するためのツールの代表といえばExcelですが、複雑な処理をしたい場合にはExcelでは難しくなってきます。 そんな時はPythonの出番です。Pythonでのデータ操作を使いこなせば、どんな複雑な処理であって […]
2020年1月17日 / 最終更新日 : 2021年10月12日 Takuma Nishimaki Excelデータ分析 「t検定」を正しく理解しよう 例えば、ある会社の全社員に「あなたにとってこの会社は100点中何点ですか?」というアンケートを取ったとします。 その結果、全社員の平均値が昨年60点だったのが、今年は80点に上がりました。 この結果を見ると、多くの方は社 […]
2020年1月16日 / 最終更新日 : 2020年4月8日 Takuma Nishimaki Excelデータ分析 「分散」「標準偏差」を正しく理解しよう データ分析や統計学を学ぶと、「分散」や「標準偏差」という言葉は極めて序盤に出てきます。 なんとなく、「データのばらつき具合の指標」であることは分かっているですが、解釈が分かりづらいためか、実際にこれらの指標が用いられてい […]
2020年1月15日 / 最終更新日 : 2021年10月9日 Takuma Nishimaki Excelデータ分析 「相関係数」を正しく理解しよう 「相関」とは、ある2つのデータが互いにどれほど影響を及ぼしているかを表す指標です。 例えば、ある売店において、「入り口から陳列棚までの距離」と「その商品の売上数」に相関関係があることが分かったとします。 そうすると、売り […]
2019年12月29日 / 最終更新日 : 2023年8月16日 Takuma Nishimaki Python Tips Pythonで化学式を構成元素に分解する Pythonを用いて、化学式(組成式)を構成元素とその数に分割する方法です。 例えば、「C16H10ClN3」というように記載された化学式を、{C:16,H:10,Cl:1,N:3}という辞書データに分解することをゴール […]
2019年12月7日 / 最終更新日 : 2020年4月8日 Takuma Nishimaki Pythonデータ分析 Pythonで相関係数を求めて可視化する方法 相関分析をPythonで実行し、可視化まで行ってみます。 Excelでも相関分析は可能ですが、Pythonで実行すれば一度に全データの分布の傾向が一気に見れたり、視覚的に美しい図を作成したりと、ハイレベルな分析が簡単にで […]
2019年11月30日 / 最終更新日 : 2020年8月5日 Takuma Nishimaki Python Tips Pythonによる日付・時刻の計算 Pythonによる日付や時刻の計算方法を整理しました。 現在時刻の取得 まずはdatetimeライブラリをインポートします。 現在日時の取得は簡単で、nowメソッドを呼び出します。 [crayon-650f7e4b74b […]
2019年11月9日 / 最終更新日 : 2019年11月24日 Takuma Nishimaki Python Tips Pythonで一定の規則を持つ配列(リスト)を生成する Pythonにて、一定の規則に基づいた配列(list)を簡単に生成する方法のTipsです。 同じ値が繰り返される配列 例えば、「5」が10回繰り返される配列を作りたい場合は、以下のように書けます。 [crayon-650 […]
2019年10月28日 / 最終更新日 : 2021年1月23日 Takuma Nishimaki Pythonデータ分析 Pythonでランダムフォレストを実行する方法 Pythonを使ってランダムフォレストを実行してみます。 決定木分析を基調とした手法なので、先に決定木分析の記事を読んで頂いてからの方が分かりやすいかもしれません。 Pythonによる決定木分析 ランダムフォレストとは […]