コンテンツに移動 ナビゲーションに移動

データ分析を正しく、楽しく。

  • TOP
  • CONTACT

データサイエンス情報局

データエンジニアリング

  1. HOME
  2. データエンジニアリング
2020年3月8日 / 最終更新日 : 2023年8月16日 Takuma Nishimaki Pythonデータ分析

Pythonによるテキストデータの表記揺れ対策あれこれ

アンケートデータなどのテキスト情報を集計・分析する時、“表記揺れ”には非常に悩まされます。 例えば、同じ単語でも「Windows10」「Windows10」「WINDOWS10」「Windows- […]

2020年1月25日 / 最終更新日 : 2020年8月5日 Takuma Nishimaki Pythonデータ分析

はじめてのPythonによるDataFrame処理

データ分析するためのツールの代表といえばExcelですが、複雑な処理をしたい場合にはExcelでは難しくなってきます。 そんな時はPythonの出番です。Pythonでのデータ操作を使いこなせば、どんな複雑な処理であって […]

2020年1月17日 / 最終更新日 : 2021年10月12日 Takuma Nishimaki Excelデータ分析

「t検定」を正しく理解しよう

例えば、ある会社の全社員に「あなたにとってこの会社は100点中何点ですか?」というアンケートを取ったとします。 その結果、全社員の平均値が昨年60点だったのが、今年は80点に上がりました。 この結果を見ると、多くの方は社 […]

2020年1月16日 / 最終更新日 : 2020年4月8日 Takuma Nishimaki Excelデータ分析

「分散」「標準偏差」を正しく理解しよう

データ分析や統計学を学ぶと、「分散」や「標準偏差」という言葉は極めて序盤に出てきます。 なんとなく、「データのばらつき具合の指標」であることは分かっているですが、解釈が分かりづらいためか、実際にこれらの指標が用いられてい […]

2020年1月15日 / 最終更新日 : 2021年10月9日 Takuma Nishimaki Excelデータ分析

「相関係数」を正しく理解しよう

「相関」とは、ある2つのデータが互いにどれほど影響を及ぼしているかを表す指標です。 例えば、ある売店において、「入り口から陳列棚までの距離」と「その商品の売上数」に相関関係があることが分かったとします。 そうすると、売り […]

2019年12月29日 / 最終更新日 : 2023年8月16日 Takuma Nishimaki Python Tips

Pythonで化学式を構成元素に分解する

Pythonを用いて、化学式(組成式)を構成元素とその数に分割する方法です。 例えば、「C16H10ClN3」というように記載された化学式を、{C:16,H:10,Cl:1,N:3}という辞書データに分解することをゴール […]

2019年12月7日 / 最終更新日 : 2020年4月8日 Takuma Nishimaki Pythonデータ分析

Pythonで相関係数を求めて可視化する方法

相関分析をPythonで実行し、可視化まで行ってみます。 Excelでも相関分析は可能ですが、Pythonで実行すれば一度に全データの分布の傾向が一気に見れたり、視覚的に美しい図を作成したりと、ハイレベルな分析が簡単にで […]

2019年11月30日 / 最終更新日 : 2020年8月5日 Takuma Nishimaki Python Tips

Pythonによる日付・時刻の計算

Pythonによる日付や時刻の計算方法を整理しました。 現在時刻の取得 まずはdatetimeライブラリをインポートします。 現在日時の取得は簡単で、nowメソッドを呼び出します。 [crayon-650f7e4b74b […]

2019年11月9日 / 最終更新日 : 2019年11月24日 Takuma Nishimaki Python Tips

Pythonで一定の規則を持つ配列(リスト)を生成する

Pythonにて、一定の規則に基づいた配列(list)を簡単に生成する方法のTipsです。 同じ値が繰り返される配列 例えば、「5」が10回繰り返される配列を作りたい場合は、以下のように書けます。 [crayon-650 […]

2019年10月28日 / 最終更新日 : 2021年1月23日 Takuma Nishimaki Pythonデータ分析

Pythonでランダムフォレストを実行する方法

Pythonを使ってランダムフォレストを実行してみます。 決定木分析を基調とした手法なので、先に決定木分析の記事を読んで頂いてからの方が分かりやすいかもしれません。 Pythonによる決定木分析 ランダムフォレストとは […]

投稿ナビゲーション

  • «
  • ページ 1
  • ページ 2
  • ページ 3
  • …
  • ページ 5
  • »

スポンサーリンク

YouTubeチャンネル



おすすめ記事

サイト内検索

カテゴリー

  • データの分析 (1)
  • AI(人工知能) (1)
    • 機械学習 (1)
  • データ操作入門 (3)
    • Python入門 (3)
  • データサイエンス (24)
    • データ分析・AIの性能 (5)
    • データ分析の手法 (10)
    • データ分析ノウハウ (9)
  • データエンジニアリング (43)
    • Excelデータ分析 (7)
    • Pythonデータ分析 (30)
    • Python Tips (6)
  • ビジネス (5)
    • AIを知る (2)
    • プロジェクト推進 (3)
  • その他 (3)

アクセスランキング

  • データ分析ノウハウ
    適切な近似曲線を選んでいますか?
  • データ分析ノウハウ
    アンケート調査の必要サンプル数計算ツール
  • Pythonデータ分析
    Pythonで文章中の頻出単語を抽出する方法
  • Excelデータ分析
    「t検定」を正しく理解しよう
  • データ分析・AIの性能
    2クラス混同行列とその評価指標〜再現率、適合率、F値、など〜
  • Pythonデータ分析
    Pythonで相関係数を求めて可視化する方法
  • データ分析・AIの性能
    適切な誤差指標の選び方
  • データ分析・AIの性能
    多クラス混同行列とその評価指標〜マクロ平均、マイクロ平均〜
  • Pythonデータ分析
    【Python】正規分布に従っているかを調べる手法3種
  • Excelデータ分析
    「相関係数」を正しく理解しよう

タグ

YouTube 機械学習 自然言語処理

スポンサーリンク

Copyright © データサイエンス情報局 All Rights Reserved.  [プライバシー ポリシー]

MENU

サイト内検索

カテゴリ

  • データの分析
  • AI(人工知能)
    • 機械学習
  • データ操作入門
    • Python入門
  • データサイエンス
    • データ分析・AIの性能
    • データ分析の手法
    • データ分析ノウハウ
  • データエンジニアリング
    • Excelデータ分析
    • Pythonデータ分析
    • Python Tips
  • ビジネス
    • AIを知る
    • プロジェクト推進
  • その他