2020年3月15日 / 最終更新日 : 2020年8月5日 Takuma Nishimaki AIを知る AI開発プロジェクト/データ分析プロジェクトに必要なスキル 「データの利活用」といえば、「AIの開発」もしくは「データ分析」のいずれかになるのではないでしょうか。 前者はIT系の企業に限られるかもしれませんが、後者はシンクタンクやコンサルティングファームを始めとした殆どの企業で行 […]
2020年3月8日 / 最終更新日 : 2020年8月10日 Takuma Nishimaki テキストデータ Pythonによるテキストデータの表記揺れ対策あれこれ アンケートデータなどのテキスト情報を集計・分析する時、“表記揺れ”には非常に悩まされます。 例えば、同じ単語でも「Windows10」「Windows10」「WINDOWS10」「Windows- […]
2020年2月2日 / 最終更新日 : 2020年8月5日 Takuma Nishimaki 機械学習 ナイーブベイズ分類器の仕組み ナイーブベイズ(単純ベイズ)とは、あるデータがどのカテゴリに属するかを確率的に求める機械学習のひとつです。 特にナイーブベイズが多用されるのはテキスト分類で、例えばメールの文面がスパムか、スパムでないかを推定する「ベイジ […]
2020年1月25日 / 最終更新日 : 2020年8月5日 Takuma Nishimaki データフレーム はじめてのPythonによるDataFrame処理 データ分析するためのツールの代表といえばExcelですが、複雑な処理をしたい場合にはExcelでは難しくなってきます。 そんな時はPythonの出番です。Pythonでのデータ操作を使いこなせば、どんな複雑な処理であって […]
2020年1月17日 / 最終更新日 : 2020年8月5日 Takuma Nishimaki 数量データ 「t検定」を正しく理解しよう 例えば、ある会社の全社員に「あなたにとってこの会社は100点中何点ですか?」というアンケートを取ったとします。 その結果、全社員の平均値が昨年60点だったのが、今年は80点に上がりました。 この結果を見ると、多くの方は社 […]
2020年1月16日 / 最終更新日 : 2020年4月8日 Takuma Nishimaki 数量データ 「分散」「標準偏差」を正しく理解しよう データ分析や統計学を学ぶと、「分散」や「標準偏差」という言葉は極めて序盤に出てきます。 なんとなく、「データのばらつき具合の指標」であることは分かっているですが、解釈が分かりづらいためか、実際にこれらの指標が用いられてい […]
2020年1月15日 / 最終更新日 : 2020年8月5日 Takuma Nishimaki 数量データ 「相関係数」を正しく理解しよう 「相関」とは、ある2つのデータが互いにどれほど影響を及ぼしているかを表す指標です。 例えば、ある売店において、「入り口から陳列棚までの距離」と「その商品の売上数」に相関関係があることが分かったとします。 そうすると、売り […]
2020年1月13日 / 最終更新日 : 2020年8月10日 Takuma Nishimaki 機械学習 YouTubeで学ぶPython機械学習入門 Pythonで様々な機械学習の手法の実行方法を学びましょう。 チャンネル登録 動画紹介 #1:次元削減 初めは教師なし学習の手法から。 まずは、データの情報をなるべく損なわないように変数の数を現象させる「次元削減」です。 […]
2020年1月12日 / 最終更新日 : 2020年8月9日 Takuma Nishimaki 数量データ YouTubeで学ぶデータ分析入門 様々な統計解析・データ分析の手法を学び、Excelでいつでも実行できるようになりましょう。 チャンネル登録 動画紹介 #1:t検定 2つのグループの結果に「差」があるのか、統計学的に調べる「t検定」です。 実行は簡単です […]
2020年1月9日 / 最終更新日 : 2020年8月8日 Takuma Nishimaki 数量データ YouTubeで学ぶPythonグラフ作成入門 seabornを用いたグラフ作成方法を動画で学びましょう。 seabornを使いこなせれば、Excelでは描けないようなお洒落で分かりやすいグラフも書くことができます。 チャンネル登録 動画紹介 #1:折れ線グラフ まず […]