2020年2月2日 / 最終更新日 : 2024年9月17日 Takuma Nishimaki 学習用記事 ナイーブベイズ分類器の仕組み ナイーブベイズ(単純ベイズ)とは、あるデータがどのカテゴリに属するかを確率的に求める機械学習のひとつです。 特にナイーブベイズが多用されるのはテキスト分類で、例えばメールの文面がスパムか、スパムでないかを推定する「ベイジ […]
2020年1月25日 / 最終更新日 : 2024年6月16日 Takuma Nishimaki 学習用記事 はじめてのPythonによるDataFrame処理 データ分析するためのツールの代表といえばExcelですが、複雑な処理をしたい場合にはExcelでは難しくなってきます。 そんな時はPythonの出番です。Pythonでのデータ操作を使いこなせば、どんな複雑な処理であって […]
2020年1月17日 / 最終更新日 : 2024年7月16日 Takuma Nishimaki 学習用記事 「t検定」を正しく理解しよう 例えば、ある会社の全社員に「あなたにとってこの会社は100点中何点ですか?」というアンケートを取ったとします。 その結果、全社員の平均値が昨年60点だったのが、今年は80点に上がりました。 この結果を見ると、多くの方は社 […]
2020年1月16日 / 最終更新日 : 2024年6月16日 Takuma Nishimaki 学習用記事 「分散」「標準偏差」を正しく理解しよう データ分析や統計学を学ぶと、「分散」や「標準偏差」という言葉は極めて序盤に出てきます。 なんとなく、「データのばらつき具合の指標」であることは分かっているですが、解釈が分かりづらいためか、実際にこれらの指標が用いられてい […]
2020年1月15日 / 最終更新日 : 2024年6月16日 Takuma Nishimaki 学習用記事 「相関係数」を正しく理解しよう 「相関」とは、ある2つのデータが互いにどれほど影響を及ぼしているかを表す指標です。 例えば、ある売店において、「入り口から陳列棚までの距離」と「その商品の売上数」に相関関係があることが分かったとします。 そうすると、売り […]
2019年12月29日 / 最終更新日 : 2024年9月17日 Takuma Nishimaki 学習用記事 Pythonで化学式を構成元素に分解する Pythonを用いて、化学式(組成式)を構成元素とその数に分割する方法です。 例えば、「C16H10ClN3」というように記載された化学式を、{C:16,H:10,Cl:1,N:3}という辞書データに分解することをゴール […]
2019年12月29日 / 最終更新日 : 2024年6月16日 Takuma Nishimaki 学習用記事 「クラスタリング」とは何に使える?どんな手法がある? 様々あるデータ分析手法の中でも非常に活躍の機会が多い「クラスタリング」ですが、一体クラスタリングとは何なのでしょうか? 一概に「クラスタリング」と言っても、その手法は様々です。 それらの意味をきちんと理解して使わなければ […]
2019年12月25日 / 最終更新日 : 2024年9月17日 Takuma Nishimaki 学習用記事 適切な誤差指標の選び方 何かしらで行った数値の「予測」と、「正解」がどれほど離れているかを評価したい時があります。 例えば、あるサッカーチームの向こう10回の試合結果を2人で予測し合って、どちらの予想が近かったかで勝負するとします。 予測が3点 […]
2019年12月7日 / 最終更新日 : 2024年6月16日 Takuma Nishimaki 学習用記事 Pythonで相関係数を求めて可視化する方法 相関分析をPythonで実行し、可視化まで行ってみます。 Excelでも相関分析は可能ですが、Pythonで実行すれば一度に全データの分布の傾向が一気に見れたり、視覚的に美しい図を作成したりと、ハイレベルな分析が簡単にで […]
2019年11月30日 / 最終更新日 : 2024年6月16日 Takuma Nishimaki 学習用記事 Pythonによる日付・時刻の計算 Pythonによる日付や時刻の計算方法を整理しました。 現在時刻の取得 まずはdatetimeライブラリをインポートします。 現在日時の取得は簡単で、nowメソッドを呼び出します。 [crayon-673f18aead3 […]