2020年2月2日 / 最終更新日 : 2024年7月16日 Takuma Nishimaki 学習用記事 ナイーブベイズ分類器の仕組み ナイーブベイズ(単純ベイズ)とは、あるデータがどのカテゴリに属するかを確率的に求める機械学習のひとつです。 特にナイーブベイズが多用されるのはテキスト分類で、例えばメールの文面がスパムか、スパムでないかを推定する「ベイジ […]
2020年1月17日 / 最終更新日 : 2024年7月16日 Takuma Nishimaki 学習用記事 「t検定」を正しく理解しよう 例えば、ある会社の全社員に「あなたにとってこの会社は100点中何点ですか?」というアンケートを取ったとします。 その結果、全社員の平均値が昨年60点だったのが、今年は80点に上がりました。 この結果を見ると、多くの方は社 […]
2019年12月25日 / 最終更新日 : 2024年7月16日 Takuma Nishimaki 学習用記事 適切な誤差指標の選び方 何かしらで行った数値の「予測」と、「正解」がどれほど離れているかを評価したい時があります。 例えば、あるサッカーチームの向こう10回の試合結果を2人で予測し合って、どちらの予想が近かったかで勝負するとします。 予測が3点 […]
2019年2月9日 / 最終更新日 : 2024年7月16日 Takuma Nishimaki 読み物 適切な近似曲線を選んでいますか? 以下は2004年〜2018年の日本にある公衆電話台数の推移を表したグラフです。 (※参考:総務省HP) さて、この情報を元に、5年後(2023年)の、日本にある公衆電話の台数を予測してみましょう。 そのために、このグラフ […]
2018年12月30日 / 最終更新日 : 2024年7月16日 Takuma Nishimaki 学習用記事 多クラス混同行列とその評価指標〜マクロ平均、マイクロ平均〜 多クラス分類における混同行列と、その性能評価指標について整理します。 2クラス分類とは、ある動物の画像が「ネコか、ネコ以外か」に分類するような2択問題を解くもの。 それに対し、多クラス分類とは、ある動物の画像が「一体何の […]
2018年12月8日 / 最終更新日 : 2024年7月16日 Takuma Nishimaki 学習用記事 2クラス混同行列とその評価指標〜再現率、適合率、F値、など〜 AIの精度評価をする時や、データ集計の際にによく用いられる混同行列(Confusion matrix)についてです。 また、そこから計算される色々な性能指標についても整理します。 (よく間違われますが、「混合行列」ではな […]