2020年4月29日 / 最終更新日 : 2021年1月23日 Takuma Nishimaki データ分析・AIの性能 「特徴量エンジニアリング」でAIの性能を上げよう 機械学習を用いて「何かを予測するAI」を作成する時、その「予測精度」は非常に重要になります。 同じAIでも、70%当てるものと90%当てるものでは、その価値は大違いでしょう。 たとえ目的が同じであっても、「AIの作り方」 […]
2019年12月25日 / 最終更新日 : 2021年2月20日 Takuma Nishimaki データ分析・AIの性能 適切な誤差指標の選び方 何かしらで行った数値の「予測」と、「正解」がどれほど離れているかを評価したい時があります。 例えば、あるサッカーチームの向こう10回の試合結果を2人で予測し合って、どちらの予想が近かったかで勝負するとします。 予測が3点 […]
2019年11月3日 / 最終更新日 : 2021年2月20日 Takuma Nishimaki データ分析・AIの性能 「平均適合率」と「MAP」の意味 予測された「ランキング」がどれだけ正解に近いかを評価したい事があります。 例えば、Googleのような文章検索システム。 例えば「人工知能 仕組み」という言葉で検索したとすると、関連するホームページが上位に大量に出てきま […]
2018年12月30日 / 最終更新日 : 2021年1月23日 Takuma Nishimaki データ分析・AIの性能 多クラス混同行列とその評価指標〜マクロ平均、マイクロ平均〜 多クラス分類における混同行列と、その性能評価指標について整理します。 2クラス分類とは、ある動物の画像が「ネコか、ネコ以外か」に分類するような2択問題を解くもの。 それに対し、多クラス分類とは、ある動物の画像が「一体何の […]
2018年12月8日 / 最終更新日 : 2021年1月23日 Takuma Nishimaki データ分析・AIの性能 2クラス混同行列とその評価指標〜再現率、適合率、F値、など〜 AIの精度評価をする時や、データ集計の際にによく用いられる混同行列(Confusion matrix)についてです。 また、そこから計算される色々な性能指標についても整理します。 (よく間違われますが、「混合行列」ではな […]