サイトアイコン データサイエンス情報局

犯罪者の70%以上が食べた食べ物って?

突然ですがクイズです。

以下の食べ物は何でしょうか?
・心筋梗塞で亡くなった日本人の95%以上がこの食べ物を食べていた。
・犯罪者の70%以上は、この食べ物を食べてから24時間以内に犯罪を犯している。
・江戸時代、明治時代はこの食べ物が原因でたびたび暴動が発生していた。

さて、こんな恐ろしい食べ物があるのでしょうか。
少々、考えてみてください。

・・・さて、正解発表です。

この問題の正解は、「ご飯」です。
確かに、言われてみれば上記の条件を全て満たしているように思いますね。全くウソではありません。

そもそも「ご飯」という食べ物は健康or不健康、犯罪経験の有無など関係なく、そもそも多くの日本人が食べているものです。

「心筋梗塞で亡くなった日本人の95%以上がこの食べ物を食べていた。」
・・・「ただ他の理由で亡くなった方も、95%以上食べてるけどね!」という訳です。
しかし問題文だけ見ると、「そんな危険な食べ物があるの?!」・・・と感じてしまいますね。

この事例は有名な統計のトリックのひとつです。
データ分析の結果は良く見せようと思えば幾らでも良く見せられるし、逆に悪く見せようと思えば幾らでも悪く見せられます。

ここまで極端ではないにせよ、データ分析で色々と得られた結果から都合の良い結果だけ並べるというのはどこでも日常的に行われてしまっている事です。
通信販売やセミナーなんかの集客でも当たり前の話ですね。その商品や講師の悪いところを書き並べるわけにはいきませんので。
こういったトリックはブランディングの立派な「作戦」のひとつとも言えます。
・・・ただ、そういうデータばっかり出す人や会社の信頼は失われる可能性はありますのでご注意ください(笑)

しかし、日常的な課題解決のためのデータ分析において、こういった事があってはいけません。
真実をねじ曲げて伝わることのないようにしましょう。

冒頭の「ご飯」の例で言えば、例えば「心筋梗塞で亡くなった人」と「他の病気で亡くなった人」のそれぞれの被験者について、生前ご飯を常食していたか、していなかったかを集計します。
そして、そのデータをカイ二乗検定などで有意差が出ているかをきちんと見ることが正しい分析方法となります。

こういった統計のトリックは「使わない」「騙されない」という姿勢を常に持ってデータ分析を行いましょう。

※この記事は以下の書籍を参考にさせて頂きました。

モバイルバージョンを終了