Statistics.comは間違った答えを公開しましたか?


28

Statistics.comは今週の問題を発表しました: 住宅保険詐欺の率は10%です(10件の請求のうち1件が不正です)。コンサルタントは、機械学習システムを提案して、クレームをレビューし、それらを詐欺または詐欺に分類しました。このシステムは、不正請求の検出には90%の効果がありますが、詐欺ではない請求を正しく分類するには80%しか効果がありません(誤って5分の1を「詐欺」と分類します)。システムがクレームを不正と分類する場合、実際に不正である可能性はどのくらいですか?

https://www.statistics.com/news/231/192/Conditional-Probability/?showtemplate=true

私の同僚と私は両方とも独立して同じ答えを思いつきましたが、公開されているソリューションとは一致しません。

私たちのソリューション:

(.9 * .1)/((。9 * .1)+(。2 * .9))= 1/3

彼らの解決策:

これは条件付き確率の問題です。(これはベイジアンの問題でもありますが、ベイズ規則に式を適用すると、何が起こっているのかわかりにくくなります。)100件のクレームを検討してください。10は不正であり、システムはそれらのうち9を正しく「詐欺」とラベル付けします。不正であるが、実際に不正であるのはそのうちの9%(11%)のみです。

誰が正しかった


4
彼らはあなたの計算したものと一致するように彼らのウェブサイト上の解決策を修正したように見える
いいえ、

2
@nope、静かに答えを修正しました。卑劣な
Aksakal

雑学:行動に関する意思決定では、この問題はしばしば「マンモグラム問題」と呼ばれます。なぜなら、通常の症状は、陽性マンモグラムを与えられたがん患者の可能性に関するものだからです。
Kodiologist

「良いニュースは、システムが詐欺の90%を詐欺として分類することです。悪いニュースは、非詐欺の80%を詐欺として分類することです。」彼らが計算する11%は、10%の基本レートよりもわずかに高いだけです。フラグ付きケースの不正率が基本率よりも10%だけ高い機械学習モデルは、非常にひどいものです。
累積

回答:


41

あなたとあなたの同僚は正しいと思います。Statistics.comには正しい考え方がありますが、簡単な間違いを犯します。90件の「OK」クレームのうち、20%が80%ではなく不正として誤って分類されると予想されます。90の20%は18であり、正確に特定された9つのクレームと18の誤ったクレームにつながり、1/3の比率で、まさにベイズの規則がもたらします。


11

あなたは正しいです。ウェブサイトが投稿した解決策は、詐欺でないクレームの80%が与えられた20%ではなく詐欺として分類されるという問題の誤読に基づいています。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.