FPR(偽陽性率)vs FDR(偽発見率)


20

次の引用は、Story&Tibshirani(2003)による有名な研究論文「ゲノム全体の研究の統計的有意性」から引用されています。

たとえば、偽陽性率が5%の場合、研究の真にヌルの特徴の平均5%が有意と呼ばれます。5%のFDR(False Discovery rate)は、重要と呼ばれるすべての機能の中で、これらの5%が平均して本当にヌルであることを意味します。

簡単な数値または視覚的な例を使用して、それが意味することを誰かが説明できますか?私はそれが何を意味するのか理解するのに苦労しています。FDRまたはFPRのみに関するさまざまな投稿を見つけましたが、特定の比較が行われた場所は見つかりませんでした。

この分野の専門家が、一方が他方より優れている、または両方が良いか悪いかの状況を説明できれば、特に良いでしょう。


3
@mktの回答に賞金が贈られました、Naseer。その答えがあなたのためにあなたの質問を解決した場合、報奨金インジケーターの下の左にあるチェックマークをクリックすることでそれを受け入れることもできます。
GUNG -復活モニカ

回答:


29

これらを理解するのに役立ったので、これらをいくつかの異なる方法で説明します。

具体例を見てみましょう。あなたは人々のグループで病気のテストをしています。次に、いくつかの用語を定義しましょう。以下のそれぞれについて、テストされた個人を指します。

真陽性(TP):病気にかかっており、病気にかかっていることが確認されている

偽陽性(FP):病気ではない、病気であると特定されている

真陰性(TN):病気ではない、病気ではないと特定された

偽陰性(FN):病気にかかっており、病気にかかっていないことが確認されている

視覚的には、これは通常、混同マトリックスを使用して示されます。

ここに画像の説明を入力してください

偽陽性率(FPR)が病気を持っていませんが、病気(すべてのFP)、有するものとして同定されている人の数である疾患を持っていない人の合計数で割っを(含んすべてのFPおよびTNS) 。

FPR=FPFP+TN

偽発見率(FDR)が病気を持っていませんが、病気(すべてのFP)を有するものとして同定されている人々の数、ある疾患を有すると同定されている人の合計数で割った(すべてのFPとのTPを含み)。

FDR=FPFP+TP


それで、違いは分母にあります。つまり、偽陽性の数を何と比較していますか?

FPRはあなたに疾患を有すると同定される疾患を持たないすべての人々の割合を語っています。

FDRは、あなたの病気を持っていない疾患を有すると識別されたすべての人々の割合を語っています。

したがって、どちらも障害の有用で明確な指標です。状況、TP、FP、TN、およびFNの割合に応じて、一方が他方よりも重要になる場合があります。


これにいくつかの数字を付けましょう。あなたは病気について100人を測定しました、そして、あなたは以下を得ます:

真陽性(TP):12

誤検知(FP):4

トゥルーネガ(TN):76

偽陰性(FN):8

混同マトリックスを使用してこれを表示するには:

ここに画像の説明を入力してください

その後、

FPR=FPFP+TN=44+76=480=0.05=5

FDR=FPFP+TP=44+12=416=0.25=25

言い換えると、

FPRによると、病気にかかっていない人の5%が病気にかかっていると特定されています。FDRによると、この病気にかかっていると特定された人の25%は実際に病気にかかっていません。


@amoebaのコメントに基づく編集(上記の例の数字も):

n

[サイドノート:ウィキペディアは、FPRはタイプIのエラー率と数学的に同等ですが、一方は通常アプリオリに設定され、他方は後でテストのパフォーマンスを測定するために通常使用されるため、概念的に異なると見なされます これは重要ですが、ここでは説明しません。


そしてもう少し完全にするために:

明らかに、FPRとFDRは、混同マトリックスの4つの量で計算できる唯一の関連指標ではありません。さまざまなコンテキスト役立つ可能性のある多くのメトリックのうち、遭遇する可能性のある2つの比較的一般的なメトリックは次のとおりです。

真陽性率(TPR)は、感度とも呼ばれ、病気にかかっていると特定された病気にかかっている人の割合です。

TPR=TPTP+FN

真陰性率(TNR)は、特異性とも呼ばれ、病気にかかっていないと特定された病気にかかっていない人の割合です。

TNR=TNTN+FP


3
+1。数値例を調整してFPR = 5%にすることは、p <0.05を基準として使用する場合に得られるためです(テストのサイズが正しいと仮定した場合)。または、p <0.01の場合は1%。この接続を指摘することは、一部の読者にとって役立つ場合があります。
アメーバは、モニカを復活させる

1
@amoebaありがとう、これはいいアイデアです。後でそれを試みます。
mkt-モニカの復活

2

https://en.wikipedia.org/wiki/Confusion_matrixの表を調べる必要があります。FDRは水平に、FPRは垂直に配置されていることに注意してください。

  • 帰無仮説が真であるが拒否した場合、FPが発生します
  • 何か重要なことを予測するとFDが起こるが、すべきではない

私はそれを知っていますが、非常に興味深い数字をサポートするためにいくつかの数字と視覚化でその概念を説明するのを手伝うことができるかどうかのような比較に特に興味があります。
李慕
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.