これらを理解するのに役立ったので、これらをいくつかの異なる方法で説明します。
具体例を見てみましょう。あなたは人々のグループで病気のテストをしています。次に、いくつかの用語を定義しましょう。以下のそれぞれについて、テストされた個人を指します。
真陽性(TP):病気にかかっており、病気にかかっていることが確認されている
偽陽性(FP):病気ではない、病気であると特定されている
真陰性(TN):病気ではない、病気ではないと特定された
偽陰性(FN):病気にかかっており、病気にかかっていないことが確認されている
視覚的には、これは通常、混同マトリックスを使用して示されます。
偽陽性率(FPR)が病気を持っていませんが、病気(すべてのFP)、有するものとして同定されている人の数である疾患を持っていない人の合計数で割っを(含んすべてのFPおよびTNS) 。
FPR = FPFP+ TN
偽発見率(FDR)が病気を持っていませんが、病気(すべてのFP)を有するものとして同定されている人々の数、ある疾患を有すると同定されている人の合計数で割った(すべてのFPとのTPを含み)。
FD R = FPFP+ TP
それで、違いは分母にあります。つまり、偽陽性の数を何と比較していますか?
FPRはあなたに疾患を有すると同定される疾患を持たないすべての人々の割合を語っています。
FDRは、あなたの病気を持っていない疾患を有すると識別されたすべての人々の割合を語っています。
したがって、どちらも障害の有用で明確な指標です。状況、TP、FP、TN、およびFNの割合に応じて、一方が他方よりも重要になる場合があります。
これにいくつかの数字を付けましょう。あなたは病気について100人を測定しました、そして、あなたは以下を得ます:
真陽性(TP):12
誤検知(FP):4
トゥルーネガ(TN):76
偽陰性(FN):8
混同マトリックスを使用してこれを表示するには:
その後、
FPR = FPFP+ TN= 44 + 76= 480= 0.05 = 5 %
FD R = FPFP+ TP= 44 + 12= 416= 0.25 = 25 %
言い換えると、
FPRによると、病気にかかっていない人の5%が病気にかかっていると特定されています。FDRによると、この病気にかかっていると特定された人の25%は実際に病気にかかっていません。
@amoebaのコメントに基づく編集(上記の例の数字も):
n
[サイドノート:ウィキペディアは、FPRはタイプIのエラー率と数学的に同等ですが、一方は通常アプリオリに設定され、他方は後でテストのパフォーマンスを測定するために通常使用されるため、概念的に異なると見なされます これは重要ですが、ここでは説明しません。
そしてもう少し完全にするために:
明らかに、FPRとFDRは、混同マトリックスの4つの量で計算できる唯一の関連指標ではありません。さまざまなコンテキストで役立つ可能性のある多くのメトリックのうち、遭遇する可能性のある2つの比較的一般的なメトリックは次のとおりです。
真陽性率(TPR)は、感度とも呼ばれ、病気にかかっていると特定された病気にかかっている人の割合です。
TPR = TPTP+ FN
真陰性率(TNR)は、特異性とも呼ばれ、病気にかかっていないと特定された病気にかかっていない人の割合です。
TNR = TNTN+ FP