真陽性、偽陰性の割合を考えて、偽陽性、真陰性を計算できますか?


回答:


53

この分野ではかなりの用語の混乱があります。個人的には、これについて考えるために混同マトリックスに戻ることは常に有用だと思います。分類/スクリーニングテストでは、次の4つの状況があります。

                      Condition: A        Not A

  Test says “A”       True positive   |   False positive
                      ----------------------------------
  Test says “Not A”   False negative  |    True negative

この表では、「真陽性」、「偽陰性」、「偽陽性」、および「真陰性」がイベント(またはその確率)です。したがって、あなたが持っているのは、おそらく真の陽性と偽陰性です。両方の数値に分子と分母があることを強調しているため、区別が重要です。

少し混乱するのは、分母が異なる「偽陽性率」と「偽陰性率」の定義がいくつかあることです。

たとえば、ウィキペディアには次の定義があります(かなり標準的なようです):

  • 真の陽性率(または感度):TPR=TP/TP+FN
  • 偽陽性率:FPR=FP/FP+TN
  • 真の陰性率(または特異性):TNR=TN/FP+TN

すべての場合において、分母は列の合計です。また、これは彼らの解釈の手がかりを与えます:真の陽性率は、実際の値が実際にAであるときにテストが「A」と言う確率です(つまり、Aが真であるという条件付き確率です)。これは、「A」を呼び出すときに正しい可能性がどれほど高いかを示しませ(つまり、テスト結果が「A」であることを条件とする真の陽性の確率)。

偽陰性率が同じ方法で定義されていると仮定すると、ます(数値はこれと一致していることに注意してください)。ただし、特異性、つまり「not A」が正解である場合のテストの動作に関する情報を提供しないため、真陽性率または偽陰性率から偽陽性率を直接導出することはできません。したがって、混同マトリックスの右側の列に情報がないため、質問への答えは「いいえ、できません」となります。FNR=1TPR

しかし、文献には他の定義があります。たとえば、Fleiss(レートと比率の統計的手法)は以下を提供します。

  • 「[…]偽陽性率[…]は、実際に病気にかかっていない人のうち、肯定的に反応した人の割合です。」
  • 「偽陰性率[…]は、検査で陰性と答えた人のうち、それでも病気にかかっている人の割合です。」

(彼は以前の定義も認めているが、それらは「貴重な用語の無駄だ」と考えている。正確にそれらが感度と特異性と直接的な関係を持っているからだ。)

混同マトリックスを参照すると、およびため、分母は行の合計になります。重要なことに、これらの定義の下では、テストの感度と特異性から偽陽性率と偽陰性率を直接導出することはできません。また、有病率(つまり、対象の母集団におけるAの頻度)を知る必要もあります。FPR=FP/TP+FPFNR=FN/TN+FN

フライスは「真の陰性率」または「真の陽性率」というフレーズを使用または定義していませんが、特定のテスト結果/分類が与えられた条件付き確率であると仮定した場合、@ guill11aumeの答えは正しいものです。

いずれにせよ、あなたの質問に対する議論の余地のない答えがないため、定義に注意する必要があります。


4
とても良い(+1)。私はすぐに1つの解釈に飛びつきましたが、代替定義が標準であることは絶対に正しいです。
gui11aume

1
@ gui11aume。ありがとう!それは私の気持ちでしたが、それについて考えると、私はもうよくわかりません。参考文献を見ると、分野に依存する可能性があります(機械学習と医療検査)。
ガラ

私の経験では、後者の定義であるTPR = TP /(TP + FP)、FPR = FP /(TP + FP)がより標準的です。
トラベリング

1
ここでは相違点の出版物があります: link.springer.com/article/10.1007/s10899-006-9025-5#enumerationの 注意新しい用語「テストFPR」対「予測FPR」
travelingbones

8

編集:より正確なGaëlLauransの答えを参照してください。

真の陽性率が0.25の場合、陽性を呼ぶたびに、間違っている可能性が0.75あることを意味します。これは誤検知率です。同様に、ネガティブを呼び出すたびに、0.25が正しい確率があり、これが真のネガティブレートです。


特徴づけようとしているものに依存します。前もって真実を知ることに関する設定でのテスト、または手元に結果が与えられた後のテスト後確率の決定を試みることです。
kd4ttc

3

「ポジティブ」と「ネガティブ」が目前の問題に対して意味をなさない場合、これが意味をなす場合はなし。「正」と「負」が順序変数または連続変数の任意の強制選択であるという問題を多く見ます。FP、TP、sens、specは、オールオアナッシング現象にのみ有用です。


弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.