信号検出実験では、通常、観測者(または診断システム)に信号または非信号を提示し、観測者は提示されたアイテムが信号であるか非信号であるかを報告するよう求められます。このような実験では、2x2行列を満たすデータが生成されます。
信号検出理論は、「信号/非信号」の決定が、信号試行が一般に非信号試行よりも高い値を持つ連続性の信号性に基づいているシナリオを表すようなデータを表します。 「シグナル」を報告する基準値を選択します。
上の図では、緑と赤の分布はそれぞれ「信号」と「非信号」の分布を表し、灰色の線は特定の観測者が選択した基準を表しています。灰色の線の右側の緑の曲線の下の領域はヒットを表し、赤の曲線の下の領域は誤報を表します。灰色の線の左側の緑の曲線の下の領域はミスを表し、赤の曲線の下の領域は正しい拒否を表します。
想像できるように、このモデルによれば、上記の2x2テーブルの各セルに分類される応答の割合は、次のように決定されます。
- 緑と赤の分布からサンプリングされた試行の相対的な割合(基本レート)
- オブザーバーが選択した基準
- 分布間の分離
- 各分布の分散
- 分布間の分散の等価性からの逸脱(分散の等価性は上に描かれています)
- 各分布の形状(両方とも上記のガウス分布)
多くの場合、#5と#6の影響は、オブザーバーにいくつかの異なる基準レベルで決定を下すことによってのみ評価できるため、現時点では無視します。さらに、#3と#4は相互にのみ意味を持ち(例えば、分布の変動性に対する分離の大きさ)、「識別可能性」(d 'としても知られる)の尺度によって要約されます。したがって、信号検出理論は、信号検出データからの2つの特性、つまり基準と識別可能性の推定を禁止しています。
しかし、研究レポート(特に医療分野)が信号検出フレームワークを適用せず、代わりに「陽性的中率」、「陰性的中率」、「感度」、「特異性」などの量を分析しようとすることに気づきました。これらはすべて、上記の2x2の表とは異なる限界値を表しています(詳細については、こちらをご覧ください)。
これらの限界プロパティはどのようなユーティリティを提供しますか?私の傾向は、それらが基準と識別可能性の理論的に独立した影響を混乱させるので、それらを完全に無視することですが、おそらく彼らの利益を考慮するための想像力を欠いています。