信号検出理論から導出されたメトリックを使用せずに信号検出データを分析することは有効ですか?


14

信号検出実験では、通常、観測者(または診断システム)に信号または非信号を提示し、観測者は提示されたアイテムが信号であるか非信号であるかを報告するよう求められます。このような実験では、2x2行列を満たすデータが生成されます。 代替テキスト

信号検出理論は、「信号/非信号」の決定が、信号試行が一般に非信号試行よりも高い値を持つ連続性の信号性に基づいているシナリオを表すようなデータを表します。 「シグナル」を報告する基準値を選択します。

代替テキスト

上の図では、緑と赤の分布はそれぞれ「信号」と「非信号」の分布を表し、灰色の線は特定の観測者が選択した基準を表しています。灰色の線の右側の緑の曲線の下の領域はヒットを表し、赤の曲線の下の領域は誤報を表します。灰色の線の左側の緑の曲線の下の領域はミスを表し、赤の曲線の下の領域は正しい拒否を表します。

想像できるように、このモデルによれば、上記の2x2テーブルの各セルに分類される応答の割合は、次のように決定されます。

  1. 緑と赤の分布からサンプリングされた試行の相対的な割合(基本レート)
  2. オブザーバーが選択した基準
  3. 分布間の分離
  4. 各分布の分散
  5. 分布間の分散の等価性からの逸脱(分散の等価性は上に描かれています)
  6. 各分布の形状(両方とも上記のガウス分布)

多くの場合、#5と#6の影響は、オブザーバーにいくつかの異なる基準レベルで決定を下すことによってのみ評価できるため、現時点では無視します。さらに、#3と#4は相互にのみ意味を持ち(例えば、分布の変動性に対する分離の大きさ)、「識別可能性」(d 'としても知られる)の尺度によって要約されます。したがって、信号検出理論は、信号検出データからの2つの特性、つまり基準と識別可能性の推定を禁止しています。

しかし、研究レポート(特に医療分野)が信号検出フレームワークを適用せず、代わりに「陽性的中率」、「陰性的中率」、「感度」、「特異性」などの量を分析しようとすることに気づきました。これらはすべて、上記の2x2の表とは異なる限界値を表しています(詳細については、こちらをご覧ください)。

これらの限界プロパティはどのようなユーティリティを提供しますか?私の傾向は、それらが基準と識別可能性の理論的に独立した影響を混乱させるので、それらを完全に無視することですが、おそらく彼らの利益を考慮するための想像力を欠いています。


基準をどのように推定できますか?ある医師の診断基準、例えば慢性疲労症候群は他の医師とはかなり異なるかもしれませんが、あなたが推定できるようなものだとは思いません。
ワンストップ

質問とは何の関係もありません。テキストに関するナイーブな質問です:):「分布間の分離」をどのように定義しますか?分布がガウス分布でない場合はどうなりますか?総変動距離について聞いたことがありますか?
ロビンギラード

回答:


3

ポジティブ予測的影響(PPV)は、両方のメカニズム(識別可能性と応答バイアス)を混乱させるだけでなく、アイテムの基本レートも理由で、良い尺度ではありません。P(signal | "yes")のような、アイテムの基本レートを考慮した事後確率を使用することが望ましいです。

Psgnal|yes=PsgnalPHtPsgnalPHt+PnosePFalseAlarm

しかし...それは何のために良いですか?まあ、特定の結果の確率を最大化/最小化するために、応答基準を調整するのに役立ちます。したがって、応答バイアスの変化の結果を要約するのに役立つという意味で、感度と応答バイアスの測定値を補完します。

アドバイス:基本的にd 'のような感度測定値しか取得できない2x2の結果マトリックスに固執している場合は、SDTに煩わされることなく、Hits-Falseアラームを使用するだけです。両方の測定値(d 'および(HF))の相関は.96です(BS検出理論者が何を考え出そうとも関係ありません)

これが元気づけることを願っています


(2x2の結果マトリックスではなく)どのような拡張された結果の尺度を念頭に置いていましたか?また、d 'とHit Rate-False Alarm Rateの相関関係に関する最後の主張のソースを提供できますか?
スペルドーサ

2

「既知の有病率と検査基準が与えられた場合、陽性の検査結果が正しい確率はどのくらいですか?」「このタイプのさまざまな信号に対する未知のシステムの感度とバイアスは何ですか?」

この2つは似たような理論を使用しているように思えますが、実際には非常に異なる目的を持っています。医療検査の基準は無関係です。多くの場合、既知の値に設定できます。したがって、その後、テストの基準を決定することは無意味です。信号検出理論は、基準が不明なシステムに最適です。さらに、有病率、またはシグナルは、固定値(および非常に小さい値)になる傾向があります。SDTを使用すると、いくつかの単純な記述子として非常に複雑な状況をモデル化するさまざまな信号の平均d 'を計算することがよくあります。基準と信号の両方が既知の量に固定されている場合、SDTは興味深いことを教えてくれますか?基本的に単純な問題に対処するには、多くの数学的な洗練が必要です。


2

これは単純化しすぎかもしれませんが、特異性と感度はパフォーマンスの尺度であり、信号の性質に関する客観的な知識がない場合に使用されます。密度と信号強度のプロットは、信号強度を定量化する変数を1つ想定していることを意味します。非常に高次元または無限次元のデータで、信号の生成メカニズムの厳密で証明可能な理論がない場合、変数の選択は重要です。このような変数を選択した後、信号と非信号の平均や分散などの統計的特性が定量化されないのはなぜかという疑問が生じます。多くの場合、変数は単なる正規分布、ポアソン分布、指数分布ではありません。ノンパラメトリックである場合もあります。その場合、分散などの平均差として分離を定量化します。あまり意味がありません。また、生物医学分野の多くの文献はアプリケーションに焦点を当てており、ROC、特異性感度などは、問題の限られた性質の観点からアプローチを比較するための客観的な基準として使用できます。必要とされている。時々、人々は、病気の被験者と対照の被験者における遺伝子1対遺伝子2転写産物の比率の実際の個別バージョンの対数ガンマ分布を説明することに興味がないかもしれません。それが説明する病気の表現型または確率。問題の限られた性質の観点からアプローチを比較するための客観的な基準として使用することができ、基本的にはそれだけが必要です。時々、人々は、病気の被験者と対照の被験者における遺伝子1対遺伝子2転写産物の比率の実際の個別バージョンの対数ガンマ分布を説明することに興味がないかもしれません。それが説明する病気の表現型または確率。問題の限られた性質の観点からアプローチを比較するための客観的な基準として使用することができ、基本的にはそれだけが必要です。時々、人々は、病気の被験者と対照の被験者における遺伝子1対遺伝子2転写産物の比率の実際の個別バージョンの対数ガンマ分布を説明することに興味がないかもしれません。それが説明する病気の表現型または確率。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.