継続的な結果のための感度と特異性の類似体


8

結果を二分することなく継続的な結果(たとえば、血圧)を予測する際の継続的な診断テストの感度と特異度(または類似の測定)を計算するにはどうすればよいですか?何か案は?

研究者は混合効果モデリング(以下のリンクを参照)を使用してこれを行ったようですが、私は彼らがこの手法を使用することに慣れていません:http : //www.ncbi.nlm.nih.gov/pmc/articles/PMC3026390/

ちなみに、私はRに最も慣れているので、R関数を伴うことを提案する実装​​には理想的です(ただし、そうでなくても問題ありません)。

提案を事前にありがとう!

回答:


1

質問はまだ答えられていないので、ここに私の2ctがあります:
この質問に2つの異なるトピックが混在していると思います:

結果を二分することなく継続的な結果(たとえば、血圧)を予測する際の継続的な診断テストの感度と特異度(または類似の測定)を計算するにはどうすればよいですか?

モデルのパフォーマンスを測定したいと思います。このモデルは、ある種の入力から継続的な(メトリック)結果を予測します(例ではメトリックになる可能性もありますが、ここでは実際には問題になりません)。これは回帰シナリオであり、分類ではありません。したがって、回帰モデルのパフォーマンス測定をより適切に探す必要があります。感度と特異度は、探しているものではありません *。
一部の回帰問題には、何かの有無に「自然な」グループ分けがあり、分類へのリンクが提供されます。そのためには、二峰性の分布がある可能性があります。多くの不在のケースと、存在のケースの値のメトリック分布です。たとえば、製品を汚染する物質について考えてみます。製品サンプルの多くには汚染物質が含まれていませんが、含まれている場合は、さまざまな濃度が観察されます。

ただし、これはあなたの血圧の例には当てはまりません(血圧がないことは、ここでは賢明な概念ではありません)。私は血圧が単峰性の分布をしているとさえ思います。これらはすべて、分類への密接なリンクがない回帰問題を示しています。

* 両方の単語が分析化学で回帰(キャリブレーション)に使用されているという警告がありますが、意味が異なります。感度は、キャリブレーション/回帰関数の傾きであり、特定の方法では、メソッドが完全に選択的であることを意味します。分析対象物以外の物質に反応せず、交差感度は発生しません。
ADマクノートとA.ウィルキンソン編:化学用語集(「ゴールドブック」)。Blackwell Scientific、1997年。ISBN:0-9678550-9-8。DOI:doi:10.1351 /ゴールドブック。URL:http://goldbook.iupac.org/

継続的な結果のための感度と特異性の類似体

一方、問題の根本的な性質が分類である場合でも、回帰によってそれをよりよく説明していることに気付くことがあります。

  • 回帰は、クラスに属する度合いを表します(ファジーセットの場合など)。
  • 回帰モデル(ロジスティックのようにクラスにbeloningの(事後)確率回帰
  • あなたのケースは純粋なクラスの混合として記述できます(「通常の」回帰に非常に近い、上記の汚染の例)

これらのケースでは、感度と特異性の背後にある概念を「継続的な結果分類子」に拡張することは理にかなっています。基本的な考え方は、問題のクラスに属する度合いに従って各ケースに重みを付けることです。参照ラベルを参照する感度と特異度、予測されたクラスメンバーシップに対する予測値。これにより、回帰タイプのパフォーマンス測定に非常に密接にリンクすることがわかります。

我々は最近でこれを説明した :C. Beleites、R.ツァーとV. Sergo
部分クラスメンバーシップを使用してソフト分類モデルの検証:Anが感度・アンド・カンパニーのコンセプトは、星細胞腫組織のグレーディングに適用される拡張
Chemom。Intell。研究室 Syst。、122(2013)、

12-22 このリンクは、提案されたパフォーマンス対策を実装するRパッケージのホームページを示しています。

この場合も、血圧の例であるIMHOは分類問題として適切に説明されていません。しかし、あなたはまだ論文を読みたいかもしれません-私はそこに参照値を定式化すると、血圧が分類に適した方法で賢明に記述されていないことが明らかになると思います。

(もしそれ自体がモデルであり、あなたが説明する問題とは異なるものである「高血圧」の継続的な程度を定式化する場合。)


リンクした論文を一目見ただけでしたが、著者が正しく理解していれば、両方のモデリング戦略にしきい値(二分法)を使用しています。連続予測はさらに処理されるため、予測間隔が計算され、いくつかのしきい値と比較されます。結局、彼らは二分予測を持ち、区間の仕様を変えることによってROCを生成します。
これを避けたいと指定した場合、その論文はあまり関連性が高いようには見えません。


その論文の方法は非常に問題があるかのように聞こえます。質問は疑わしい方法論の使用を暗示するため、元の質問は回答されませんでした。
フランクハレル2013

@FrankHarrell:はい、最終的な予測が連続的ではないため、少なくともこの論文でのメソッドの命名は誤解を招く可能性があります。しかし、私はこの論文の言及がOPが文献を調べたことを示すものとして理解し、その論文役立つかもしれないと思った-しなかった。
cbeleitesは2013

2

連続変数を使用してこれを実行しようとすると、バイナリの場合(つまり、一般的にYからXを予測する場合)でも、時間順の逆測定で深刻な問題が発生します。


逆順の時間順の測定である必要はありません。結果または従属変数が連続的である場合の感度と特異度の類似体を探しています。
itpetersen 2013

アナログは逆でなければなりません、すなわち、与えられたの分布を含みます。それ以外の場合は類似していません。YXY
フランクハレル2013

2
あなたが正しいです; あなたは正しい時間順である非常に合理的な目標を述べました。感度アナログは、出生前のテストステロン暴露を将来の攻撃性の程度から予測することです。あなたの質問に答えるために、私は一般化されたメジャー、一般化されたROC領域(予測と観測の間のソマーズランク相関)、および予測攻撃度のヒストグラムを使用します。 。D x yR2Dxy
フランクハレル2013

2
それが私が書いたもので一般化された理由です。 は一般化されたROC領域に比例し、がバイナリの場合、通常のROC領域に減少します。一致確率が感度と特異度から導き出されるのは、自然の不幸な事故です。と間のより一般的な(そして逆向きでない)一致確率を考えてみてください( -index;バイナリ場合のROC領域に等しい)。一致確率(連続について簡単に説明)またはROC領域は、ROC曲線をまったく作成せずに使用できます。過去から未来を予測する必要はありません。 Y X Y c Y YDxyYXYcYY
フランク・ハレル

2
R Hmiscrmsパッケージがこれを処理します。でHmisc参照rcorr.cens機能を。
フランクハレル2013

0

大まかに言うと、感度とは、存在する場合に何かに応答する能力を意味し、特異性とは、存在しない場合に応答を抑制する能力を意味します。連続変数の場合、感度は測定されている変数の真の値に対する取得された測定値の回帰の傾きに対応し、特異度は測定の標準誤差(つまり、測定されている量が得られたときに取得された測定値の標準偏差)に対応します。変化しません)。

編集、フランク・ハレルとcbeleitesのコメントに対応。私は感度と特異性の概念的な類似物を与えようとしていました。連続変数の場合、感度の基本的な考え方は、2つのオブジェクト(または同じオブジェクトの異なる時間または異なる条件下など)が測定しようとしている変数で異なる場合、得られる測定値も異なり、より大きな真より大きな測定された差異につながる差異。

任意の変数の回帰は、言う、他に、言う、単に条件付期待値であり、の関数として扱わ、。感度の、その関数の傾きである-すなわち、に対してその誘導体 -のどのような値で評価関心のある、そしておそらく異なる発生の相対的な重要度または頻度を反映する重みで平均化値。X EYXX Y X X X XEY|XXYXXXX

特異性の基本的な考え方は感度の逆です特異性が高く、真の違いがない場合、測定されたすべての値は、 ; はそれらの違いに対応すべきではありません。が一定の場合、値間のばらつきが大きいほど、特異度が低くなります。条件付き標準偏差-つまり、 sdは、関数として扱われますX Y X Y X Y Y | X XYXYXYXYY|XX-特異性の逆の尺度です。条件付きsdに対する条件付き勾配の比率は信号対雑音比であり、その2乗は心理測定学では情報関数と呼ばれます。


それはまったく正しく聞こえません。特異性には差異や感覚は含まれません。とスペック。バイナリ量にのみ適用されます。
フランクハレル2013

@Ray:回帰(化学的キャリブレーション)の両方の用語の意味/定義は、分類におけるそれらの意味とは非常に異なるため、これはIMHOをより強調する必要があります。しかし、私はあなたの特異性の定義について聞いたことがありません。参考にしていただけますか?
cbeleitesは2013
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.