感度または特異性は有病率の関数ですか?


10

標準的な教育では、感度と特異度はテストの特性であり、有病率とは無関係であると述べています。しかし、これは単なる仮定ではありませんか?

ハリソンの内科第19版の原則

感度と特異度は、テストの正確さの有病率に依存しないパラメーターであると長い間主張されてきました。ただし、この統計的に有用な仮定は、臨床的に単純化されています。...テストの感度は入院患者の方が高く、テストの特異性は外来患者の方が高いでしょう。

(一般的に有病率は外来患者よりも入院患者で高い)

これらのパラメーターの間に数学的またはおおよそのグラフィカルな関係はありますか?

このリンクでさえ、それを「単純化」と呼んでいます。どうして?

編集:私は感度がどのように定義されているか知っています。回答で述べられているように、有病期間は含まれていません。私自身も、これらのテストの特性は、使用されている母集団に影響されないということを主張しています。しかし、私は、この混乱はこれらの値の定義ではなく実際的な計算が原因で発生していると思います。特異性と感度は2x2の表を使用して計算されますが、参照母集団の有病率は重要ですか?彼らが言及しているのはそれですか?もしそうなら、その機能は何ですか?

回答:


4

@ Tim♦と@ gung♦の回答はほとんどすべてをカバーしていますが、両方を1つに統合して、さらに明確にすることを試みます。

引用された行のコンテキストは、最も一般的であるように、主に特定のしきい値の形で臨床試験を参照する場合があります。病気、と呼ばれる健康な状態を含む以外のすべてを想像してください。テストでは、適切な予測を取得できるプロキシ測定値を見つけたいと考えています。(1)絶対的な特異性/感度が得られない理由は、プロキシ量の値が完全に相関しないためです。病状ですが、一般的にはそれに関連しているだけなので、個々の測定では、その量がしきい値を超える可能性がありD D c D D cDDDcDDc個人とその逆。わかりやすくするために、変動性のガウスモデルを想定します。

プロキシ量としてを使用しているとしましょう。が選択されている場合、はより大きくなければなりません(は期待値演算子です)。ここで、が複合状況(同様)であり、実際には3つのグレードの重大度、、で構成され、それぞれに期待値が徐々に増加することがわかったときに問題が発生します。単一の個人の場合、カテゴリまたはから選択x E [ x D ] E [ x D c ] E D D c D 1 D 2 D 3 x D D c x T D D c x T D x D cxxE[xD]E[xDc]EDDcD1D2D3xDDcカテゴリ、「テスト」が正になる確率は、選択したしきい値によって異なります。と両方の個体を持つ真にランダムなサンプルの研究に基づいてを選択するとします。私たちのはいくつかの偽陽性と陰性を引き起こします。人物をランダムに選択した場合、緑のグラフで値を決定する確率は赤のグラフで、ランダムに選択された人物のです。xTDDcxTDxDcここに画像の説明を入力してください

得られる実際の数は、およびの実際の数に依存しますが、結果として得られる特異性と感度には依存しません。してみましょう、累積確率関数です。次に、疾患の有病率について、結合された母集団でテストが実際にどのように実行されるかを実際に見ようとすると、一般的なケースで予想される2x2の表が表示されます。D c F p DDDcF()pD

D c = 1 p 1 F D cx TD = p F Dx TD c +

(D,+)=p(1FD(xT))
(Dc,)=(1p)(1FDc(xT))
(D,)=p(FD(xT))
(Dc,+)=(1p)FDc(xT)

実際の数字はに依存しますが、感度と特異性は、独立しました。ただし、これらは両方ともおよび依存しています。したがって、これらに影響するすべての要因は、これらのメトリックを確実に変更します。たとえば、ICUで作業している場合、はに置き換えられ、外来について話している場合は置き換えられます。病院では、有病率も異なることは別の問題ですが、p F D F D c F D F D 3 F D 1 D c D c x D D c F D F D c D F FppFDFDcFDFD3FD1ただし、感度と特異度が異なるのは、有病率の違いではなく、分布の違いです。これは、しきい値が定義されたモデルが、外来患者または入院患者として現れる集団に適用できないためです。あなたは先に行くと、打破することができますの入院患者のサブパートbecasue、複数の亜集団にも上げなければならないその他の理由(ほとんどのプロキシでもあるので、他の深刻な状態では「上昇」)へ。破断のことながら、亜集団に集団は、感度の変化を説明する集団における対応する変化により(特異性の変化を説明とDcDcxDDcFDFDc)これは、複合グラフが実際に構成するものです。各色は実際には独自の持つため、これが元の感度と特異度が計算された異なる限り、これらのメトリックは変化します。DFF

ここに画像の説明を入力してください

それぞれ10000 Dc、500、750、300 D1、D2、D3の11550の母集団を想定します。コメントアウトされた部分は、上のグラフで使用されているコードです。

set.seed(12345)
dc<-rnorm(10000,mean = 9, sd = 3)
d1<-rnorm(500,mean = 15,sd=2)
d2<-rnorm(750,mean=17,sd=2)
d3<-rnorm(300,mean=20,sd=2)
d<-cbind(c(d1,d2,d3),c(rep('1',500),rep('2',750),rep('3',300)))
library(ggplot2)
#ggplot(data.frame(dc))+geom_density(aes(x=dc),alpha=0.5,fill='green')+geom_density(data=data.frame(c(d1,d2,d3)),aes(x=c(d1,d2,d3)),alpha=0.5, fill='red')+geom_vline(xintercept = 13.5,color='black',size=2)+scale_x_continuous(name='Values for x',breaks=c(mean(dc),mean(as.numeric(d[,1])),13.5),labels=c('x_dc','x_d','x_T'))

#ggplot(data.frame(d))+geom_density(aes(x=as.numeric(d[,1]),..count..,fill=d[,2]),position='stack',alpha=0.5)+xlab('x-values')

Dc、D1、D2、D3、コンポジットDなど、さまざまな母集団のx平均を簡単に計算できます。

mean(dc) 
mean(d1) 
mean(d2) 
mean(d3) 
mean(as.numeric(d[,1]))

> mean(dc) [1] 8.997931
> mean(d1) [1] 14.95559
> mean(d2) [1] 17.01523
> mean(d3) [1] 19.76903
> mean(as.numeric(d[,1])) [1] 16.88382

元のテストケースの2x2テーブルを取得するには、まずデータに基づいてしきい値を設定します(実際のケースでは、@ gungが示すようにテストを実行した後に設定されます)。とにかく、しきい値を13.5とすると、母集団全体で計算すると、次の感度と特異度が得られます。

sdc<-sample(dc,0.1*length(dc)) 
sdcomposite<-sample(c(d1,d2,d3),0.1*length(c(d1,d2,d3))) 
threshold<-13.5 
truepositive<-sum(sdcomposite>13.5) 
truenegative<-sum(sdc<=13.5) 
falsepositive<-sum(sdc>13.5) 
falsenegative<-sum(sdcomposite<=13.5) 
print(c(truepositive,truenegative,falsepositive,falsenegative)) 
sensitivity<-truepositive/length(sdcomposite) 
specificity<-truenegative/length(sdc) 
print(c(sensitivity,specificity))

> print(c(truepositive,truenegative,falsepositive,falsenegative)) [1]139 928  72  16
> print(c(sensitivity,specificity)) [1] 0.8967742 0.9280000

外来患者で作業していて、D1比率からのみ罹患患者を取得している、またはD3のみを取得しているICUで作業していると仮定します。(より一般的なケースでは、Dcコンポーネントも分割する必要があります)感度と特異度はどのように変化しますか?有病率を変更することにより(つまり、どちらの場合にも属する患者の相対的比率を変更することにより、特異性と感度はまったく変更されません。この有病率も、分布の変化に伴って変化することになります)

sdc<-sample(dc,0.1*length(dc)) 
sd1<-sample(d1,0.1*length(d1)) 
truepositive<-sum(sd1>13.5) 
truenegative<-sum(sdc<=13.5) 
falsepositive<-sum(sdc>13.5) 
falsenegative<-sum(sd1<=13.5) 
print(c(truepositive,truenegative,falsepositive,falsenegative)) 
sensitivity1<-truepositive/length(sd1) 
specificity1<-truenegative/length(sdc) 
print(c(sensitivity1,specificity1)) 
sdc<-sample(dc,0.1*length(dc)) 
sd3<-sample(d3,0.1*length(d3)) 
truepositive<-sum(sd3>13.5) 
truenegative<-sum(sdc<=13.5) 
falsepositive<-sum(sdc>13.5) 
falsenegative<-sum(sd3<=13.5) 
print(c(truepositive,truenegative,falsepositive,falsenegative)) 
sensitivity3<-truepositive/length(sd3) 
specificity3<-truenegative/length(sdc) 
print(c(sensitivity3,specificity3))

> print(c(truepositive,truenegative,falsepositive,falsenegative)) [1]  38 931  69  12
> print(c(sensitivity1,specificity1)) [1] 0.760 0.931
> print(c(truepositive,truenegative,falsepositive,falsenegative)) [1]  30 944  56   0
> print(c(sensitivity3,specificity3)) [1] 1.000 0.944

要約すると、集団の平均xを変化させて感度の変化を示すプロット(特異性は、サブ母集団からDc母集団を構成した場合も同様の傾向に従います)は、次のグラフです

df<-data.frame(V1=c(sensitivity,sensitivity1,sensitivity3),V2=c(mean(c(d1,d2,d3)),mean(d1),mean(d3))) 
ggplot(df)+geom_point(aes(x=V2,y=V1),size=2)+geom_line(aes(x=V2,y=V1))

ここに画像の説明を入力してください

  1. プロキシではない場合、技術的には100%の特異性と感度があります。たとえば、肝臓生検でを特定の客観的に定義された病理学的画像を持つと定義すると、肝臓生検テストがゴールドスタンダードになり、感度がそれ自体に対して測定されるため、100%になります。D

9

まず、通常、感度を特異性とは無関係に変更することはできず、その逆も同様であることを認識する価値があります。これがROC曲線のポイントです。データ生成プロセスの性質、および特定のデータとモデルを考えると、感度と特異性の間のトレードオフに常に悩まされることになります。もちろん、100%の感度と100%の特異性を同時に持つことを好みますが、通常はそうすることはできません。感度は高くなりますが、特異性が低下するか、特異性が向上しますが、感度が低下します。ROC曲線は、選択を余儀なくされる一連のトレードオフを示します。(2、3の注意:1.データセットにギャップがあるため、他の要素を失うことなく、1つの次元で利益を得るように見えることがありますが、これはほとんど幻想です。2。ROC曲線は、1特異度の関数としての感度です。感度と特異度の関係をプロットすると、ROC曲線が反映されます。)

ここに画像の説明を入力してください

とにかく、見かけの感度と特異性は、有病率とともにどのように変化するでしょうか?これは、いくつかのデータをシミュレーションして再生し、実際にどのように機能するかを確認するのに役立つ問題です。モデルが特定の有病率を持つかなり大きなデータセットに適合し、しきい値がx軸1に設定されているとします。その後、このテストのパフォーマンスは、有病率が大幅に異なる(したがって、x値も異なる)サンプルで計算されます。その結果、有病率の異なるデータセットに適用すると、同じしきい値を使用した同じモデルのパフォーマンスが異なります。

library(caret)  # we'll use these packages
library(binom)
  # we'll use this function to convert log odds to probabilities
lo2p = function(lo){ exp(lo)/(1+exp(lo)) }

##### training dataset for original model
set.seed(734)                     # these make the examples exactly reproducible
Nt = 1000
xt = rnorm(Nt, mean=5, sd=1)      # this is the distribution of X
lo = -1.386 + .308*xt             # this is the data generating process
pt = lo2p(lo)
yt = rbinom(Nt, size=1, prob=pt)
mt = glm(yt~xt, family=binomial)
summary(mt)
# ...
# Coefficients:
#             Estimate Std. Error z value Pr(>|z|)    
# (Intercept) -1.16736    0.32794  -3.560 0.000371 ***
# xt           0.24980    0.06429   3.886 0.000102 ***
# ...
#     Null deviance: 1384.5  on 999  degrees of freedom
# Residual deviance: 1369.1  on 998  degrees of freedom
# AIC: 1373.1

## determine threshold
# prob(Y) = 50%, where log odds = 0, so:
-coef(mt)[1]/coef(mt)[2]  # 4.673159
threshold = 4.7  # a simple round number
classt    = ifelse(xt>threshold, 1, 0)
tabt      = table(classt, yt)[2:1,2:1]

confusionMatrix(tabt)
#       yt
# classt   1   0
#      1 346 279
#      0 175 200
#                                           
#                Accuracy : 0.546           
#                     ...                                          
#             Sensitivity : 0.6641          
#             Specificity : 0.4175          
#          Pos Pred Value : 0.5536          
#          Neg Pred Value : 0.5333          
#              Prevalence : 0.5210          


##### high prevalence dataset from hospital
set.seed(4528)
Nh = 500
xh = rnorm(Nh, mean=6, sd=1)  # a different distribution of X
lo = -1.386 + .308*xh         # but the same data generating process
ph = lo2p(lo)
yh = rbinom(Nh, size=1, prob=ph)
classh = ifelse(xh>threshold, 1, 0)  # the same threshold is used
tabh   = table(classh, yh)[2:1,2:1]

confusionMatrix(tabh)
#       yh
# classh   1   0
#      1 284 163
#      0  20  33
#                                           
#                Accuracy : 0.634           
#                     ...
#             Sensitivity : 0.9342          
#             Specificity : 0.1684          
#          Pos Pred Value : 0.6353          
#          Neg Pred Value : 0.6226          
#              Prevalence : 0.6080          


##### low prevalence dataset from outpatients
set.seed(1027)
Nl = 500
xl = rnorm(Nl, mean=3, sd=1)
lo = -1.386 + .308*xl
pl = lo2p(lo)
yl = rbinom(Nl, size=1, prob=pl)
classl = ifelse(xl>threshold, 1, 0)
tabl   = table(classl, yl)[2:1,2:1]

confusionMatrix(tabl)
#       yl
# classl   1   0
#      1   9  14
#      0 190 287
#                                           
#                Accuracy : 0.592           
#                     ...
#             Sensitivity : 0.04523         
#             Specificity : 0.95349         
#          Pos Pred Value : 0.39130         
#          Neg Pred Value : 0.60168         
#              Prevalence : 0.39800         


##### sensitivities
binom.confint(346, 521, method="e")
#   method   x   n      mean     lower    upper
# 1  exact 346 521 0.6641075 0.6217484 0.704592
binom.confint(284, 304, method="e")
#   method   x   n      mean   lower     upper
# 1  exact 284 304 0.9342105 0.90022 0.9593543
binom.confint(  9, 199, method="e")
#   method x   n       mean      lower      upper
# 1  exact 9 199 0.04522613 0.02088589 0.08411464

##### specificities
binom.confint(200, 479, method="e")
#   method   x   n      mean     lower     upper
# 1  exact 200 479 0.4175365 0.3729575 0.4631398
binom.confint( 33, 196, method="e")
#   method  x   n      mean     lower     upper
# 1  exact 33 196 0.1683673 0.1188206 0.2282441
binom.confint(287, 301, method="e")
#   method   x   n      mean     lower     upper
# 1  exact 287 301 0.9534884 0.9231921 0.9743417

以下は、有病率の関数としての感度と特異度であり、正確な95%信頼区間があります。

ここに画像の説明を入力してください

ここで何が起こっているのでしょうか?典型的なロジスティック回帰が次の図のようになる場合があることを考慮してください。すべての「アクション」は、x軸の間隔[4、6]で行われていることに注意してください。その下のデータは有病率が非常に低く、モデルは差別と感度が低いことを示します。その間隔を超えるデータは有病率が非常に高くなりますが、モデルは再び十分に識別できなくなり、特異性が低くなります。

ここに画像の説明を入力してください

これがどのように起こるかを理解するのを助けるために、アラニントランスアミナーゼの検査を検討して、患者の肝臓が不全であるかどうかを決定します2。肝臓は通常ALTを使用しますが、肝臓が機能を停止した場合、ALTは血流に排出されます。したがって、患者の血流中のALTレベルが何らかのしきい値を超えている場合、それは肝臓が機能していないことを意味します。肝不全の有病率が高いサンプルを採取すると、血液中のALTレベルが高いサンプルが採取されます。したがって、しきい値を超える患者が多くなります。ALTの血中濃度が高いすべての人が肝不全になるわけではありません。一部の患者では、他の原因が考えられます。しかし、肝不全の人は捕らえられるべきです。これにより、感度が高くなります。同様に、ALTレベルが正常なすべての患者が健康な肝臓を持っているわけではありませんが、有病率の低いサンプルでは、​​ALTレベルが低くなり、より多くの患者がテストに合格します。肝臓のないもの ' t失敗しますが、ALTのレベルが正常な人は見逃されます。これにより、感度は低くなりますが、特異性は高くなります。

より一般的には、医学的検査の全体的な考えは、何か他のものは、あなたが直接測定したいかもしれないができない病気状態の相関関係であるということです。相関関係の測定値を取得すると、病状への洞察が得られます。これが当てはまらない(潜在的な)テストは、価値がなく、使用されません。したがって、実際には、有病率の高いサンプルほど、異常値と相関する分布があり、感度が高くなります。逆も同様です。(相関関係が疾患の原因である必要はないことに注意してください。ALTの例では、それは効果です。他の例では、疾患と相関関係の両方が共通の原因の影響である可能性があります。)

1.これは実際には医学ではかなり一般的です。コレステロールは200未満、収縮期血圧は140未満などと考えてください。これらは実際には「テスト」ではありませんが、同じように機能する多くのテストがあります。しきい値に関するいくつかの(おそらく遠い)関連する議論については、「0-1のしきい値は常にx軸のしきい値と同等ですか?」に対する私の回答を読むと役立つ場合があります。、およびp値を使用して2つの独立したデータセットを比較する場合、誤検知の数はサンプルサイズに依存しないのはなぜですか?
2.私は医師ではないことに注意してください。この例はひどくおかしいかもしれません。肝機能、その検査、および関連事項について正確な情報が必要かどうかは、実際の医師に尋ねてください。


ありがとう!実際に変化することを示すため。しかし、@ Timの回答をどのように考慮しますか?それは矛盾していませんか?
Polisetty 2018

1
@ Polisetty、Timは、「入院患者と外来患者は、有病率だけでなく、多くの点で異なる可能性があるため、他のいくつかの要因が感度に影響を与える可能性がある」と述べています。テストが患者のいくつかの特性(たとえば、コレステロール)の関数であり、疾患がその特性と強く相関している場合(これは一般に全体のポイントです)、「その他の要因」は連動して動く必要があります。有病率。したがって、有病率が変化すると、他の相関関係も変化し、テストではその特定のグループに対して多かれ少なかれ感度があります。
ガン-モニカの

7

他の人がすでに述べたように、感度と特異度は有病率に依存しません。感度は、すべてのポジティブにおける真のポジティブの割合であり、特異度は、すべてのネガティブ間の真のネガティブの割合です。したがって、感度が90%の場合、陽性であるケースの90%でテストが正しく行われます。明らかに、小さいものの90%と大きいものの90%はまだ90%です...

あなたが言及している表形式のデータを考えると、

positiveconditionnegativeconditionpositivetestacnegativetestbd

感度は(から定義条件付き確率)および特異性は。各メトリックでは、一度に1つの列のみを確認するため、それらのメトリックでは、有病率(列の相対的なサイズ)は重要ではありません。有病率は方程式に入りません。また、「実用的な」感度が理論的に異なる方法で定義され、異なる結論に至った場合、それはかなり奇妙なことです。aa+b+c+d/a+ba+b+c+d=aa+b pY|バツ=pYバツpバツda+b+c+d/c+da+b+c+d=dc+d

しかし、引用はまた別のことを言っているようです

入院患者では検査感度が高くなり、外来患者では検査特異性が高くなる

そのため著者は、感受性はグループによって異なると述べています。入院患者と外来患者は、有病率だけでなく、多くの点で異なる可能性があるため、他のいくつかの要因が感度に影響を与える可能性があります。したがって、それら有病率の異なる異なるデータセット間で変更される可能性があることに同意しますが、その変更は有病率自体の関数ではありません(彼の回答で@gungによって示されています)。

一方、私が推測する必要がある場合、おそらく著者は感度と事後確率を混同しているのかもしれません。感度はですが、事後確率はp陽性検査|調子

p調子|陽性検査αp陽性検査|調子×p調子

そして多くの場合、これは人々が興味を持っている確率であり(「検査結果が陽性の患者が実際に病気になる可能性はどれくらいありますか?」)、それは有病率に依存します。また、リンクでは有病率が正の予測値、つまり感度ではなく事後確率に与える影響についても説明しています


前の回答の1つで述べたように、「多くのテキストがまだこのステートメントを作成している」と明示的に言及しているので、自閉症はそれを事後確率と混同しなかったと確信しています。また、ハリソンほど信頼性の高い別の情報源も引用しています。これは安全な「前提」であると述べています。私が聞きたいのは、「仮定」とは何ですか?
Polisetty 2018

2
@Polisetty著者には言えませんが、引用から、有病率への独立性を「仮定」と呼んでいるようですが、これはむしろ数学的な事実であり、仮定です。それが成り立たない場合、それは確率論が破られていることを意味し、そうではありません。
Tim

感度と特異度は、診断テストの固定プロパティと考えることができます。[これは少し単純化していますが、私たちの目的には十分です]。-それが言うこと
Polisetty

3

真/偽の正/負の率に関する私の答えをここで参照しください。

感度は真の陽性率の別名であり、特異度は真の陰性率と同じです。感度と特異度はどちらも条件付き確率です。彼らは患者の病状に基づいて調整します。したがって、特定の疾患状態を想定しているため、疾患の有病率(つまり、患者が疾患に罹患しているという事前の確率)は無関係です。

教科書の著者が、感度と特異性は臨床状況に依存すると主張する理由についてはコメントできない。これらの経験的観察はありますか?


丁度。したがって問題。テストの感度は、使用される母集団によって異なります。それが独立しているという仮定は常に正しいとは限りません。方法と理由を尋ねています。この本は後で値も引用しています
Polisetty 2018

感度と特異性に影響を与える人口固有の要因がある可能性があります。しかし、感度と特異性の数学的定義から、有病率はこれらの要因の1つになり得ず、少なくとも直接になり得ないことがわかります。(ちなみに、数学的な定義についての私の説明に満足したら、自由に私の答えを受け入れてください。)
tddevlin

すみません、よくわかりませんでした。感度と有病率の関係を数学的に知りたかった。私はそれらがどのように定義されているかを知っています。それらが計算される方法のために私は関係が入ってくると思います。感度はtp /(tp + fn)ですが、有病率はtp + fn /(tp + fn + fp + tn)です
Polisetty

P疾患P+|疾患

ハリソンはそれを誤解しないでしょう。このリンクでさえ、それを単純化と呼んでいます。med.uottawa.ca/sim/data/Sensitivity_and_Prevalence_e.htm
Polisetty

1

もちろん、筆者の意図に言及することはできませんが、これが私の発言の理由です。

臨床的コンテキストを診断テスト自体と見なします。感度と特異度が非常に低いものですが、それでもテストです。入院していると、病気になる可能性が高いです。あなたが入院していない場合、あなたは病気になる可能性は低いです。

この観点から見ると、実際に実行する診断テストは、連続して行われる2つのテストの2番目の部分です。


あなたの説明では、アプリオリが変化し、事後確率が大きくなっています。それは本当です。しかし、感度自体がどのように変化するかが問題です。
Polisetty 2018

@Polisetty高後方検査を陽性検査と呼ぶとどうなりますか?「臨床状況はそれ自体がテストです。」このように、任意に決定されたテストは、有病率に依存するように作成できると思うので、「テスト」をより具体的に定義する必要があります。この記述は、いくつかの代理測定のしきい値に基づく通常のさまざまなテストに適用されると思います。
Satwik Pasani、2018

1

これは間違いでしょう。おそらく著者は、正と負の予測値(PPVとNPV)が有病率(および感度と特異度)に依存していることを示唆しようとしていると思います。これらはしばしば診断テストで議論され、臨床医にとっては、感度と特異性の生の解釈よりもおそらくより価値があります。

このグラフは、95%の感度と85%の特異性を持つテストで、有病率を伴うPPVとNPVの関係を示しています。

Mausner JS、Kramer S:Mausner and Bahn Epidemiology:Introductory Textから。 フィラデルフィア、WBサンダース、1985、p。 221。

Mausner JS、Kramer S:Mausner and Bahn Epidemiology:Introductory Textから。フィラデルフィア、WBサンダース、1985、p。221。


1

@ Satwik、@ gung、および@Timはすでに多くの詳細を提供していますが、基礎となる要因のケースがそのような影響を引き起こす可能性のある方法の小さな例を追加してみます。

重要な原則:バイアス

感度/特異度とすべての統計検定は同じ警告を共有します。これは、公平な方法で以前と同じサンプリング手順を繰り返すことにのみ適用されます。

病院は、入院ポリシーを使用して一般集団を入院と治療を必要とするものに絞り込むために、偏ったサンプリングを実行するように設計された機能している組織です。これは科学的手順の非常に反対です。テストが異なる母集団でどのように実行されるかを知りたい場合は、異なる母集団でテストする必要があります。

潜在的な影響:相関

診断が疾患の他のすべての危険因子に対して独立/直交することはまれであり(現実の世界では不可能です)、ある程度の相関があります。

病院への入院のスクリーニングが診断と正に相関している場合、入院テストに合格した人は、相関に比例して、診断によって陽性の結果が得られる傾向があることがわかります。したがって、真の陽性は強化され、偽陰性は相関に比例した量だけ減少します。

これにより、感度が大きくなります。

現象の説明

したがって、病院ベースのコンテキストでは感度が高くなる可能性があるという観察は非現実的ではありません。実際、入学ポリシーが十分に検討され、目的に適合している場合、これが発生すると予想されます。

これは、感度と特異度が有病率に依存しないという仮定の内訳の証拠ではなく、入院方針に基づいたサンプリングの偏りの証拠です。

病院が人を治療するためにあり、科学的な実験を行わないことを考えると、これは間違いなく良いことです。

しかし、それは科学者に頭痛の種を与えます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.