回答:
以下に示すようなクロス分類を想定(ここでは、スクリーニング機器)
スクリーニングの精度と予測力の4つの尺度を定義できます。
4つの各測定値は、観測データから計算された単純な比率です。したがって、適切な統計的検定は、ほとんどの統計パッケージまたは多くのオンライン計算機で利用できる二項(正確な)検定です。テストされた仮説は、観測された比率が0.5と有意に異なるかどうかです。ただし、測定の精度に関する情報を提供するため、単一の有意性検定よりも信頼区間を提供する方がより興味深いことがわかりました。とにかく、表示した結果を再現するには、双方向テーブルの総マージンを知る必要があります(PPVとNPVを%で指定しただけです)。
例として、次のデータを観察するとします(CAGEアンケートはアルコールのスクリーニングアンケートです)。
Rでは、PPVは次のように計算されます。
> binom.test(99, 142)
Exact binomial test
data: 99 and 142
number of successes = 99, number of trials = 142, p-value = 2.958e-06
alternative hypothesis: true probability of success is not equal to 0.5
95 percent confidence interval:
0.6145213 0.7714116
sample estimates:
probability of success
0.6971831
SASを使用している場合、使用上の注意24170:感度、特異性、正および負の予測値、偽陽性および負の確率、および尤度比を推定するにはどうすればよいですか?。
信頼区間を計算するには、ガウス近似、 (1.96は、標準正規分布の分位数です。 または と %)は、特に比率が非常に小さいか大きい場合に実際に使用されます(多くの場合ここにあります)。
詳細については、次をご覧ください。
ニューカム、RG。シングル割合を両面信頼区間:七つの方法の比較。 Statistics in Medicine、17、857-872(1998)。
見てください
Kosinski、Andrzej S.診断テストの予測値を比較するための加重一般化スコア統計。Statistics in Medicine http://dx.doi.org/10.1002/sim.5587 オンライン公開:2012年8月22日