私はそれが偏っている(私は思う)ことを示すことができますが、理由を説明することはできません。私は誰かが私の答えを見て、それをさらに説明するのを助けることを望んでいます。
多くのメタ分析や投稿した画像と同様に、多くの人がBESDを次のように解釈します。両方の変数の中央値を分割すると、2 x 2の分割表の「右」のセルに、時間。
したがって、場合、「これがであるとすると、次のように考えることができます。Xの中央値より上の人は、70%の時間でYの中央値より上になります。 」これは、Kraus(1995、p。69)がそれを解釈する方法です(彼は、一方の変数が真に二分であり、他方の変数が中央値分割であるという架空の状況に依存しています)。.50+r/2=.70r
人々はしばしば医療のメタファーも使用しています。「このは、コントロール状態と実験状態の人々の間の40パーセントポイントの差に対応します。」r
メジアンスプリットエスク解釈に偏りがあるかどうかを確認するために、真の母集団である1,000,000ケースの母集団をシミュレーションしました。次に、この母集団から100人を抽出し、BESDの「正しい率」(つまり、)を計算し、2 x 2分割表の実際の中央分割セルを計算しました。人々は「正しく」。これを1万回しました。r=.38.50+r/2
次に、長さ10,000のこれらの各ベクトルの平均と標準偏差を取得しました。コード:
library(MASS)
# set population params
mu <- rep(0,2)
Sigma <- matrix(.38, nrow=2, ncol=2) + diag(2)*.62
# set seed
set.seed(1839)
# generate population
pop <- as.data.frame(mvrnorm(n=1000000, mu=mu, Sigma=Sigma))
# initialize vectors
besd_correct <- c()
actual_correct <- c()
# actually break up raw data by median split, see how it works
for (i in 1:10000) {
samp <- pop[sample(1:1000000, 100),]
besd_correct[i] <- round(100*(.50 + cor(samp)[1,2]/2),0)
samp$V1_split <- ifelse(samp$V1 > median(samp$V1), 1, 0)
samp$V2_split <- ifelse(samp$V2 > median(samp$V2), 1, 0)
actual_correct[i] <- with(samp, table(V1_split==V2_split))[[2]]
}
# cells for BESD
mean(besd_correct)
100 - mean(besd_correct)
# cells for actual 2 x 2 table with median split
mean(actual_correct)
100 - mean(actual_correct)
BESDに基づいて、次の表を取得します。ここでv1
、v2
変数low
をhigh
参照し、中央値の下および上をそれぞれ参照します。
+---------+--------+---------+
| | v2 low | v2 high |
+---------+--------+---------+
| v1 low | 69 | 31 |
+---------+--------+---------+
| v1 high | 31 | 69 |
+---------+--------+---------+
生データで中央分割を実際に行うことに基づいて、次の表を取得します。
+---------+--------+---------+
| | v2 low | v2 high |
+---------+--------+---------+
| v1 low | 62 | 38 |
+---------+--------+---------+
| v1 high | 38 | 62 |
+---------+--------+---------+
したがって、BESDを使用して、「コントロールと実験で38パーセントポイントの差」があると誰かが主張する可能性がありますが、実際の中央値の分割は24です。
これが発生する理由がわからない場合、またはサンプルサイズと相関関係に依存している場合は(より多くのシミュレーションを実行して簡単に理解できる可能性があります)、これはバイアスがかかっていることを示していると思います。誰かが計算ではなく数学的説明を取り入れてくれるといいのですが。