これを差別事例の経験からリバースエンジニアリングします。「741に1つ」などの値がどこから来たのかを明確に確認できます。しかし、翻訳では多くの情報が失われたため、私の再構築の残りの部分は、法廷の設定で人々がどのように統計を行うかを見たことに依存しています。詳細のいくつかしか推測できません。
差別禁止法が1960年代に可決されたときから(タイトルVI)、米国の裁判所はp値を調べ、および0.01のしきい値と比較することを学びました。また、一般に「標準偏差」と呼ばれる標準化された効果を調べ、「2〜3つの標準偏差」のしきい値と比較することも学びました。差別訴訟の一応の訴訟を確立するために、原告は通常、これらのしきい値を超える「異なる影響」を示す統計計算を試みます。そのような計算がサポートされない場合、通常ケースは進むことができません。0.050.01
原告の統計専門家は、しばしば、これらのよく知られた用語で結果を表現しようとします。一部の専門家は、雇用決定が純粋にランダムであり、従業員の他の特性によって覆されていないと仮定して、帰無仮説が「悪影響なし」を表す統計テストを実施します。(片側か両側かは、専門家と状況に依存する可能性があります。)次に、標準正規分布を参照して、この検定のp値をいくつかの「標準偏差」に変換します。 - 標準の標準が元のテストと無関係である場合でも。 このラウンドアバウト方式で、彼らは結論を明確に裁判官に伝えたいと考えています。
分割表に要約できるデータの推奨テストは、フィッシャーの正確検定です。「Exact」という名前が出現することは、原告にとって特に喜ばしいことです。これは、エラーなしに行われた統計的な決定を意味するためです(それが何であれ!)。
ここに、労働省の計算の私の(投機的再構成)があります。
彼らは、(のようなフィッシャーの正確確率検定、またはそれのような何かを実行したランダム化を経て決定され、p値とテスト)。このテストでは、Matthew Gunnの回答で説明されている超幾何分布を想定しています。(この苦情に関係する少数の人々については、超幾何分布は正規分布でうまく近似されていません。)χ2
彼らは、そのp値を通常のZスコア(「標準偏差の数」)に変換しました。
彼らは、Zスコアを最も近い整数に丸めました:「3つの標準偏差を超える」、「5つの標準偏差を超える」、「6つの標準偏差を超える」。(これらのZスコアのいくつかはより標準偏差に切り上げられているため、「超過」を正当化することはできません。できることはそれを引用することだけです。)
苦情では、これらの積分Zスコアがp値に変換されました!再び、標準正規分布が使用されました。
これらのp値は、(おそらく誤解を招くような方法で)「この結果が偶然に発生した可能性」として説明されます。
1/12801/5650001/5800000073011601307301160130−3.16−4.64−5.521/7411/35000001/1000000000
R
これらの計算を実行するために使用されるコードを次に示します。
f <- function(total, percent.asian, hired.asian, hired.non.asian) {
asian <- round(percent.asian/100 * total)
non.asian <- total-asian
x <- matrix(c(asian-hired.asian, non.asian-hired.non.asian, hired.asian, hired.non.asian),
nrow = 2,
dimnames=list(Race=c("Asian", "non-Asian"),
Status=c("Not hired", "Hired")))
s <- fisher.test(x)
s$p.value
}
1/pnorm(round(qnorm(f(730, 77, 1, 6))))
1/pnorm(round(qnorm(f(1160, 85, 11, 14))))
1/pnorm(round(qnorm(f(130, 73, 4, 17))))