ダービン-ワトソンを除いて、どの仮説検定が決定的な結果を生み出しませんか?


10

ダービン・ワトソン検定統計量は、それが(この場合、ゼロ自己相関の)帰無仮説を拒絶する拒絶するか失敗するか不可能である不確定領域内に位置することができます。

「決定的でない」結果を生み出す可能性がある他の統計的検定

この一連のテストがバイナリの「拒否」/「失敗の拒否」の決定を行うことができない理由についての一般的な説明はありますか?

誰かが後者のクエリへの回答の一部として意思決定理論上の影響に言及できたら、それはおまけです—結論の(追加の)カテゴリの追加は、タイプIとタイプIIのコストを考慮する必要があることを意味しますかより洗練された方法でエラー?


2
少し話題外ですが、ランダム化されたテストはそのような味を持っています。データの一部の値については、受け入れと拒否をランダム化する必要があります。
Christoph Hanck、2015年

@ChristophHanckありがとう、それは私が気づかなかったであろう興味深いつながりでした。私が意図していたものではありませんでしたが、質問がすべてに当てはまることを期待して、わざとあいまいな質問をしていました。回答によっては、後で焦点を絞る場合があります。
Silverfish

回答:


10

Wikipediaの記事は、帰無仮説の下で検定統計量の分布は、設計行列回帰で使用されるの予測値の特定の構成に依存していることを説明しています。ダービン・ワトソンは、正の自己相関のためにテストがために、所与の有意レベルで、拒否しなければならないの下で、検定統計量のための下限計算任意のデザイン行列、およびテストをするための拒否に失敗しなければならない上に上限任意のデザイン行列。「決定的でない領域」とは、明確な答えを得るために設計行列を考慮に入れて、正確な臨界値を計算する必要がある領域にすぎません。

類似の状況は、t統計量だけがわかっていて、サンプルサイズがわからない場合に、1サンプルの片側t検定を実行する必要があることです:1.645&6.31(無限の自由度と1つだけに対応)は、サイズ0.05のテストの境界。

決定理論に関する限り、サンプリングの変動以外に考慮すべき新しい不確実性の原因がありますが、複合帰無仮説の場合と同じように適用すべきでない理由はわかりません。どのようにして到達したかに関係なく、未知の迷惑パラメータを持つ誰かと同じ状況にいます。したがって、すべての可能性にわたってタイプIエラーを制御しながら拒否/保持の決定を行う必要がある場合は、控えめに拒否してください(つまり、ダービンワトソン統計が下限を下回っている場合、またはt統計が6.31を超えている場合)。

†あるいは、テーブルを失った可能性があります。しかし、標準ガウスのいくつかの重要な値と、コーシー分位関数の式を覚えています。


(+1)ありがとう。私はこれがダービン・ワトソン検定のケースであることを知っていましたが(これは私の質問で実際に言及されているはずです)、これがより一般的な現象の例であるかどうか、そうであれば、それらすべてが本質的に同じように機能するかどうか疑問に思いました。たとえば、要約データにアクセスできるだけで(必ずしも回帰ではない)特定のテストを実行すると、それが発生する可能性があると思いましたが、DWが唯一のケースであり、上限と下限の重要な値がコンパイルされて表になっていることがわかります。 。私がどのように質問をより的を絞ったものにすることができるかについての考えがあれば、大歓迎です。
Silverfish

最初の質問は少しあいまいです(「他の統計検定[...]?」)。2番目の質問に答えずにそれを明確にすることはできないと思います(「一般的な説明はありますか[...]?」)自分自身-全体として、現状では問題ないと思います。
Scortchi-モニカの回復

7

結論が得られない可能性のあるテストのもう1つの例は、サンプルサイズではなく比率のみが利用可能な場合の比率の二項検定です。これは完全に非現実的ではありません。「73%の人がそれに同意する...」という形式の不十分に報告された主張をよく見たり聞いたりします。分母は利用できません。

H0:π=0.5H1:π0.5α=0.05

p=5%1195%α=0.05

p=49%

p=50%H0

p=0%p=50%p=5%p=0%p=100%p=16%Pr(X3)0.00221<0.025p=17%Pr(X1)0.109>0.025p=16%p=18%Pr(X2)0.0327>0.025p=19%Pr(X3)0.0106<0.025

p=24%p=13%α=0.05:線より下の点は明確に重要ですが、それより上の点は決定的ではありません。p値のパターンは、結果が明確に有意であるように、観測されたパーセンテージに単一の下限と上限が存在しないようなものです。

サンプルサイズが不明な二項検定の最小有意p値

Rコード

# need rounding function that rounds 5 up
round2 = function(x, n) {
  posneg = sign(x)
  z = abs(x)*10^n
  z = z + 0.5
  z = trunc(z)
  z = z/10^n
  z*posneg
}

# make a results data frame for various trials and successes
results <- data.frame(successes = rep(0:100, 100),
    trials = rep(1:100, each=101))
results <- subset(results, successes <= trials)
results$percentage <- round2(100*results$successes/results$trials, 0)
results$pvalue <- mapply(function(x,y) {
    binom.test(x, y, p=0.5, alternative="two.sided")$p.value}, results$successes, results$trials)

# make a data frame for rounded percentages and identify which are unambiguously sig at alpha=0.05
leastsig <- sapply(0:100, function(n){
    max(subset(results, percentage==n, select=pvalue))})
percentages <- data.frame(percentage=0:100, leastsig)
percentages$significant <- percentages$leastsig
subset(percentages, significant==TRUE)

# some interesting cases
subset(results, percentage==13) # inconclusive at alpha=0.05
subset(results, percentage==24) # unambiguously sig at alpha=0.05

# plot graph of greatest p-values, results below red line are unambiguously significant at alpha=0.05
plot(percentages$percentage, percentages$leastsig, panel.first = abline(v=seq(0,100,by=5), col='grey'),
    pch=19, col="blue", xlab="Rounded percentage", ylab="Least significant two-sided p-value", xaxt="n")
axis(1, at = seq(0, 100, by = 10))
abline(h=0.05, col="red")

(丸めコードは、このStackOverflow質問から省略されています。)

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.