順列テストを使用する利点は何ですか?


10

検定統計量によって代替仮説に対するいくつかのヌルをテストする場合U(X)、ここで、X={xi,...,xn}、の順列の集合を使用して順列検定を適用すると、新しい統計 X T X = { π G U π X U X }GX

T(X):=#{πG:U(πX)U(X)}|G|.
  1. 順列検定を使用しない場合と比べて、順列検定を使用する利点は何ですか?つまり、順列テストが機能するときはどのようなものですか?

  2. それを実現するための条件は何ですか?検定統計量および/または帰無仮説に関するいくつかの条件など?U

例えば、

  1. サンプル場合、 は基づくp値と等しい必要がありますか?はいの場合、なぜですか?(参照も高く評価されています)U X XT(X)U(X)X

    のp値は、。順列検定がU(X)の順列分布を推定する場合| X = xT(X)X = xでのU(X)の p値とどのように等しいですか?特に、ヌルHには複数の分布が存在する可能性があり、T(X)はヌル分布を1つずつ考慮せず、\ sup_ {F \ in H}\ inf_ {c:U(x)を使用します。 \ geq c}U(X)UX | X=XTXUXX=XHTX SUP F H

    infcR:U(x)csupFHP(U(X)c|XF)
    U(X)|X=xT(X)U(X)X=xHT(X)supFHinfc:U(x)c
  2. 順列検定は、帰無仮説に対してT(X)分布なしにする必要がありますか?それはどのような条件で起こりますか?

  3. はに均一に分布する必要がありますか?それはどのような条件で起こりますか?が定数関数である場合、もで一定であり、分布は 上で均一ではないことに注意して。[ 0 1 ] U T 1 T X [T(X)[0,1]U()T()1T(X)[0,1]

よろしくお願いします!


@Glen_b:ありがとう!SHOULD に基づいたp値に等しくなる任意のサンプルについて、?私が正しく理解していれば、このスライドの 5ページでそれを見つけました。順列検定を使用する利点は、null でのの分布を知らなくても、元の検定統計量のp値を計算できることですか。したがって、分布は必ずしも均一であるとは限りません。U X X U X T X T(X)U(X)XUXT(X)
Tim

「Tはp値です(大きなUがnullからの偏差を示し、小さなUがそれと一致する場合)」は、検定統計量と標本のp値がであることを意味しますか?X T X UXT(X)
Tim

どうして?それを説明するための参考資料はありますか?
Tim

回答:


18

ディスカッションが長くなったので、私は自分の回答を回答にとらえました。しかし、順序を変更しました。

順列検定は、漸近的ではなく「正確」です(たとえば、尤度比検定と比較してください)。したがって、たとえば、nullの下での平均の差の分布を計算できなくても、平均の検定を行うことができます。関連するディストリビューションを指定する必要すらありません。完全なパラメトリックな仮定ほど敏感ではなく、一連の仮定の下で優れたパワーを持つテスト統計を設計できます(堅牢であるが、優れたAREを持つ統計を使用できます)。

あなたが与える定義(あるいは、あなたがそこで引用している人は誰でも)は普遍的ではないことに注意してください。Uを順列検定統計と呼ぶ人もいます(順列検定を作るものは統計ではなく、p値を評価する方法です)。しかし、順列テストを実行して、「これの極値がH0と一致しない」として方向を割り当てたら、上記のTの定義は基本的に、p値を計算する方法です-それは実際の比率ですヌルの下のサンプル(p値の定義そのもの)と少なくとも同じくらい極端な順列分布。

したがって、たとえば、2標本t検定のような平均の(片側、片側)検定を実行する場合、統計をt統計の分子、またはt統計自体にすることができます。または、最初のサンプルの合計(これらの定義のそれぞれは他のものでは単調であり、結合サンプルを条件とする)、またはそれらの任意の単調変換であり、それらは同一のp値を生成するため、同じ検定を持ちます。私がする必要があるのは、サンプル統計がどのような統計の順列分布にどれだけ(比例的に)分布するかを確認することだけです。上記で定義されたTは、私が選択できる他の統計と同じように、もう1つの統計です(定義されたTはUで単調です)。

Tは正確に均一ではありません。連続分布が必要であり、Tは必然的に離散であるためです。UおよびTは特定の統計に複数の順列をマッピングできるため、結果は確率が等しくありませんが、「均一な」cdf **を持ちますが、ステップのサイズが必ずしも同じではありません。 。

**(、および各ジャンプの右限界で厳密にこれに等しい-おそらく実際の名前には名前がある)F(x)x

が無限大になる合理的な統計では、の分布は均一性に近づきます。それらを理解するための最善の方法は、実際にさまざまな状況でそれらを行うことです。 nT

T(X)は、任意のサンプルXについて、U(X)に基づくp値と等しい必要がありますか?私が正しく理解していれば、このスライドの5ページでそれを見つけました。

Tはp値です(大きなUがnullからの偏差を示し、小さなUがそれと一致する場合)。分布はサンプルを条件としていることに注意してください。したがって、その分布は「任意のサンプル」ではありません。

したがって、順列検定を使用する利点は、nullの下でのXの分布を知らなくても、元の検定統計量Uのp値を計算できることです。したがって、T(X)の分布は必ずしも均一であるとは限りません。

Tは一様ではないことはすでに説明しました。

順列検定の利点として私が見ているものについてはすでに説明したと思います。他の人々は他の利点を提案するでしょう(例えば)。

「Tはp値です(大きなUがnullからの偏差を示し、小さなUがそれと一致する場合)」は、検定統計量Uと標本Xのp値がT(X)であることを意味しますか?どうして?それを説明するための参考資料はありますか?

あなたが引用した文は、Tがp値であり、いつであるかを明示的に述べています。あなたがそれについて何が不明確であるかを説明することができるなら、多分私はもっと言うことができます。理由については、p値の定義(リンクの最初の文)を参照してください。これは、その直後に続きます。

順列検定については、基本的な説明がここにあります

-

編集:ここに小さな順列検定の例を追加します。この(R)コードは小さなサンプルにのみ適しています-中程度のサンプルで極端な組み合わせを見つけるには、より優れたアルゴリズムが必要です。

片側の選択肢に対する置換検定を考えてみましょう。

H0:μx=μy ( *と主張する人もいます)μxμy
H1:μx<μy

*ただし、Null分布を計算しようとするときに学生の問題を特に混乱させる傾向があるため、通常は避けます。

次のデータについて:

> x;y
[1] 25.17 20.57 19.03
[1] 25.88 25.20 23.75 26.99

7つの観測をサイズ3と4のサンプルに分割する方法は35通りあります。

> choose(7,3)
[1] 35

前述のように、7つのデータ値が与えられた場合、最初のサンプルの合計は平均の差が単調なので、それを検定統計量として使用します。したがって、元のサンプルの検定統計量は次のとおりです。

> sum(x)
[1] 64.77

これが順列分布です:

> sort(apply(combn(c(x,y),3),2,sum))
 [1] 63.35 64.77 64.80 65.48 66.59 67.95 67.98 68.66 69.40 69.49 69.52 69.77
[13] 70.08 70.11 70.20 70.94 71.19 71.22 71.31 71.62 71.65 71.90 72.73 72.76
[25] 73.44 74.12 74.80 74.83 75.91 75.94 76.25 76.62 77.36 78.04 78.07

(それらをソートすることは必須ではありません。テスト統計が最後から2番目の値であることを簡単に確認できるようにするためにそれを行いました。)

(この場合は検査により)が2/35であることがわかります。p

> 2/35
[1] 0.05714286

(ここでxyオーバーラップがない場合のみ、p値が.05未満になる可能性があることに注意してください。この場合、は関連付けられた値がないため、離散均一になります。)TU

順列分布

ピンク色の矢印は、x軸にサンプル統計を、y軸にp値を示します。


U(X)XT(X)XXT(X)UX

U(X)|X=x

U(X)
infcR:U(x)csupFHP(U(X)c|XF)
U(X)|X=xT(X)U(X)X=xHT(X)supFHinfc:U(x)cT(X)

(1)に加えて、順列テストは単純なnullだけでなく、複合nullにも適用されますか?
Tim

X=x
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.