非対称ヌル分布の両側検定のP値


18

私の状況は次のとおりです:モンテカルロ研究を通じて、推定パラメーターの統計的有意性について2つの異なる検定の値を比較したい(nullは「効果なし-パラメーターはゼロ」、暗黙の代替は「パラメータはゼロではありません」)。テストAは標準の平均値の等価性に関する独立した2標本t検定」であり、nullの下で等しい分散を持ちます。 p

テストB自分で構築しました。ここで、使用されるヌル分布は非対称の一般的な離散分布です。しかし、Rohatgi&Saleh2001、2nd ed、p。462)で次のコメントを見つけました。

「分布が対称でない場合、多くの著者は片側の値を2倍にすることを推奨していますが、両側のケースでは値は明確に定義されていませんpp

著者は、これについてさらに議論することも、片側値を2倍にする「多くの著者の提案」についてコメントすることもしません。(これにより、「どちらの側の値を2倍にしますか?そして、なぜこの側であり、もう一方ではありませんか?」という質問が作成されます。)pp

この問題全体について、他のコメント、意見、結果を見つけることができませんでした。非対称分布では、パラメーターの値に関して帰無仮説の周りに対称な区間を考えることができますが、確率質量配分の2番目の通常の対称性はないことを理解しています。しかし、これが値を「十分に定義されていない」ものにする理由がわかりません 。個人的には、推定量の値に対して帰無仮説の周りに対称な区間を使用することにより、定義がありませんp「ヌル分布が、この区間の境界に等しい値またはこの区間の外側の値を生成する確率はXXです」という問題。一方の側の確率質量が他方の側の確率質量と異なるという事実は、少なくとも私の目的では、問題を引き起こすようには見えません。しかし、Rohatgi&Salehが私が知らないことを知っていることよりもむしろありそうです。

だからこれは私の質問です:ヌル分布が対称ではない両側検定の場合、値はどのような意味で「十分に定義されていない」(または定義される可能性があります)か?p

おそらく重要な注意事項:私は漁師の精神でより多くの問題にアプローチします、私はネイマン・ピアソンの意味で厳格な決定ルールを取得しようとはしていません。推論を行うために他の情報と一緒に値の情報を使用するのは、テストのユーザーに任されています。p


4
尤度ベース(「フィシェリアン」)およびLRベース(NP)のアプローチに加えて、別の方法では、短い信頼区間を取得する方法を検討し、それらを仮説検定に使用します。これは、長さが損失関数に含まれる決定理論の精神で(およびその方法を使用して)行われます。検定統計量の単峰性対称分布の場合、対称区間を使用して可能な限り最短の間隔が得られることは明らかです(基本的に片側検定の「p値の2倍」)。最短の間隔はパラメーター化に依存します。したがって、それらはフィッシャー関数にはなりません。
whuber

ここに投稿された回答がベータ版にも当てはまるかどうか疑問に思っていました。ありがとう。
JLT

@JLT:はい、なぜですか?
Scortchi -復活モニカ

回答:


12

2x2の正確なテストを見て、それをアプローチとすると、「より極端な」ものは「低い尤度」によって直接測定される可能性があります。(Agresti [1]は、2x2フィッシャーの正確検定のこのケースために 2つのテールp値を計算するためのさまざまな著者による多くのアプローチに言及しています。このアプローチは、「最も人気のある」

連続(単峰性)分布の場合、サンプル値と同じ密度のもう一方の尾の点を見つけるだけで、他の尾の等しいか低い尤度を持つすべてがp値の計算でカウントされます。

テールが単調に増加しない離散分布の場合、それはほぼ同じくらい簡単です。サンプルと等しいか低い尤度ですべてを数えるだけです。これは、(「テール」という用語をアイデアに合わせるために)追加した仮定を与えて、それを解決する方法を提供します。

HPD間隔に精通している場合(そして再び、私たちは単峰性を扱っています)、それは基本的に、サンプル統計によって片方の境界にある開いたHPD間隔の外側にあるすべてのものを取得するようなものです。

ここに画像の説明を入力してください

[繰り返しますが、これは、ここで同等とみなしているヌルの下での可能性です。]

そのため、少なくともユニモーダルの場合、フィッシャーの正確な検定をエミュレートし、2つのテールについてまだ話をするのは十分に簡単なようです。

ただし、フィッシャーの正確なテストの精神をまったくこの方法で呼び出すつもりはなかったかもしれません。

それでは、何かを「より極端な」ものにするという考えを少しの間考えて、少しだけネイマン・ピアソンの終わりに向かってみましょう。(テストする前に!)何らかの一般的なレベルで行われたテストの棄却域の定義を設定するのに役立ちます(計算する方法だけでなく、文字通り計算する必要はありません)。すぐに、ケースの2つのテールp値を計算する方法が明らかになります。α

このアプローチは、通常の尤度比テスト以外のテストを実施している場合でも有用です。一部のアプリケーションでは、非対称順列検定でp値を計算する方法を理解するのが難しい場合がありますが、拒否ルールを最初に考えると、かなり簡単になることがよくあります。

分散のF検定では、「double one tail p-value」が正しいアプローチとして私が見ているものとはまったく異なるp値を与えることができることに気付きました。[「サンプル1」と呼ぶグループ、または分子に大きい分散を入れるか小さい分散を入れるかは問題ではありません。]

[1]:Agresti、A.(1992)、
コンティンジェンシーテーブル
統計学の正確な推論の調査、Vol。7、No。1(2月)、pp。131-153。


1
ctd ...尤度比検定を行っている場合、尤度比は常に片側ですが、何らかの統計に基づいて同等の両側検定を構築する場合は、より小さな尤度比を調べて「より極端な」位置を特定します
グレン_b-モニカの復活

2
片側p値を2倍にすることは、2つの片側検定を実行するためのBonferroni補正として防御される場合があります。結局、両側検定に続いて、我々は通常、データによって方向が決定される別の仮説を支持するものとして、nullの真理に投げかけられた疑いを考える傾向が非常に強いです。
Scortchi-モニカの復職

1
@Alecosそれは対称的な選択を正当化するのに十分簡単です!私が書いたものを読んでどのように対称的な選択をするのが妥当なことではないことを示唆しているのを見るのは難しいと思う拒否ルール)。私の答えの最初の部分は、フィッシャーに関する質問の部分に答えることでした。フィッシャーについて質問する場合、フィッシャーが似たような状況で行ったことに基づいて、フィッシャーが何をする可能性があるかについて話し合うべきではありませんか?あなたは私の応答をそれ以上のことを言っていると解釈しているようです。
Glen_b-モニカを復活させる

1
@Alecos特に、私はフィッシャーやネイマン・ピアソンのアプローチを支持していません(尤度比検定またはより一般的な仮説検定について話しているかどうか)、または私が省略したものが間違っているかもしれないことを示唆しようとしているとみなすべきですか? 。私はあなたがあなたの質問で提起しているように思われた多くのことを議論しています。
グレン_b-モニカを復元

2
究極的にははい。フィッシャーのアプローチのすてきなことは、代替手段がなくてもp値に到達する非常に賢明な方法を提供することです。しかし、興味のある特定の代替物がある場合、代替物が拒絶領域としてサンプルを配置する傾向があるサンプル空間の部分を宣言することにより、それらの代替物にほぼ正確に拒絶領域をターゲットすることができます。検定統計量Tは、本質的に単一の数値をその中の各ポイントに関連付けることにより、それを達成する便利な方法です(Tによって測定される「より極端な」ものを与えます)。... ctd
Glen_b -Reinstate Monica

9

STST=|S|

t=PrH0S<sPrH0S>sS2t

SST=fSSバツ1.661.66

p=Prバツ>1.66+Prバツ<1.66=0.048457+0.048457=0.09691。
Ye1.66=5.25930.025732=e3.66
p=PrY>5.2593+PrY<0.025732=0.048457+0.00012611=0.04858。

ここに画像の説明を入力してください

p=2t=2Prバツ<1.66Prバツ>1.66=2PrY<5.2593PrY>5.2593=20.0484570.951543=2×0.048457=0.09691。

対立仮説が明示的に述べられているテスト構築のいくつかの原則を議論する、この答えの一種の続編はここにあります

S

pL=PrH0Ss
pうん=PrH0Ss

上下の片側p値の場合、両側p値は次の式で与えられます。

PrTt={pL+PrH0PうんpLいつ pLpうんpうん+PrH0PLpうんさもないと

2t


1
ああすごい。これは非常に良いポイントです、+ 1。あなたのアドバイスは何ですか?また、この矛盾は、検定統計量の異なる(この場合は暗黙的な)選択に対応していると解釈できますか?
アメーバは、モニカーを復活させる

1
@amoeba:タイプミスではありません!そして、1.66を観察するとき、0.952と0.048の最小値を取ります。実際に-3.66を観測した場合、最小値は0.0001および0.9999です。
Scortchi -復活モニカ

1
@Scortchi狭い意味で私にとってより「有用」だったので、Glen_bの答えを受け入れました。しかし、あなたのおかげで、将来のリスクに対する優れた保険である「これですべてだ」という考えのtrap を避けることができました。再度、感謝します。
アレコスパパドプロス

1
@Scortchi私は同意しなければなりません。私の回答はかなり単純で一方的な見方をしていたので、答えを修飾、拡張、正当化する必要があります。私はおそらくいくつかの段階でそれをするでしょう。
Glen_b-モニカを復活させる

1
@Glen_b:ありがとう、私はそれを楽しみにしています。また、スコアテストと一般化された尤度比テストが異なる答えを(一般的に)与える方法を示すために、私のものを拡張したいと思います。偏りのないテストの理論は、この文脈で言及する価値があることは確かです(しかし、私はかろうじて思い出すことができます)。
Scortchi -復活モニカ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.