仮説検定。サンプリング分布をH0に集中させるのはなぜですか?


9

p値は、帰無仮説()が真であると仮定した場合に、サンプルデータで観測された統計と少なくとも同じくらい極端な統計を取得する確率です。H0

これは、仮定した場合に取得されるであろうサンプリング分布の下のサンプル統計によって定義された領域にグラフィカルに対応し。H0

センターh0

ただし、この想定される分布の形状は実際にはサンプルデータに基づいているため、を中心とする分布は私には奇妙な選択のように思えます。 代わりに統計の標本分布を使用する場合、つまり標本統計に分布を集中させる場合、仮説検定は標本が与えられた場合のの確率の推定に対応します。μ 0μ0
μ0

センターh1

その場合、p値は、上記の定義の代わりに、データが与えられたときにと少なくとも同じくらい極端な統計を取得する確率です。μ0

さらに、このような解釈には信頼区間の概念によく関連するという利点があります。
有意水準仮説検定は、がサンプリング分布の信頼区間内にあるかどうかを確認することと同等です。μ 01 - α αμ0(1α)

CI2 95

したがって、分布をせることは、不必要に複雑になる可能性があると感じています。 私が考慮しなかったこのステップの重要な正当化はありますか?μ0


2
想定しない場合のサンプリング分布を教えてください。(回答:H0
対立

リクエストを正しく理解しているかどうかはわかりませんが、上記の例では、平均のサンプリング分布になります。質問に、この分布と95%信頼区間/面積を示す図を追加しました。これは、信頼区間との関係を示すのにも役立つはずです。
matti 2016年

2
平均の標本分布を知る方法はありません。それを知るには、真の意味を知る必要があります。しかし、それは正確にテストしようとしている量です。あなたの論理は完全に循環的です。
whuber

1
それがあなたの意味だと理解しました。一般に、分布の真のパラメーターを知る(または想定するまで、サンプルのプロパティの分布を知ることはできません。 (実際、パラメーターの知識を前提とせずにサンプルプロパティの分布を推定できる場合、それはパラメーターについての情報を提供していないことの証明です!)
whuber

1
通常の統計的な意味で「平均」、「推定」、「H0」などの用語を使用していないようですので、私はできません。私はあなたの質問が何であるかさえ理解するのに完全に困惑しています。唯一明らかなことは、帰無仮説検定の誤解に基づいているということですが、私のコメントに対するあなたの回答は、その誤解が何であるかについての有用な兆候を提供していません。
whuber

回答:


5

仮定、未知の平均値で正規分布から引き出された試料であると既知の分散。したがって、サンプルの平均は、平均および分散正常です。この点については、意見の相違の可能性はないと思います。X=(X1,X2,,Xn)μσ2X¯μσ2/n

ここで、テスト統計がであると提案しました 正しい? しかし、これは統計的ではありません。どうして?あるのでである未知パラメータ。統計は、未知のパラメーターに依存しないサンプルの関数です。したがって、が統計になるためには、についての仮定が必要です。そのような前提の1つは、を書き込むこと下にこれ統計です。

Z=X¯μσ/nNormal(0,1).
μμZ
H0:μ=μ0,vs.H1:μμ0,
ZH0=X¯μ0σ/nNormal(0,1),

対照的に、自体を使用することを提案します。その場合、同一であり、正規分布は言うまでもなく、確率変数でさえありません。テストするものは何もありません。 Z = 0μ=X¯Z=0


1
ありがとうございました。これは非常に単純明快で、今はどうしてそれを見逃していたのだろうと私は本当に思っています。2番目に提示されたケースの言い訳として残っているのは、信頼区間の計算に依存することだけです。ただし、誤差のマージンは平均またはポイント推定値から明示的に加算/減算されるため、その推定値の使用は、正当化する必要があるステップになります。
matti 2016年

12

ただし、この想定される分布の形状は実際にはサンプルデータに基づいているため、H0を中心とする分布は私には奇妙な選択のように思えます。

これは実際には当てはまりません。この想定される分布の形は、をtrueとして受け入れることからます。H0サンプルは、いくつかの仮定を除いて、それに直接関与していません。サンプルを直接使用するだけでは不十分です。保持する帰無仮説も必要です。

代わりに統計のサンプリング分布を使用する場合、つまりサンプル統計に分布を集中させる場合、仮説検定はサンプルが与えられた場合のH0の確率の推定に対応します。

問題は、あなたが真実であると考える何かの確率をどのように推定するかです。私たちの場合、がtrueであると仮定すると、がtrueである確率を推定しようとしても無駄です。H 0H0H0

したがって、分布をH0に集中させることは、不必要な複雑化だと感じます。

そこには2つのディストリビューションはありません。1つしかありません。1つはあなたのグラウンドトゥルースであると想定され、別名付属してい。ただし、サンプルから派生したサンプリング分布がありますが、これは使用する仮説には含まれていません。H0

私は、非対称の分布で同じロジックを複製しようとするのがよいでしょう。カイ二乗独立検定のようにカイ二乗分布をとります。再現できますか?答えはノーだと思います。


これは実際には真実ではありません。この仮定された分布の形は、H0を真実として受け入れることから来ています。サンプルは、いくつかの仮定を除いて、それに直接関与していません。」しかし、上記の1つのサンプルのt検定の場合、テスト統計にはSEMとサンプル平均が含まれるため、サンプルデータに依存します。 さらに、尾の高さを決定する自由度はサンプルサイズによって異なります。
t=x¯μ0sn
matti 2016年

1
私の処方は誤解を招くものでした。私はあなたが持っているどんな情報もサンプル自体を使うことができると言っていましたが、それは十分ではありません。p値を評価して分布を得るには、帰無仮説も仮定する必要があります。私もポストで再定式化します。
rapaio 2016年

1
...式を例にとると、それはを使用しますが、これは帰無仮説からの値だと思いますμ 0 H 0μ = μ 0tμ0H0:μ=μ0
rapaio

2

私が集めたものから、あなたはとを「フリップ」するほうが理にかなっていると主張しています。H 1H0H1

私は、仮説検定を矛盾による証拠として考えることが役立つと思います我々は仮定証拠がこれを拒否正当化し、そのような仮定が不備であることを示していることを示し、その後、真であることがの賛成で。H0H 1H0H1

これが機能するのは、を想定し、そこに分布を中心にと、観測の可能性/可能性を判断できるためです。たとえば、 vs. あり、テストから、真の平均値実際に0に等しい可能性が5%未満であると判断した場合、95でを拒否できます。信頼度%。H 0μ = 0 H 1μ 0 μ H 0H0H0:μ=0H1:μ0μH0

その逆は必ずしも真ではありません。実験を行って、帰無仮説が依然として成立する可能性が実際に30%あると判断したとします。nullを拒否することはできませんが、受け入れません。この状況は、(null)が真であることを示していませんが、それが偽であることを示す証拠はありません。H0

今、この状況をめくったと想像してみてください。を想定し、その結果から、の可能性が5%以下であることがわかったとします。それはどういう意味ですか?ヌルを拒否できることは確かですが、必ずしもを受け入れることができるのでしょうか?最初は私たちが真実だと思っていたものを受け入れることを正当化するのは難しいです。H 0 H 1H1H0H1

ことを示す偽であることは、我々は後にしている結果ではありません。を支持して議論したい。あなたが説明した方法でテストを行うことにより、が偽であると言う証拠がないことを示しています。これは、が真であると主張することとは微妙に異なります。H 1 H 1 H 1H0H1H1H1


仮説検定では不確実性を完全に排除することはできないので、私はそれを証明とは見なしません。多分私は私のポイントを十分に明確にしませんでした、しかし私は本質的にサンプリングの分布をにシフトするために意味的な理由よりむしろ論理的な理由をます。H0
matti

そして一般的に、H1はかなり曖昧(mu!= 0)であり、尤度計算が問題になります。それはベイジアンに行く人々にとってしばしば良いインセンティブだと思いますが。:)
Hao Ye
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.