「反転」シャピロ・ウィルク


11

ウィキペディアによれば、シャリポウィルク検定は、帰無仮説()「母集団は正規分布である」を検定します。H0

「人口正規分布していない」を使用した同様の正規性検定を探してます。H0

そのようなテストがある、有意水準 iffを棄却する値を計算したいと思います。私の人口が正規分布していることを証明します。H 0 α P < αpH0αp<α

してくださいノートSharipo・ウィルク検定を使用して受け入れていることを IFFある間違ったアプローチ、それは文字通り「我々はH0が保持していないことを証明する十分な証拠を持っている」を意味するから。 p > αH0p>α

関連スレッド- の意味 -値はp正常では役に立たないテストしていますか?、しかし私は私の問題の解決策を見ることができません。

質問:どのテストを使用する必要がありますか?Rで実装されていますか?


6
「正規分布ではない」という帰無仮説は使用できません。この空間には、正規分布に任意に近いが完全ではないすべての分布が含まれます。あなたは私にどんな有限のデータのセットもくれます。私は経験的分布を選択しましたが、これは正規ではないため、null空間に属しています。拒否できません。
A. Webb

5
この質問は前の質問と同じですが、不可能を求めています。適切な答えは、統計的仮説検定がどのように機能するかを説明します。そのため、他の質問へのコメントでstats.stackexchange.com/questions/31を指摘しました。
whuber

5
「正規分布ではない」という帰無仮説は不可能ですが、帰無仮説は「等価性検定の線に沿って、少なくともと同じくらい異なる正規適合度統計の絶対値で分布します」。言い換えれば、「少なくともこれだけ正常でない」というヌルに対してテストできるべきです。@gungは彼の答えでこれを正確に示唆しています。ε
Alexis

回答:


10

データ正常に配布されるというテストなどはありません。データが通常は配布されないというテストのみがあります。したがって、Shapiro-Wilk where(他にもたくさんあります)のようなテストがありますが、nullが母集団が正常ではないという対立検定であり、対立仮説は母集団が正常であるというものです。 H0:normal

あなたができることは、あなたが気になっている正常性からのどのような逸脱(例えば、歪度)と、それが気になる前にその逸脱がどれほど大きくなければならないかを理解することです。次に、データの完全な正規性からの偏差が臨界値よりも小さいかどうかをテストして確認できます。一般的なアイデアの詳細については、ここで私の答えを読むと役立つ場合があります。なぜ統計学者が有意ではない結果が帰無仮説を受け入れるのではなく「帰無を拒否できない」と言うのですか?


5

p <αの場合に有意水準αでH0を棄却するp値を計算したい。私の人口が正規分布していることを証明します。

正規分布は、データが一連の追加のiidイベントによって生成されたときに発生します(下のquincunx画像を参照)。それはフィードバックも相関もないことを意味します、それはあなたのデータを導くプロセスのように聞こえますか?そうでない場合、それはおそらく正常ではありません。

あなたのケースでは、この種のプロセスが発生している可能性があります。あなたが「証明」するのに最も近いのは、人々が思いつくことができる他のどのディストリビューションも除外するのに十分なデータを収集することです(これはおそらく実用的ではありません)。別の方法は、いくつかの理論と他のいくつかの予測から正規分布を推定することです。データがそれらすべてと一致していて、だれも別の説明を考えることができない場合、それは正規分布を支持する良い証拠になります。

https://upload.wikimedia.org/wikipedia/commons/7/7f/Quincunx_%28Galton_Box%29_-_Galton_1889_diagram.png https://en.wikipedia.org/wiki/Bean_machine

特定の分布をアプリオリに期待しない場合でも、正規分布を使用してデータを要約することは依然として妥当ですが、これは基本的に無知からの選択であることを認識してくださいhttps://en.wikipedia.org/wiki/ Principle_of_maximum_entropy)。この場合、母集団が正規分布であるかどうかを知りたくはなく、正規分布が次のステップの妥当な近似であるかどうかを知りたいです。

その場合は、データ(または同様の生成データ)と、それを使用する予定の説明を提供し、「この場合、正常性をどのように想定すれば誤解を招く可能性がありますか?」


私は実際にデータが正常であることを知っています(独立したコンピューターでの独立した測定)。ただし、私の論文ではいくつかの仮定を立てる必要があります..説明と例に感謝します:)
petrbel

1
ちなみに、クリーガーは、クリーガー、N。(2012)でGaltonのQuincunxの使用についての素晴らしい批評を提供しています。「人口」とは誰で何ですか?「人口の健康」を理解し、健康の不平等を是正するための歴史的な議論、現在の論争、および含意。The Milbank Quarterly、90(4):634–681。
Alexis

@petrbelその状況は、上記の状況とは微妙に異なります。各観測値がiidであるが、データを生成するプロセスがそうでないquincunxを考案することができます。対数正規の例については、ここを参照してください:LIMPERT et al。科学全体の対数正規分布:キーと手がかり。2001年5月/巻 51 No. 5.バイオサイエンス。
Livid 2015年

1
@Alexis Krieger(2012)がLimpertらの図を再現しているのがわかります。(2001)そして、petrbelが見逃した点を指摘します。「構造を変更すると、同じオブジェクトでも結果の確率が変わり、それによって異なる人口分布が作成される可能性があります」。
Livid 2015年

2

データの正規性の仮定を「証明」することはできません。それに対する証拠を仮定としてのみ提供します。Shapiro-Wilk検定はこれを行う1つの方法であり、正規性の仮定を正当化するために常に使用されます。その理由は、正規性を仮定することから始めることです。それからあなたは尋ねます、私のデータは私が愚かな仮定をしていることを示唆していますか?それでは、Shapiro-Wilkを使用してテストします。帰無仮説の棄却に失敗した場合、データは、愚かな仮定をしていることを示唆していません。

注目すべきは、人々はこの同様のロジックを実際にいつも使用している-Shapiro-Wilkテストのコンテキストだけでなく。彼らは線形回帰を使用し、散布図を見て、線形回帰が愚かな考えであるかどうかを確認します。または、彼らは異分散性を仮定し、エラー項をプロットして、これが愚かな考えであるかどうかを確認します。Y,X


あなたが説明するその実践は、正確にpetrbelが述べた間違ったアプローチです。テストは通常​​一貫しているため、サンプルサイズが大きいほど、正規性の仮定がばかげた考えであると宣言する確率が高くなります。サンプルサイズが大きいほど、ほとんどのプロシージャの漸近的な堅牢性により、正規性の仮定はそれほど重要ではないため、これはばかげています。
HorstGrünbusch15年

@HorstGrünbuschShapiro-Wilkテストがデータが正常であるという仮定をテストする有効な方法であることに同意しますか?
TrynnaDoStat

あなたがそれが有効なアプローチであることに同意した場合、私はあなたが私の答えで何に同意しないかわかりません。
TrynnaDoStat

いいえ。ここの引数を参照してください:stats.stackexchange.com/questions/2492/…。また、2つのサンプルの分散が同じであるという帰無仮説を検定し、分散が有意に異なる場合にのみSatterthwaite検定を使用することはできません。この複合手順を自分でシミュレートするだけです。最大タイプIエラー率を生成できます。2α
HorstGrünbusch15年

@HorstGrünbusch私の答えに関するあなたの問題は、一般的な仮説検定のアイデアに関係しているようです。具体的には、サンプルサイズが無限に近づくと、多くの状況で仮説検定が確率1でnullを拒否するという事実です。
TrynnaDoStat 2015年
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.