いくつかの(すべてではないにしても)パラメトリック仮説検定がランダムサンプリングを前提としているのはなぜですか?


12

Z、tなどのテストでは、データがランダムサンプリングに基づいていることを前提としています。どうして?

私は実験的な研究を行っていると仮定します。そこでは、外部の妥当性よりも内部の妥当性を重視しています。したがって、母集団全体の仮説を推測しないことを受け入れたので、私のサンプルに少し偏りがあるかもしれません。また、グループ化はランダムに行われます。つまり、サンプルの参加者を便宜上選択しますが、異なるグループにランダムに割り当てます。

なぜこの仮定を無視できないのですか?


サンプリング手法がバイアスを導入する場合、それは「ランダム」ではありません。バイアスを導入しない場合は、「ランダム」です(ランダムの一部の定義では、-)。7番目のサンプルごとに単純にカウンターサンプルと一致するサンプルサイズを作成するサンプリングスキームがあります。しかし、私はその選択に特別な側面がないことを知っていたので、非ランダムサンプリングプロセスと考えられるものは依然として事実上ランダムでした。宝くじでボール1、2、3、4、5、6を選択するのと同じです。他のシーケンスと同様にランダムです。
フィリップオークリー

1
@PhilipOakley:宝くじでボール1、2、3、4、5、6を選択すると、他の選択と同じ勝ちのチャンスが得られますが、賞品を他の人と共有しなければならない可能性が高いため、予想される賞金が減ります同じ考えを持っていた
ヘンリー

1
@Philipで説明されているような体系的なサンプリングは、多くの場合、単純なランダムサンプルを生成したかのように分析されますが、落とし穴があります。たとえば、製造プロセスを毎日測定し、7回ごとにサンプリングする場合、(明らかに)同じ日にサンプリングするため、結果に曜日の影響が混同される可能性があります。毎週。ランダムでないサンプルを扱うときは、そのような微妙な点を考えて対処するために一生懸命働く必要があります。
whuber

1
@whuber、もちろん。これらのことについて一生懸命に(そして広く)考えなければなりません!! 私の場合、数百のイベントがあり、間隔が長いビデオがあったため、単純なロジスティック回帰のために非イベントセットのデータサイズを減らす必要がありました(各フレームは独立して考慮され、フレーム間の変化はほとんどありません)大量の非イベントフレームをドロップするのは妥当でした。時系列の側面は個別に考慮されました。
フィリップオークリー

1
@Philipおもしろいことに、ランダム性が存在しないというコメントを書いているのとほぼ同時に、NISTはそれが存在すると主張するプレスリリースを発行しました。アカウントは、Natureの今日(2018年4月4日)の号に掲載されています。
whuber

回答:


18

実際のサンプルよりも幅広いグループの推論を行っていない場合、そもそも統計的検定の適用はなく、「バイアス」の問題は発生しません。この場合、既知のサンプルの記述統計を計算するだけです。同様に、この場合のモデルの「妥当性」に疑問はありません。変数を観察し、その値、およびそれらの値の側面の説明を記録するだけです。

サンプルを超えて大規模なグループについて推論する場合は、統計が必要になり、サンプリングバイアスなどの問題を考慮する必要があります。このアプリケーションでは、ランダムサンプリングは信頼性を高めるのに役立つプロパティになります関心のあるより広いグループの推論。ランダムサンプリングを行っていない場合(および母集団に基づいた標本の確率がわからない場合)、母集団について信頼できる推論を行うことは困難/不可能になります。


5

実際の科学研究では、真のランダムサンプリングから得られたデータを持つことは非常にまれです。データはほとんど常に便利なサンプルです。これは、主に一般化できる母集団に影響します。つまり、たとえそれらが便利なサンプルであったとしても、それらはどこかから来たものであり、どこで、そしてそれが意味する制限について明確にする必要があるだけです。あなたのデータが何かを代表していないと本当に信じているなら、あなたの研究はどのレベルでも価値がないだろうが、それはおそらく真実ではない1。したがって、少なくともヘッジされた、または修飾された意味で、どこかから引き出されたサンプルを検討し、これらの標準テストを使用することが合理的です。

ただし、テストには別の哲学があり、これらの仮定とそれらに依存するテストから離れるべきだと主張しています。テューキーはこれを支持していました。代わりに、ほとんどの実験的研究は(内部的に)有効であると見なされます。これは、研究単位(患者など)が無作為にアームに割り当てられたためです。これを考えると、ランダム化が正しく行われたと仮定するだけの置換テストを使用できます。これについて心配しすぎることへの反論は、置換テストは通常​​、対応する従来のテストと同じことを示し、実行する作業が増えるということです。繰り返しになりますが、標準的なテストでも問題ありません。

1.これらの線に沿って、より多くの場合、ここでの私の答えを読むのに役立つかもしれません:調査における母集団とサンプルの識別


3

Z、tなどのテストは、関連する統計の既知のサンプリング分布に基づいています。一般的に使用されるこれらのサンプリング分布は、ランダムなサンプルから計算された統計に対して定義されます。

非ランダムサンプリングに関連するサンプリング分布を考案することも可能な場合がありますが、一般的にはおそらく不可能です。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.