背景:私は仮説テストの仕事をしている同僚にプレゼンテーションを行っており、そのほとんどをうまく理解していますが、他の人に説明するだけでなく、理解しようとする結び目で自分を縛っている側面があります。
これは私が知っていると思うことです(間違っている場合は修正してください!)
- 分散がわかっている場合は正常な統計、分散が不明な場合は分布に従う
- CLT(中央極限定理):サンプル平均のサンプリング分布は、十分に大きいに対してほぼ正規です(になる可能性があり、大きく歪んだ分布の場合は最大になる可能性があります)
- -distributionは、自由度のために通常考慮することができる
次の場合に -testを使用します。
- 母集団の正規分布と分散が既知(任意のサンプルサイズ)
- 集団正常、分散不明、(CLTによる)
- 人口二項、、n q > 10
次の場合に -testを使用します。
- 母集団は正常、分散は不明、
- 母集団または分散に関する知識はなく、ですが、サンプルデータは正常に見える/テストなどに合格しているため、母集団は正常であると見なすことができます
だから私は残っています:
- サンプルについてと< ≈ 300(?)、人口と知られている分散/不明についての知識がありません。
だから私の質問は:
サンプリング分布が非正規に見える場合、平均のサンプリング分布が正常である(つまり、CLTが作動している)と仮定できるのは(母集団の分布または分散に関する知識がない場合)です。一部のディストリビューションにはが必要であることは知っていますが、n > 30の場合は常にzテストを使用すると言うリソースがあるようです...
よくわからない場合は、データが正常かどうかを調べます。サンプルデータが正常に見える場合、検定を使用します(母集団が正常であり、n > 30であるため)。
不明なケースのサンプルデータが正常に見えない場合はどうですか?まだ -testまたはz -testを使用する状況がありますか、または常にノンパラメトリックテストを変換/使用することを検討していますか?CLTにより、nの値によって平均のサンプリング分布は正規に近似することがわかりますが、サンプルデータはそのnの値が何であるかを教えてくれません。サンプルデータは非正規であり、サンプル平均はnormal / tに従います。実際に平均のサンプリング分布が正規/ tであったが、それがわからなかったときに、ノンパラメトリック検定を変換/使用する場合がありますか?