比較したい2つのグループ(つまり、サンプル)のデータがありますが、サンプルの合計サイズは小さく(n = 29)、非常に不均衡です(n = 22 vs n = 7)。
これらのデータはロジスティックに収集するのが困難でコストがかかるため、明らかな解決策としての「より多くのデータの収集」はこの場合は役に立ちません。
いくつかの異なる変数(出発日、到着日、移行期間など)が測定されたため、複数のテストがあり、その一部は分散が大きく異なります(小さいサンプルほど分散が大きくなります)。
最初に同僚がこれらのデータに対してt検定を実行しましたが、一部はP <0.001で統計的に有意であり、別の者はP = 0.069で有意ではありませんでした。一部のサンプルは正規分布していましたが、その他は分布していませんでした。一部のテストでは、「等しい」分散からの大きな逸脱が含まれていました。
いくつか質問があります。
- ここでt検定は適切ですか?そうでない場合、なぜですか?これは、分散の正規性と平等性の仮定が満たされているテストにのみ適用されますか?
- 適切な代替案は何ですか?おそらく順列検定ですか?
- 不等分散はタイプIのエラーを膨らませますが、どうやって?そして、小さな不均衡なサンプルサイズはタイプIエラーにどのような影響を与えますか?