私は「指数関数的」とは呼ばないでしょう。たとえば、ログは明らかに左スキューであり、モーメントスキューはわずか2です。
1)指数データとn 500に近いt検定を使用するのは 問題ありません。
a)検定統計量の分子は大丈夫です:データが共通のスケールで独立した指数関数的であり(それよりも実質的に重くない)、平均値は観測数に等しい形状パラメーターでガンマ分布します。その分布は、形状パラメーターが約40を超えると非常に正規に見えます(精度が必要なテールまでの距離によって異なります)。
これは数学的な証明が可能ですが、数学は科学ではありません。もちろん、シミュレーションで経験的に確認できますが、指数関数性が間違っている場合は、より大きなサンプルが必要になる場合があります。これは、n = 40の場合、指数データのサンプル合計(したがってサンプル平均)の分布がどのように見えるかです。
非常にわずかなスキュー。この歪度は、サンプルサイズの平方根として減少します。したがって、n = 160では、スキューの半分になります。n = 640の場合、スキューは4分の1です。
これが事実上対称的であることは、平均について裏返し、上にプロットすることで確認できます。
青がオリジナルで、赤が反転します。ご覧のとおり、それらはほぼ偶然です。
-
n=40
n=500
-
c)しかし、実際に重要なのは、ヌルの下での統計全体の分布です。分子の正規性は、t統計にt分布を持たせるには不十分です。ただし、指数データの場合は、それほど問題ではありません。
n=40n=500n=500
ただし、実際の指数データでは、平均が異なる場合にのみ標準偏差が異なることに注意してください。指数の推定が当てはまる場合、nullの下では、異なる母集団の分散が代替の下でのみ発生するため、異なる母集団の分散について特に心配する必要はありません。したがって、等分散t検定は引き続き問題ありません(この場合、ヒストグラムに表示される上記の優れた近似は、わずかに優れている場合もあります)。
2)ログを取得しても、それを理解できる場合がありますが、
logλ1≠logλ2λ1≠λ2
[ログでそのテストを行う場合、その場合は等分散テストを行うことをお勧めします。]
つまり、上記のように、おそらく接続を正当化する1つまたは2つの文を介在させるだけで、参加メトリックのログではなく、参加メトリック自体について結論を書くことができるはずです。
3)他にもできることがたくさんあります!
a)指数データに適したテストを実行できます。尤度比ベースのテストを導き出すのは簡単です。偶然にも、指数データの場合、片側の場合のこの状況に対して、小標本F検定(平均の比率に基づいて)を取得します。一般に、2つのテールを持つLRTは、小さなサンプルサイズの場合、各テールで等しい比率を持ちません。(これはt検定よりも優れた検出力を持っているはずですが、t検定の検出力は非常に合理的である必要があり、サンプルサイズに大きな違いはないと思います。)
b)順列検定を行うことができます-必要に応じてt検定に基づいて行うこともできます。したがって、変化するのはp値の計算だけです。または、ブートストラップベースのテストなど、他のリサンプリングテストを行うこともできます。これには十分な能力がありますが、分布に関連して選択する検定統計量に一部依存します。
c)ランクベースのノンパラメトリック検定(Wilcoxon-Mann-Whitneyなど)を実行できます。分布が異なる場合、スケールファクター(指数関数を含むさまざまな歪んだ分布に適切)だけが異なると仮定すると、スケールパラメーターの比率の信頼区間を取得することもできます。
[そのために、ログスケールで作業することをお勧めします(ログ内の位置シフトはスケールシフトのログです)。p値は変更しませんが、ポイント推定とCI制限を累乗してスケールシフトの間隔を取得できます。]
これも、指数関数的な状況にある場合、かなり良いパワーを持つ傾向がありますが、t検定を使用するほど良くない可能性があります。
ロケーションシフトの代替案のかなり広範なケースセット(たとえば、分散と歪度の両方の不均一性がnullの下にある)を考慮するリファレンスは次のとおりです。
FAGERLAND、MW及びL.サンドビック(2009)、
「不等分散を持つ歪んだ分布のための5つの二サンプル位置テストのパフォーマンス」
現代臨床試験、30、490から496まで
一般に、ウェルチU検定(ウェルチが検討したいくつかのテストのうちの1つと、テストした唯一のテスト)を推奨する傾向があります。まったく同じWelch統計を使用していない場合、推奨事項は多少異なる場合があります(おそらくそうではありません)。[分布が指数関数的である場合、ログを取る場合を除き、スケールの代替に関心があることに注意してください...その場合、不均等な分散はありません。]