ログ変換は、非正規データをt検定するための有効な手法ですか?


19

著者は、論文をレビューする際に、「正規分布の前提条件を満足するためにtテストが行​​われる前に、自然対数を使用して、歪んだ分布を示す連続的な結果変数が変換された」と述べています。

これは、特に基礎となる分布が必ずしも対数正規分布ではない場合に、非正規データを分析するのに受け入れられる方法ですか?

これは非常にばかげた質問かもしれませんが、これを以前に見たことはありません。


3
さて、初期分布が対数正規分布ではない場合、変換されたデータは正規性の前提条件を満たしていません。そのため、変換によって何が得られますか?
マクロ

@Macro-本当です!(+1)-彼らはおそらく、分布を対称に近づけたかっただけで、これはt検定の目的としては悪いことではありませんが、チェックして書き上げない限り、ログが変換は、事態を悪化させる可能性のある負のスキューを誘発しました
...-jbowman

2
正規性を満たすために行われ、最初に正規性がチェックされたため、その後に正規性がチェックされたと推測できます。ここの言語では強く暗示されています。
ジョン

10
対数のt検定は、変換されていないデータのt検定やノンパラメトリック検定とは異なります。ログのt検定は、(通常の)算術平均ではなく、幾何平均を比較します。これは、対数の使用が許容できるかどうかを判断する際のいくつかの重要な考慮事項の1つです(アプリケーションによっては許容される場合があります)。
whuber

回答:


9

正常ではないデータに遭遇した場合、通常、ある種の変換(対数、平方根などを使用)を適用しようとするのが一般的です。対数は、ゆがんだデータに対してかなり頻繁に良い結果をもたらしますが、この特定のケースで機能するという保証はありません。変換されたデータを分析するときは、上記の@whubersのコメントにも留意する必要があります。「対数のt検定は、変換されていないデータのt検定でもノンパラメトリック検定でもありません。 (通常の)算術平均ではありません。」

正常性への変換の後には、常に正常性の仮定を調査し、変換されたデータが「十分に正常」に見えるかどうかを評価する必要があります。これは、たとえばヒストグラム、QQプロット、および正常性のテストを使用して実行できます。t検定は、歪度の形での正規性からの逸脱に特に敏感であるため、スキューの代替に向けられた正規性の検定が望ましいでしょう。ピアソンのサンプルの歪度は、この場合に適した検定統計量です。n1i=1n(xix¯)3(n1i=1n(xix¯)2)3/2

ほとんどの場合機能するため、変換(対数など)を選択するよりも、指定されたデータを使用して変換を選択するためにBox-Coxプロシージャを使用することを好みます。ただし、これにはいくつかの哲学的な問題があります。特に、使用する変換を選択する際にサンプルからの情報を使用したため、これがt検定の自由度の数に影響するかどうか。

最後に、変換後のt検定または従来のノンパラメトリック検定を使用する代わりに、t検定のブートストラップアナログを使用することをお勧めします。正規性の仮定を必要とせず、変換されていない手段についてのテストです(他のことについてではありません)。


1
+1良い、思慮深い議論で、最後に良い勧告があります。t検定のブートストラップ/リサンプリング/置換バージョンの詳細については、stats.stackexchange.com / q / 24911の最新のスレッドを参照してください。
whuber

0

一般的に、t検定の実行に必要な前提条件が満たされていない場合、ノンパラメトリック検定を使用する方が適切です。


5
多分。ノンパラメトリック検定は、ほとんどの場合、平均ではなく中央値(または他のパーセンタイル)を比較するため、実際にはわずかに異なる質問に対処します。しかし、これは、データのログをt検定することについて具体的に(そして唯一)尋ねる現在の質問に対する有用な回答のようには見えません。
whuber
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.