変換後もまだ正常ではないデータで分散分析を行う方法は?


8

私は、3つの異なる時点での敗北と挟み込みの主観的な評価に、敗北と挟み込みを誘発する状態が及ぼす影響を調べています。

ただし、主観的な評価は通常は分散されません。私はいくつかの変換を行いましたが、平方根変換が最もうまく機能しているようです。ただし、正規化されていないデータの側面がまだいくつかあります。この非正規性は、最高の敗北と捕獲の評価があると予想した時点で、高捕獲高敗北条件の負の歪度として現れます。その結果、このスキューは実験的な操作によるものであると主張することができると思います。

操作を考慮して、正規性の欠如にもかかわらず、このデータに対して分散分析を実行することは許容されますか?それともノンパラメトリック検定がより適切でしょうか?もしそうなら、4x3混合ANOVAの非パラメトリックな同等物はありますか?

回答:


15

正規分布する必要があるのは残差であり、応答変数の周辺分布ではありません。

私は変換を使用してみて、分散分析を行い、残差をチェックします。使用する変換に関係なく、それらが著しく非正常に見える場合は、フリードマン検定などのノンパラメトリック検定に切り替えます。


1
+1。注目すべきは、スプレッド対レベルのプロット(TukeyのEDAで説明)など、変換を調査するためのかなり単純な正式な手順があることです。
whuber

3

負に歪んだデータの場合、別のデータ変換(対数または平方根など)を適用する前に、データを反映して正に歪める必要がある場合があると思います。ただし、これは結果の解釈を困難にする傾向があります。

あなたのサンプルサイズは何ですか?正確な大きさにもよりますが、パラメトリックテストはかなり良い推定値を与える可能性があります。

それ以外の場合は、ノンパラメトリックな代替策として、フリードマン検定を試すことができます。

さらに、4x3混合ANOVAの代わりに、明示的な時間変数を含めて、反復測定に対してMANOVAを実行することもできます。主な違いは、球形度の仮定が緩和されている(または、推定されている)ことと、結果変数のすべての時点が一度に当てはまることです。


FWIW、1より大きいパワーのBox-Cox変換は、負のスキューを低減します。ただし、Rob Hyndmanの対応を考慮すると、これは最初に試すことではありません。
whuber

2

Boxcox変換(MASSパッケージにあります)は、負に歪んでいるデータと正に歪んでいるデータで同様に機能します。参考までに、y〜1のような関数に数式を入力し、最初にyがすべて正であることを確認する必要があります(abs(min(y))のような定数を追加するだけではない場合)。曲線のピークを見つけるには、関数のラムダ範囲を調整する必要がある場合があります。それはあなたに選択するのに最適なラムダ値を与え、そしてあなたはこの変換を適用するだけです:

b <- boxcox(y~1)
lambda <- b$x[b$y == max(b$y)]
yt <- (y^lambda-1)/lambda
#you can transform back with
ytb <- (t*lambda+1)^(1/lambda)

次に、データが正常かどうかを確認します。

#you can transform back with
ytb <- (t*lambda+1)^(1/lambda)
#maybe put back the min
ytb <- ytb - abs(min(y))
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.