ある


12

私の同僚は、応答変数を1のべき乗に変換してから、いくつかのデータを分析したいと考えています。(つまりy0.12518y0.125)。

私はこれに不快感を覚えていますが、その理由を説明するのに苦労しています。この変換の機構的な理由は考えられません。これまでに見たこともないし、タイプIのエラー率などを膨らませるのではないかと心配していますが、これらの懸念をサポートするものは何もありません!

さらに、私の同僚は、これらの変換されたモデルが、AIC比較で変換されていないモデルよりも優れていることを発見しました。これは、それ自体でその使用を正当化しますか?


9
y1/8ログyy


5
変換された従属変数を持つモデル間のAICを有意義に比較することはできません。(独立変数の変換は問題あり
ません

5
y=(xp1)/pp

3
これは、ゼロが発生した場合、この変換が対数の代わりになる可能性があるという考えに関する小さなリフです。一般化線形モデルの対数リンクは、平均応答が指数関数的に変化すると言いますが、それらの値がすべて正であるとは仮定しません。したがって、データの一部のゼロを許容します。おおよその意味は、可能な場合は陽性であるべき、または陽性であるということです。たとえば、報告されたゼロ(サンプル中のゼロ検体、機械によるゼロ濃度)は、時々検出されないことを意味します。その素晴らしい名前にもかかわらず、Box-Coxは、GLMに自然なつながりがあるときはいつでも売られすぎているようです。
ニックコックス

回答:


10

応答に任意の値で累乗変換(Tukey、Box-Cox)を適用することは一般的な方法です。その観点から、私はあなたの1/8の価値に関して特別な懸念はないと思います-その変換があなたに良い残差を与えるなら、それを選んでください。

もちろん、変換によってフィットする機能的な関係が変化し、1/8が機械的に意味をなさないことがありますが、物理的なパラメーターを外挿したりフィットしたりすることが目的ではない場合、それは私には関係ないでしょうしかし、効果の符号で適切なp値を取得するために(これは回帰の通常のユースケースだと主張します)。その目的のために、あなたの唯一の懸念は、関数が予測値のドメインのデータに適合すること(wrt平均と残差変動)であり、それはチェックしやすいことです。

パワー変換の最適な値が不明で、異なるオプションを比較したい場合、パワー変換により応答のスケールが変更されるため、AIC /尤度値を直接比較しないください。幸いなことに、変換の修正を計算するのは比較的簡単であることがわかります。その結果、異なる修正を(修正された)尤度で比較できます(たとえば、こちらを参照)。

Rでは、これはMASS :: boxcoxに実装されています-これは、電力に適切な値を選択する便利な方法です。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.