Box-Cox変換はどのように有効ですか?


8

Box-Cox変換は、データを正規分布に変換します。

それは適切なテクニックでさえどうですか?データが正規分布からのものでない場合はどうなりますか?誰かがBox-Cox変換を盲目的に適用するにはどうすればよいですか?

言い換えると、データが正常に分布していないのに、なぜBox-Cox変換を適用するのでしょうか。

Box-Cox変換は、データを正規に分散する必要があるときに使用されますか?


(回帰/分散分析で)モデル、ボックス・コックス変換をより分散、参照均質化することに注意stats.stackexchange.com/questions/310003/...
はKjetil bがHalvorsenの

3
明らかに、私はデイビッドコックス卿ではなく、彼とは関係ありませんが、コックスが大文字のCを取得しない場合は特に痛みを感じ、Boxと同じくらいの痛みを感じます。
Nick Cox

回答:


19

ここに1つのステートメントと6つの質問があります。

ただし、まずは世界中の同名の人物と継続的な統計の歴史に代わって、大文字と小文字を区別した「Box-Cox」という名前が標準であることに注意してください。

Box-Cox変換は、データを正規分布に変換します。

せいぜい、それが目標です。それは、おおよそでも、常に達成できるわけではありません。たとえば、本質的に一連のスパイクである分布は、別の一連のスパイクに変換することはできません。

それは適切なテクニックでさえどうですか?

逆に、それはどのような意味で不適切ですか?変換の一般的な考え方は、変換されたスケールで何が起こっているのかを確認して分析する方が簡単であるということですが、特に、正規分布への近似が提供する多くの手法があります。 、よく言われるように、要約と推論のための少なくとも比較的理想的な条件。一般化線形モデルは、実際に応答変数の変換を義務付けずに、変換されたスケールでフィッティングするという考え方を取り入れていることに注意してください。

データが正規分布からのものでない場合はどうなりますか?

パズルが何であるかは明確ではありません。データが正規に分散されていない場合にのみ、正規性への単純な変換があるかどうかの問題が生じます。

誰かがBox-Cox変換を盲目的に適用するにはどうすればよいですか?

上記のように。一部の人々は彼らが使用するすべての統計的手法を盲目的に適用し、統計的人々は承認するのではなくそれを不承認にする傾向があります。同時に、人生は短く、ほとんどの技術の使用には信頼の要素があります。誰もが自分の行うことすべてを導き出し、正当化することができないからです。

他の質問は同じ質問を言い換えたように見えるか、またはニュアンスがありません。しかし、次に、単純なキーであると思われるものを繰り返します。正規分布は多くの場合理想的ですが、その理想が満たされない場合でも、多くの手法がうまく機能します。

この距離では、1964年のBox-Cox公式の主な貢献は、

  1. データ自体がどの変換が最も適切であるかを教えてくれるという考え。(変換がない場合でも、適用する価値があるほど役立つ場合があることを付け加えます。)BoxとCoxは、データに基づく変換の選択をさまざまな方法で形式化しましたが、重要な点は、さまざまな変換を体系的に試すことです。(あまりにも頻繁に、変換の検索は暗闇の中で突き刺されているように見えます。人々が対数と2乗を試みたが、何もうまくいかないと人々が言っ​​たときのようです。)

  2. 使用中のほとんどの変換、特に正の測定変数またはカウントされた変数は、べき乗だけでなく対数も含むファミリーに属しているという考え。このアイデアはまた、特にTukey(1957)によって以前に広く強調されていました。その論文は奇妙にBoxとCoxから引用されていませんが、BoxとCoxの定式化、それに続くTukeyの後の研究は、アイデアの普及により成功しているようです。家族の。先に述べたように、家族からの選択に重点を置くことで、変革の選択というアイデアがより体系的になり、その場限りではなくなります。Box-Coxは、決定がどうあるべきかを示すものであり、命令ではないことに注意してください。彼ら自身の実際の例では、彼らは対数と逆変換を選択し、それにより彼らの推定手順によって与えられたパワーを四捨五入します。実際、どちらの例も、経験豊富なアナリストが論文の前に同じ変換を選択するようなものでした。

Box、GEPおよびCox、DR1964。変換の分析。Royal Statistical Society Series B 26のジャーナル:211–252。

Tukey、JW1957。変換の比較解剖学について。数学的統計の年報 28、602-632。doi:10.1214 / aoms / 1177706875。http://projecteuclid.org/euclid.aoms/1177706875


とても良い反応です!したがって、データが歪んでいるが正常に見える場合、ボックスcoxまたはログ変換が機能します。

2
感謝の意を表しますが、あなたのコメントは非常に不可解です。Box-Cox、またはその他の多くの保証はありません。「ゆがんでいるが正常に見える」:正確に何を意味するのかわからない。Box-Coxは、高度に歪んだ分布で動作します(逆数およびより高い負の累乗は非常に強力な変換です)。Box-Coxには対数変換が含まれます。対数は同じです。Box-Coxは、データが正常でない場合、「実行するのはひどいこと」です。これは、回答ですでに対処されています。データが正常であれば、Box-Coxは不要です。非正規分布への適用がポイントです。
Nick Cox

1
また、Box-Coxは非定常分散の処理によく使用されることも付け加えておきます。
Aksakal

1
@Aksakal変換の偶発的な利点の例として、ある意味で動作を改善する変換が別の動作を改善することがよくあると思います。本当に運が良ければ、たとえば対数を取ると、正規性、線形性により近い近似を促進できますとホモスケダスティシティ。しかし、何も保証されていません。カウントの場合、ログ、ルート、およびその間の変換には、それぞれ異なる長所があります。Box-Coxの厳密な意味が時系列または確率過程に適用されることを私は知りません。それ以外の参照または引数がある場合は、それらを提供してください。
Nick Cox

1
@CliffAB "目標[...]は常に達成できるわけではありません。" "Box-Coxは決定がどうあるべきかを示すものであり、命令ではないことに注意してください。" だから、これがテクニックを売り越しているとは思いません。確かに、他に新しい研究で正確に再現できるものは何ですか?
Nick Cox
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.