Log()
異分散データがあるため、負の値をに変換する方法を知りたいです。私はそれが式で動作することを読みましたLog(x+1)
が、これは私のデータベースでは動作せず、結果としてNaNを取得し続けます。たとえば、この警告メッセージが表示されます(負の値のいずれかで例を示すのに十分だと思うため、完全なデータベースを配置しませんでした)。
> log(-1.27+1)
[1] NaN
Warning message:
In log(-1.27 + 1) : NaNs produced
>
前もって感謝します
更新:
これが私のデータのヒストグラムです。化学測定の古生物学の時系列で作業しています。たとえば、CaとZnなどの変数の差が大きすぎる場合、何らかのタイプのデータ標準化が必要ですlog()
。そのため、関数をテストしています。
これは私の生データです
範囲、平均、負、ゼロ、正の値の頻度など、データについて詳しく教えてください。平均応答が正であると考えることが合理的である限り、ログリンクを使用した一般化線形モデルがデータにとって最も意味があると考えられます。それはあなたがまったく変身してはいけないということかもしれません。
—
ニックコックス
詳細を追加していただきありがとうございます。そのようなデータの場合、0には意味があり(平等!)尊重されるべきであり、実際に保存されます。そのため、その他の理由から、キューブルートを使用します。実際には、
—
ニックコックス
sign(x) * (abs(x))^(1/3)
ソフトウェアの構文に応じて詳細を変更する必要があります。立方根の詳細は、例えば参照してくださいstata-journal.com/sjpdf.html?articlenum=st0223(ESP参照。pp.152-3)我々使用立方根の中に正と負になることができ、応答変数のヘルプ可視化への自然.com / nature / journal / v500 / n7464 / full /…
違いの代わりに元の変数を変換しないのはなぜですか?
—
whuber
log(x+1)
変換だけのために定義されますx > -1
その後として、x + 1
正です。データを変換するログを作成する理由を知っておくといいでしょう。