回答:
これは、変数が数桁にわたる場合に行われます。収入は典型的な例です。その分布は「べき法則」です。つまり、収入の大部分は小さく、ほとんどの収入は大きくありません。
このタイプの「ファットテール」分布は、対数の数学的特性のため、対数スケールで研究されます。
含意する
そして
これにより、大きな差
ほとんどの場合、分布が歪んでいるためです。対数は変数のダイナミックレンジを自然に縮小するため、スケールがそれほど大きく歪まない限り、差異は保持されます。一部の人々が1億人のローンを受け取り、一部の人々が10000人と0人を獲得したことを想像してください。対数は問題を解決します。
対数変換が有用なさらに別の理由は、という事実のために、比率データに関係していlog(A/B) = -log(B/A)
ます。生のスケールで比率の分布をプロットすると、ポイントはの範囲に入り(0, Inf)
ます。1未満の比率はプロットの小さな領域に押し込まれ、さらに、比率をの(B/A)
代わりにに切り替えると、プロットは完全に異なって見えます(A/B)
。これを対数目盛で行うと、範囲はになり(-Inf, +Inf)
、1より小さい比率と1より大きい比率がより均等に分散されることを意味します。比率を反転することにした場合は、プロットを0の周りに反転するだけです。それ以外はまったく同じに見えます。対数スケールでは、比率をとして表示するかどうかは重要ではありません1/10 or 10/1
。これは、比率を明確に選択できない場合に役立ちます。
対数正規分布を見てください。
人々は、スケールなどを圧縮すると考えるためにログを使用するかもしれませんが、ログの原則的な使用法は、対数正規分布を持つデータを操作することです。これは、すべての価値がプラスであり、ほとんどが比較的控えめですが、一部は非常に大きい給与、住宅価格などのようなものになる傾向があります。
データのログを取ることができ、それが正常になった場合、明確な平均、標準偏差(したがってzスコア)、対称性などの正規分布の多くの機能を利用できます。
同様に、ログの追加は、ログなしの値の乗算と同じです。つまり、エラーが加法的な分布(つまり、パーセンテージベース)に変わったということです。OLS回帰などの手法では、通常のエラー分布が必要になるため、ログを使用すると、その適用範囲が加算プロセスから乗算プロセスに拡張されます。