ログスケールはいつ適切ですか?


57

時系列グラフのy軸など、特定の状況でグラフ化/グラフ化が適切な場合にログスケールを使用することを読みました。しかし、なぜそうなのか、それが適切な場合についての明確な説明を見つけることができませんでした。私は統計学者ではないので、この点を完全に見逃しているかもしれないことを覚えておいてください。もしそうなら、改善策の方向性に感謝します。


10
これは正式な答えではありませんが、変数が数桁に及ぶ場合、ログスケールで視覚化するのが目に優しい(そしてより有益な)場合がよくあります。
マクロ

マクロは理にかなっています(特に、それを理解できる聴衆がいる場合に!)
dav

1
:あなたは、特定の応答を待っている間、あなたはこの使用密接に関連スレッドを見つけることができstats.stackexchange.com/questions/298。チャート作成に関しては、「従属変数」を「y軸」として実りあるものと解釈できます。次に、ここに表示されている多くの密接に関連した質問を見てください。
whuber

3
また、FYI Naomi Robbinsには、このトピックに関する非常に簡単な記事があります。これは興味深いものです。いつチャートやグラフで対数目盛を使用すべきですか?
アンディW

Whuber、余分なリンクを指摘してくれてありがとう。私はそれらのいくつかを見ましたが、すべてではありませんでした。
ダブ

回答:


51

これは非常に興味深い質問であり、あまりにも多くの人が考える質問です。ログスケールが適切な方法はいくつかあります。最初で最もよく知られているのは、マクロのコメントで言及されたものです。ログスケールでは、小さな値をグラフの下部に圧縮することなく、広い範囲を表示できます。

ログスケーリングを好む別の理由は、データがより自然に幾何学的に表現される状況です。例は、データが生物学的メディエーターの濃度を表す場合です。濃度を負にすることはできず、ばらつきはほぼ常に平均に比例します(つまり、不均一分散があります)。対数目盛を使用するか、同等に対数濃度をプライマリとして使用すると、測定は不均一な変動性を「修正」し、両端に制限のないスケールを与えます。濃度はおそらく対数正規分布しているため、対数スケーリングを行うと非常に便利な結果が得られます。これは間違いなく「自然」です。薬理学では、薬物濃度の対数目盛を使用する頻度がはるかに高く、

ログスケールのもう1つの正当な理由は、おそらく時系列データに関心があるものですが、部分的な変更を同等にするログスケールの機能に起因しています。退職後の投資の長期的なパフォーマンスの表示を想像してください。明日の関心は今日の投資(大まかに言って)に依存するため、これは(指数関数的に)ほぼ指数関数的に成長します。したがって、パーセンテージでのパフォーマンスがかなり一定であったとしても、資金のグラフは右端で最も急速に成長したように見えます。対数目盛では、一定のパーセンテージ変化は一定の垂直距離と見なされるため、一定の成長率は直線と見なされます。多くの場合、これは大きな利点です。

対数スケールを選択するもう1つのもう少し難解な理由は、値がxまたは1 / xとして合理的に表現できる状況にあります。私自身の研究からの例は血管抵抗であり、これは相反する血管コンダクタンスとしても合理的に表現できます。(状況によっては、血管の直径を抵抗力またはコンダクタンスの力と考えることも賢明です。)これらの測定値のいずれも、他のものよりも現実性がなく、両方とも研究論文で見つけることができます。それらが対数的にスケーリングされている場合、それらは単に互いに否定的であり、どちらを選択しても実質的な違いはありません。(血管の直径は、すべてログスケールされている場合、一定の乗数によって抵抗およびコンダクタンスと異なります。)


すばらしい答えをありがとう!ただし、「値はxとして合理的に表現できる」ことを詳しく説明できますか?
ktdrv

4
@ktdrvいくつかのことは、どちらの方法でも意味があります。漁師の能力を文書化するとします。1日に捕獲された魚の数をカウントしたり、連続して捕獲される間隔を測定したりできます。どちらの測定も理にかなっていますが、互いに非線形に関連しています。それらは相互にスケーリングされた相互関係であるため、1対1で相互に変換できます。間隔のログと1日あたりの数のログは互いに線形関係にあり、一定の(負の)係数だけ異なります。
マイケルルー

1
マイケル、すばらしい答えをありがとう。私は認めなければならない、あなたのすべてのポイントをふるいにかけるのに私はしばらく時間がかかった(そして「異端分散」のようないくつかの用語をグーグルしなければならなかった)。私はまだ答えの本当の影響が私の仕事に何を意味するのかを正確につなぎ合わせていますが、私が道に沿って私を指す一般的な方向といくつかのガイドラインに感謝しています。
ダブ

最後の段落について:値を再表現する2つの主な理由は、分散を安定させることと、他の変数との関係を線形化することです。ほとんどの場合、機能するとき、は恐ろしくなり、逆もまた同様です。したがって、と間の線形関係を作成するためにを使用することは防御できないようです:動作する場合もも値の有効な表現ではないことを意味し、そうでない場合はそうではありません動作し、または(または他の再表現)のどちらが適切かを判断する必要があります。1 / x log x x 1 / x x 1 / x x 1 / xx1/xlog(x)x1/x x1/xx1/x
whuber

「薬理学では、薬物濃度の対数目盛を使用する頻度がはるかに高い」:変数を実際に既に頻繁にそのように定義していることを追加して、たとえば強調します。より自然にそのように表現されるということは、多くの関係がそこにあるログとのはるかに簡単な(線形)表現になることを意味します。pH=log[H+]
cbeleitesはモニカをサポートしています

29

@Michael Lewの非常に良い答えに加えて、私が手渡さなければならなかった実例をいくつか。

まず、以下の2つの時系列プロットは、ニュージーランド統計局から入手可能なニュージーランドへの毎月の訪問者の到着を示しています。両方のプロットには目的がありますが、対数目盛の垂直軸を持つプロットは、最初のプロットよりもはるかに多くの目的に使用できます。たとえば、到着の季節性は到着の規模にほぼ比例したままであることがわかります。また、成長率の大きな変化(たとえば、第二次世界大戦中)を見ることができます。これは元のスケールでは見えません。

ここに画像の説明を入力してください

第二に、以下のプロットは、実際にニュージーランドにいる間の支出と比較した、ニュージーランドへの旅行者による旅行関連の合計支出を示しています。情報源は、経済開発省による国際訪問者調査です。違いは、旅行前の支出、たとえばホテルやパッケージの前払いです。元のスケールの最初のプロットは、左下隅にグループ化されたデータの非常に粗雑な(しかし重要な)印象以外のいくつかの目的に使用できます。2番目のプロットは、特に統計学者以外の場合、即時の解釈を犠牲にします(このため、通常、データを変換してスケールを対数値で表示するのではなく、実際に軸で対数スケールを使用します)より視覚的な差別化。

たとえば、合計支出がニュージーランドでの支出よりも少ないいくつかの外れ値(データ編集エラーであることが判明した)を明確に見つけることができます。おそらくもっと重要なのは、このグラフをさまざまな色またはファセットで使用して、さまざまな市場国または訪問の目的(休日と友人や家族の訪問など)が支出「スペース」のどの部分を占めるかを示すことです。元の軸上。

このプロットを有用なものに変えるには、何らかの方法で高密度データを処理する必要があります(たとえば、ポイントに透明度を追加する、または密度に応じて色付けされた六角形のビンでポイントを置き換える)が、有用な視覚的ソリューションには必ず対数軸が含まれます。

ここに画像の説明を入力してください

編集/追加

大きなデータセットがある場合に密度を表すために色を使用して、六角形のビンの意味を説明する別のプロット(この場合、ニュージーランドでのラグビーワールドカップの経験に関する調査の約12000人の回答者)。繰り返しますが、これは支出に対数目盛を使用した別の例です。

ここに画像の説明を入力してください


ピーター、さらなる洞察力に感謝します。グラフィックスはポイントを理解するのに本当に役立ちます。1つのフォローアップの質問(もしあなたがそんなに傾いているなら)、なぜあなたはポイントを「六角形の」ビンに置き換えるのでしょうか?それは「ひまわりプロット」と同じ考えですか?その言葉を聞いたことがありません。
ダブ

いいえ、ヒマワリのプロットとは異なります。ポイントは、プロットエリアを六角形のビンに分割し、各ビンにいくつのポイントがあるかに応じて(たとえば、明るい部分から暗い部分に)色を付けることです。そうでなければ、単に黒の塊に変わる傾向がある大きなデータセットをプロットするのを回避する良い方法です。
ピーターエリス

@DavidVandenbos -私は例を追加しました
ピーター・エリス

(コメントの残りの部分)@PeterEllis説明をありがとう。これは、データを視覚化する優れた方法です。これは、私が使用している地理的なヒートマップに非常に似ています。Rで作成しましたか?
ダブ

はい、R、ggplot2パッケージを使用します-この目的に非常に適しており、基本を理解したら非常に簡単です。
ピーターエリス

9

対数目盛に関するもう1つの気の利いた点は、比率が対称に見えることです。たとえば、次のように: ここに画像の説明を入力してください


10
比較のために、同じプロットを線形スケールで見るといいと
思います
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.