時系列グラフのy軸など、特定の状況でグラフ化/グラフ化が適切な場合にログスケールを使用することを読みました。しかし、なぜそうなのか、それが適切な場合についての明確な説明を見つけることができませんでした。私は統計学者ではないので、この点を完全に見逃しているかもしれないことを覚えておいてください。もしそうなら、改善策の方向性に感謝します。
時系列グラフのy軸など、特定の状況でグラフ化/グラフ化が適切な場合にログスケールを使用することを読みました。しかし、なぜそうなのか、それが適切な場合についての明確な説明を見つけることができませんでした。私は統計学者ではないので、この点を完全に見逃しているかもしれないことを覚えておいてください。もしそうなら、改善策の方向性に感謝します。
回答:
これは非常に興味深い質問であり、あまりにも多くの人が考える質問です。ログスケールが適切な方法はいくつかあります。最初で最もよく知られているのは、マクロのコメントで言及されたものです。ログスケールでは、小さな値をグラフの下部に圧縮することなく、広い範囲を表示できます。
ログスケーリングを好む別の理由は、データがより自然に幾何学的に表現される状況です。例は、データが生物学的メディエーターの濃度を表す場合です。濃度を負にすることはできず、ばらつきはほぼ常に平均に比例します(つまり、不均一分散があります)。対数目盛を使用するか、同等に対数濃度をプライマリとして使用すると、測定は不均一な変動性を「修正」し、両端に制限のないスケールを与えます。濃度はおそらく対数正規分布しているため、対数スケーリングを行うと非常に便利な結果が得られます。これは間違いなく「自然」です。薬理学では、薬物濃度の対数目盛を使用する頻度がはるかに高く、
ログスケールのもう1つの正当な理由は、おそらく時系列データに関心があるものですが、部分的な変更を同等にするログスケールの機能に起因しています。退職後の投資の長期的なパフォーマンスの表示を想像してください。明日の関心は今日の投資(大まかに言って)に依存するため、これは(指数関数的に)ほぼ指数関数的に成長します。したがって、パーセンテージでのパフォーマンスがかなり一定であったとしても、資金のグラフは右端で最も急速に成長したように見えます。対数目盛では、一定のパーセンテージ変化は一定の垂直距離と見なされるため、一定の成長率は直線と見なされます。多くの場合、これは大きな利点です。
対数スケールを選択するもう1つのもう少し難解な理由は、値がxまたは1 / xとして合理的に表現できる状況にあります。私自身の研究からの例は血管抵抗であり、これは相反する血管コンダクタンスとしても合理的に表現できます。(状況によっては、血管の直径を抵抗力またはコンダクタンスの力と考えることも賢明です。)これらの測定値のいずれも、他のものよりも現実性がなく、両方とも研究論文で見つけることができます。それらが対数的にスケーリングされている場合、それらは単に互いに否定的であり、どちらを選択しても実質的な違いはありません。(血管の直径は、すべてログスケールされている場合、一定の乗数によって抵抗およびコンダクタンスと異なります。)
@Michael Lewの非常に良い答えに加えて、私が手渡さなければならなかった実例をいくつか。
まず、以下の2つの時系列プロットは、ニュージーランド統計局から入手可能なニュージーランドへの毎月の訪問者の到着を示しています。両方のプロットには目的がありますが、対数目盛の垂直軸を持つプロットは、最初のプロットよりもはるかに多くの目的に使用できます。たとえば、到着の季節性は到着の規模にほぼ比例したままであることがわかります。また、成長率の大きな変化(たとえば、第二次世界大戦中)を見ることができます。これは元のスケールでは見えません。
第二に、以下のプロットは、実際にニュージーランドにいる間の支出と比較した、ニュージーランドへの旅行者による旅行関連の合計支出を示しています。情報源は、経済開発省による国際訪問者調査です。違いは、旅行前の支出、たとえばホテルやパッケージの前払いです。元のスケールの最初のプロットは、左下隅にグループ化されたデータの非常に粗雑な(しかし重要な)印象以外のいくつかの目的に使用できます。2番目のプロットは、特に統計学者以外の場合、即時の解釈を犠牲にします(このため、通常、データを変換してスケールを対数値で表示するのではなく、実際に軸で対数スケールを使用します)より視覚的な差別化。
たとえば、合計支出がニュージーランドでの支出よりも少ないいくつかの外れ値(データ編集エラーであることが判明した)を明確に見つけることができます。おそらくもっと重要なのは、このグラフをさまざまな色またはファセットで使用して、さまざまな市場国または訪問の目的(休日と友人や家族の訪問など)が支出「スペース」のどの部分を占めるかを示すことです。元の軸上。
このプロットを有用なものに変えるには、何らかの方法で高密度データを処理する必要があります(たとえば、ポイントに透明度を追加する、または密度に応じて色付けされた六角形のビンでポイントを置き換える)が、有用な視覚的ソリューションには必ず対数軸が含まれます。
編集/追加
大きなデータセットがある場合に密度を表すために色を使用して、六角形のビンの意味を説明する別のプロット(この場合、ニュージーランドでのラグビーワールドカップの経験に関する調査の約12000人の回答者)。繰り返しますが、これは支出に対数目盛を使用した別の例です。