ユーザーは、軸の値を分割して、同じグラフ上に異なる桁のデータを表示したいと思うことがよくあります(こちらを参照)。これは便利かもしれませんが、データを表示するのに常に好ましい方法とは限りません(誤解を招く可能性があります)。数桁異なるデータを表示する別の方法は何ですか?
データを対数変換するか、ラティスプロットを使用する2つの方法が考えられます。他のオプションは何ですか?
ユーザーは、軸の値を分割して、同じグラフ上に異なる桁のデータを表示したいと思うことがよくあります(こちらを参照)。これは便利かもしれませんが、データを表示するのに常に好ましい方法とは限りません(誤解を招く可能性があります)。数桁異なるデータを表示する別の方法は何ですか?
データを対数変換するか、ラティスプロットを使用する2つの方法が考えられます。他のオプションは何ですか?
回答:
私は棒グラフで対数軸を使用することを非常に警戒しています。問題は、軸の開始点を選択する必要があることであり、これはほとんど常に任意です。軸の最小値を変更するだけで、2つのバーの高さを非常に異なるか、ほぼ同じにすることができます。これらの3つのグラフはすべて同じデータをプロットします。
誰もまだ言及していない不連続軸の代替手段は、値の表を単に表示することです。多くの場合、表はグラフよりも理解しやすいです。
いくつかの追加のアイデア:
(1)対数変換に限定する必要はありません。たとえば、このサイトで「data-transformation」タグを検索します。一部のデータは、ルートやロジットなどの特定の変換に適しています。(このような変換は、たとえログであっても)通常、技術に詳しくないユーザー向けにグラフィックを公開する場合は避ける必要があります。一方、データのパターンを見るための優れたツールになる可能性があります。
(2)チャート内またはチャートの隣にチャートの詳細を挿入する標準の地図作成技術を借りることができます。具体的には、1つのグラフに極値を単独でプロットし、軸範囲をより限定して別のデータにすべての(または)残りのデータをプロットし、関係の表示(視覚的および/または記述)とともに2つをグラフィカルに配置しますそれらの間の。アラスカとハワイが異なる縮尺で挿入されている米国の地図を考えてください。(これはすべての種類のチャートで機能するわけではありませんが、イラストの棒グラフで効果的です。)[これはmbqの最近の答えに似ています。]
(3)壊れていないプロットを、壊れていない軸上の同じプロットと並べて表示できます。
(4)棒グラフの例の場合、適切な(おそらく非常に引き伸ばされた)垂直軸を選択し、パンユーティリティを提供します。[これは本当に有用な手法であるIMHOというよりはトリックですが、いくつかの特別な場合に役立つかもしれません。]
(5)別のスキーマを選択して、データを表示します。長さを使用して値を表す棒グラフの代わりに、たとえば、シンボルの領域が値を表すグラフを選択します。[明らかにトレードオフがここに含まれます。]
選択する手法は、プロットの目的に依存する可能性があります。たとえば、データ探索用に作成されたプロットは、一般的な対象者向けのプロットとは異なることがよくあります。
格子として分類できるかもしれませんが、試してみます。1つのパネルで最高にスケーリングされたすべてのバーをプロットし、下のパネルにズームを示す別のパネルを配置します。散布図の場合にこの手法を1回使用しましたが、結果は非常に良好でした。
対数軸の問題と棒グラフの問題を分離します。
コントロール(ベースライン、空白)の役割を担う賢明で固定された原点がない場合、棒グラフは決して賢明ではありません。しかし、これは対数軸とは何の関係もありません。
私が棒グラフに使用しているのは、ヒストグラムだけです。しかし、私は彼らがこの起源への違いを示すのにうまくいくと想像できました(違いが正か負かをすぐに見ることもできます)。バーは領域を表しているため、バーチャートは曲線下の領域の非常に離散化されたバージョンと考える傾向があります。つまり、x軸はメトリックの意味を持つ必要があります(時間の場合はそうですが、都市の場合はそうではありません)。
0で「自然な」起源を持つもののログにどの起源を使用するのか疑問に思う場合は、一歩下がって、何が起こっているのか少し考えます。非常に多くの場合、このような問題は、ログがここでの理にかなった変換ではないことを示す単なる指標です。
これで、ログ軸を持つ棒グラフは、倍数で発生する増加または減少を強調します。私が今考えることができる賢明な例はすべて、関心のある値と何らかの線形関係を持っています。しかし、おそらく他の誰かが良い例を見つけます。
したがって、データ変換は、手元のデータの意味に関して賢明なものでなければならないと思います。これは、前述の物理化学単位の場合です(Aは濃度に比例し、pHは、たとえばpHメーターの電圧と線形関係にあります)。実際、ログユニットが新しい名前を取得し、線形的に使用されるのは非常に多くの場合です。
最後になりましたが、私は振動分光法から来ました。そこでは壊れた軸が非常に定期的に使用されます。そして、私はこれが、軸の破壊が惑わされない数少ない例の1つを使用すると考えます。ただし、桁違いの変化はありません。x範囲の30〜40%の情報のない領域があります。例を示します
。このサンプルでは、1800〜2800 / cmの部分に有用な情報を含めることはできません。
したがって、有益でないスペクトル範囲は削除されます(これは、ケモメトリックモデリングに実際に使用するスペクトル範囲も示しています)。
しかし、データの解釈には、x位置の正確な読み取り値が必要です。しかし、一般に、異なる範囲にまたがる倍数は必要ありません(つまり、そのような関係がありますが、ほとんどの接続はより複雑です。例:3050 / cmの信号、したがって不飽和または芳香物質があります。 、したがって、モノ、メタ、または1,3,5-置換芳香環はありません...)
したがって、xをより大きなスケールで描写する方が適切です(実際、ガイドのようなミリメートルシートを使用するか、正確な位置にラベルを付ける)。そのため、軸を分割し、より大きなxスケーリングを取得します。
実際、ファセットに非常によく似ています
が、壊れた軸は、両方の部分のx軸のスケールが同じであることを強調しています。すなわち、プロットされた領域内の間隔は同じです。
小さな強度(y軸)を強調するために、我々は拡大インセットを使用:
[ ...については、青色で拡大(×20)νCH領域を参照... ]
そして、これはリンクされたプロットの例でも確かに可能です。
優れた回答とコメントを見たときに暗示されたが明示的に説明されていなかった2つのアイデアは、「ラベル付けと矛盾する方法で」棒グラフを使用し、データを正規化/無次元化することでした。
スター/スパイダー/レーダースタイルのチャート(リンク)(リンク)は、多くの場合、複数の座標に沿っていくつかの異なるものを比較するのに非常に適しています。多くの非常に有用なプロットがありますが、ビジネスプレゼンテーションでは(残念ながら)まれです。おそらく、リーダーシップは情報を使用して理解し、理解を使用して決定を下すのではなく、結論を使用して決定を行うことを好むためです。ビジネスでは、コンセンサスを構築することが非常に困難な場合があります。そのため、結果のみのアプローチでは、コンセンサスファースト、デシジョンネクストネクストの環境でより高い利回りを得ることができます。これは、棒/縦棒グラフの人気を知らせます。理解を深めるのに適した他のグラフタイプの例を検討してください(リンク)。
グラフ化する値を「特性」値で除算すると、スケーリングを変換して、情報を失うことなく読みやすさを向上させることができます。Fluid Dynamicistsは、予測の有用性とアプリケーションでの弾力性のために、無次元数を好みます。彼らは、バッキンガムPi定理のようなものを、無次元形式の候補(リンク)のソースとして見ています。人気のある便利な無次元数には、レイノルズ数、マッハ数、ビオット数、グラスホフ数、Pi、ローリー数、ストークス数、シャーウッド数が含まれます。(リンク) 無次元の数値は、非物理アプリケーションで役立つため、物理学者である必要はありません。密度、均一性、円形性、共面性などの尺度は、画像、ピクセルフィールド、または多変量確率分布を定義できます。対数や既知の値からの相対的な距離を取ることを考えないでください-また、平方根を取ることで、数値を逆にすることも考えられます。
幸運を祈ります。状況がどうなるか教えてください。