質問:ヒートマップが最も効果的なのはいつ(どの種類のデータ視覚化問題に対して)ですか?(特に、他のすべての可能な視覚化手法よりも効果的ですか?)
ヒートマップの効果が最も低いのはいつですか?
ヒートマップがデータを視覚化する効果的な方法である可能性が高いかどうか、およびそれらがいつ効果的でない可能性があるかを決定するために使用できる一般的なパターンまたは経験則はありますか?
(主に、2つのカテゴリ変数と1つの連続変数のヒートマップを念頭に置いていますが、他のタイプのヒートマップに関する意見を聞くことにも興味があります。)
コンテキスト:データの視覚化に関するオンラインコースを受講しており、現在、効果がなく使い古されたプロットタイプについて議論しています。彼らはすでにダイナマイトプロットと円グラフについて言及していましたが、それらが効果的でなく、それらに代わるより良い代替物がある理由については、明確で説得力がありました。さらに、ダイナマイトプロットと円グラフに関する特定の意見を裏付ける他のソースを見つけるのは簡単でした。
ただし、このコースでは、「ヒートマップは最も効率の低いタイプのデータ視覚化の1つである」とも述べています。理由の言い換えを以下に示します。しかし、この観点を裏付けるGoogleの他の場所を見つけようとしたとき、円グラフとダイナマイトプロットの有効性について意見を調べるのとは対照的に、私は多くの困難を抱えていました。そのため、コースで与えられるヒートマップの特性評価がどの程度有効であるか、また、それらに対する要因が特定のコンテキストで最も重要でなく、最も重要な場合を知りたいと思います。
指定された理由は次のとおりです。
色を連続的なスケールにマッピングすることは困難です。
この規則にはいくつかの例外があります。したがって、これは通常、取引のブレーカーではありませんが、ヒートマップの場合、色の知覚は隣接する色によって変化するため、問題は特に困難です。したがって、ヒートマップは、小さなデータセットであっても、個々の結果を表示するのには適していません。これは以下につながります:
特定の色に対応する数値を十分な精度で推測することは不可能であるため、テーブル検索方法を使用して特定の質問に回答することは一般に実行不可能です。
多くの場合、データはトレンドを引き出すような方法でクラスター化されていません。
このようなクラスタリングがなければ、一般的な全体パターンについて何かを推測することは、しばしば困難または不可能です。
特にマルチカラーグラデーションを使用する場合、ヒートマップは「すごい要素」を伝えるため、または単にクールに見えるためにのみ使用されることがよくありますが、通常、データを伝達するためのより良い方法があります。
共通のスケールで連続データをプロットすることは常に最良の選択肢です。時間成分がある場合、最も明白な選択はラインプロットです。