人口統計データを印刷された地図に効果的に表示する


29

印刷可能/非対話型マップに、ゾーンごとに次のデータ(合計30ゾーン)をプロットしたいと思います。

  • 平均年齢
  • 平均世帯収入
  • 世帯数
  • 人口密度
  • 人々の数
  • 労働者数

上記の6つのレイヤーを1つのマップにどのように効果的に表示しますか?


1
ゾーンの大きさはページサイズに対してどのくらいですか?各ゾーンに小さなプロットをフィットできますか?(例:レーダーチャート)
djq

-Itのダウンタウンゾーンは郊外/田園地帯よりも大幅に小さくなっている住宅地よりも多くの小さい典型的な国勢調査の調査の種類、@celenius
dassouki

1
静的マップ上のこれらの6つのレイヤーは、難しい設計作業です。インタラクティブマップの使用を妨げる問題は何ですか?
Trevesy

@Trevesyは-ほとんどの部分は、要件がハイライト6つの変数が視覚的分析を促進することを印刷可能なマップを設計することである
dassouki

1
視覚化タグを追加する自由を取りましたが、不適切と思われる場合は自由に削除してください。
アンディW

回答:


20

1つのマップにすべてのデータを含めることはできず、意味をなさないと思います。Tufteの小さな倍数の原則に沿って考えることをお勧めします。同じ領域に複数の小さなマップがあり、それぞれが異なる変数を使用しています。例:http : //www.juiceanalytics.com/writing/better-know-visualization-small-multiples/

それでも、たくさんの異なるユニットを使用しているという問題があるので、たくさんのキーが必要です。データを表示する別の方法(ただし、マップではない)は、すべての値が色付けされたテーブルを使用することです(つまり、平均未満、平均、平均以上の異なる色)

地図のアイデアについては、国勢調査地図をご覧になることをお勧めします:http : //www.census.gov/population/www/cen2000/censusatlas/

あなたが伝えようとしているメッセージをより正確に反映するのに役立つかもしれません(あなたが持っているデータだけでなく)。


5
+1これは、一度に6つの変数をシンボル化しようとすることにより、混乱させるよりもはるかに優れています。さらに、データの表を印刷してみませんか?6列+ ID、30行:十分に小さく、必要なすべての詳細を提供します。
whuber

13

単一の地図上に大量のデータを効率的に表示することはできません。2つの可能性:

  • 6つのマップを作成し、

  • データを分析して地域を分類し、分類の結果を表示します。主成分分析では、あなたの変数の中で最も重要な相関を決定するのに役立ちます。このメソッドは、この合成マップを作成するために使用されています。

代替テキスト

これらから:

代替テキスト 代替テキスト


6つのマップを持つことの問題は、傾向を視覚的に判断するのが難しいことです。時には、複数の変数で地図を見て、物事がラインアップ方法を見ていいです
dassouki

2
@dassouki、物事がどのように並んでいるかを確認するには、必ずしもそれらをマップする必要はありません。二変量散布図はその基準を満たし、解釈がはるかに簡単になります。
アンディW

3
6つのマップを持つことの利点は、トレンドを視覚的に簡単に識別できることです!6つ(またはそれ以上)の変数を1つのマップに詰め込もうとすると、パターンを見つけるのが難しくなります。(このマップに数千の機能が含まれている場合、この発言を変更します:グリフの視覚化などの特定の種類のマッピングは、豊富な多変量データセットでパターンを見つけるのに非常に効果的です:lmi.bwh.harvard.edu/papers/papers/ KindlmannTVCG2006.html
whuber

@julien、クールなもの、あなたは私がちょうど出会ったこの記事に興味があるかもしれません、e-publications.org / ims / submission / index.php / AOAS / user /…、それは同様の多変量の関連するPCA分析とマップを持っていますデータとプロットを作成するRコード。
アンディW

本当に興味深いので、これについて読んでおく必要があります。
ノイハウザー

9

この問題に対処するには、おそらく小さな倍数が良い方法であることに同意します。マップを補足するために、変数の散布図マトリックスを提案します。これにより、二変量相関が識別されます。データの地理的側面を失いながら、2つのマップを並べて比較するよりも、散布図内の変数間の関係を視覚化する方がはるかに簡単です。

何らかの空間トレンドをキャプチャしたい場合は、分布や元の変数の間に空間統計(ローカルモランのIなど)を含めることができます。

編集:最近、Andre-Michel Guerryが公開した(元は1883年)モラル統計を再検討する仕事に出くわしました。これらの著者の実装は、このスレッドで提案されているもの、小さな倍数、主成分分析、散布図マトリックス、ポリゴンダイアグラム内で非常によく似ています。添付のA.-Mの写真 フランスのゲリーの道徳統計:多変数空間分析の課題 :マイケル・フレンドリー統計科学、Vol。22、No。3(2007年8月)、pp。368-399(PDFは無料です)。また、別の記事(Dray and Jombart、2010)は同じデータを分析し、Rにいくつかのソースコードを入れてプロットを作成しています。

1つの図は散布図マトリックスで、もう1つの図は星図と呼ばれるものです(これは、Pabloが提案したような棒グラフを表すための単なる別の方法です)。 代替テキスト 代替テキスト


8

ここにある小さな倍数の素晴らしい例アンドリュー・ゲルマンさん(および会社ブログ)に掲載統計モデル、因果推論、社会科学。このマップは、州ごとの学校バウチャーに対する有権者のサポートであり、収入、さまざまな人種および宗教のカテゴリーを条件としています。白い非福音主義者は、実際に学校のバウチャーを嫌います!(実際のブログにアクセスすると、2004年の調査データに表示されますが、そのグループの学校バウチャーに対するサポートが増えています)。 ここに画像の説明を入力してください


グラフはクールですが、カラースケールは恐ろしいです。グレーにすることで、なぜ50%が優先されるのですか?きっとヒートマップの色か何かを使うべきでしょうか?また、なぜ聖人だけが宗教に分かれているのですか?確かに、人種ごとに分けてから宗教ごとに分けた方が理にかなっていますか
-naught101

@ naught101、私はあなたの否定性に少し混乱しています。スペクトルの両端の明るい色または暗い色と比較して、確かにグレーは強調されません。45%での任意の発散については私は嫌悪感を抱きますが、IMOはこのような小さな複数のマップを作成する際に、非常に対照的な値を持つことが有益です。宗教/人種分割についてのコメントは、IMOでもあまり意味がありません。これらは、個人がバウチャーをサポートしているかどうかに明らかに関連しいるカテゴリあり、提案するサブセットのいくつかは存在しないようです。続き...
アンディ・W

IE調査では、そのようなグループについて実質的なことを言うのに十分な「ブラックカトリック教徒」が存在することは非常に疑わしい(「ヒスパニック系非エバンプロテスタント」)。サブグループ
アンディW

多分それはちょうど私の特定の灰色が画面に突き出ていることです。私はそれを白で、そして多分それを区別するために灰色の背景でもっと良いと思う。また、Gelmanのブログの2つの画像の縮尺が異なることにも注目してください。黒人人口がはるかに多いという印象を受けましたが、国勢調査のデータを見て、修正しました。奇妙なことの1つは、国勢調査ではヒスパニックの起源を人種に直交するものと定義していることです(別の質問です)。ゲルマンの区別は異なって定義されていると思います。
naught10112年

@ naught101これは国勢調査からの情報ではなく、他の調査からのものです(国勢調査には世論はありません)
アンディW

5

ここで提示するソリューションから選択するには、2つの重要な情報を提供できます。

  • マップの目的は何ですか?(発見、公開?)
  • マップの意図された公開は何ですか?(アナリスト、仲間のアナリスト、都市計画者、一般人?)

ここで引用されているソリューションは、目的と公開によって効率が異なる場合があります。

J. Bertinによって記述された行列の対角化の手法を引用して、Julien(PCAによる1つの合成マップ)の答えを一般化したいと思います。完全なデータ表示ではなく、すべての情報の合成を求める場合に役立ちます。

簡単に言えば、各変数をヒストグラムで表現し、値(マップゾーン)が対角線状に並ぶようにヒストグラムをスタックでソートし、類型を取得することです。

代替テキスト

(出典:http : //books.google.com/books?id=2tlQAAAAMAAJ&dq=bertin % 20graphique % 20information&hl=fr& source= gbs_similarbooks


4

それは多くの情報であり、それらをすべてテーマごとに組み合わせた単一のマップは、視覚的な汚染のために役に立たないプレゼンテーションになるという事実です。一方、30のゾーンがあるため、各ゾーンの多くのマップも汚染の原因になります。

私の解決策:最も重要な情報を選択して、たとえば「世帯収入」とし、次に収入のいくつかのカテゴリーにマップをゾーニングします。最後に、各収入スポットについて、他の5つの属性とバーチャットをプロットします。

このマップを使用すると、たとえば次のような比較を行うことができます。「高所得地域では、常に多数の労働者と平均年齢21歳以上が表示されます」。

例を見てください...

代替テキスト


4

おそらく、これらのアイデアのいくつかが役立つでしょうか?

6つの次元があると仮定します。

1:コロプレス:世帯収入の例0

2、3、4:シンボル:背景を見ることができるように、人数をドットで表します。例1、 例2、労働者/非労働者にグレースケールを使用し年齢を示すために異なる配色を使用します。

5:3D:人口密度を地形のとして使用3

6:(6番目の方法は考えられません!)

「世帯数」、「人口密度」、「人数」を表示するのは冗長ですか?

この複雑さを備えたマップが、あなた以外の誰にも明らかであるならば、私は懐疑的です。プレゼンテーションを行う場合、まず各要素を個別に表示し、次に追加して、視聴者が手順を理解できるようにします。


別の方法の1つ(各ゾーンのレーダーグラフ用のスペースがない場合は、この情報を表す「グリフ」を作成することができます。例4、図10.28。これらは通常理解が難しく、設計が容易ではないと思います明らかにですが、この場合はリンクされた例を使用できます。


私が考えていた別の考えは、各ポリゴンでポリゴンを同じ高さに押し出し、高さのセクションを使用してこれらのパラメーターを表すことです。各エリアの棒グラフを作成するのと似ていますが、各セクションが同じ間隔で上に重ねられます。これは3Dから表示する必要があり、その一部は不明瞭になります。


私は大好きで、すべての提案を意味します。1-> 4を実装する予定です。しかし、3Dのもののため:私はあなたが行うとき、通常は中央に配置された3Dマップ、繁華街には、その背後にあるゾーンの多くを遮断する、標高のほとんどを得ることを見つける
dassouki

@dassouki-私はそれが通常そうであることに同意します。おそらく、これに大きな範囲を持たない変数(平均年齢?)を使用したり、もしそうなら、対数的に変換したりすることができます。
djq

3
@celenius可能性のある冗長性に関する興味深い質問:人口密度は、面積に対する人口の数です。人数は絶対数です。また、世帯数は、人々がどのように共存するかについての情報を提供します。これらの3つの変数は明らかに関連しています(回帰でほぼ共線性の問題を引き起こす可能性があります)が、実際には3つの異なる情報です。ところで、それは「コロプレス」です。(幸いなことに、Googleはこのタイプミスを認識し、とにかく意図した検索を行います。)
whuber

1
@whuber-おそらくフラッシュを使用して行われたと思います(残念!)。
djq

2
私は3Dの提案について非常に疑っています。私の知る限り、誰も3Dが非常に有用であることを示していません。San Fran犯罪へのリンクは機能しますが、それは非常に単純であるためです-より複雑なパターンを解読することは困難です。この場合、3Dを使用する方法はまったくないと思います。
トレベシー

2

それはやりがいのある仕事です。私の答えは、多変量マップを使用することです。この地図をご覧ください。1つのマップにすべての変数を表示すると、マップはビジーに見えます。多変量マップを使用する場合は、適切な配色を選択してください。


私が働いている場所でGoogleドキュメントがブロックされている:(
dassouki


仕事はどちらかなかったし、それはそれの終わりに、ファイルの拡張子を持っていない場合、私はそれをこすりすることはできません
dassouki

まだ行く....
dassouki

これは私の側からのブロックです。:(地図をメールで送信しても構いません。
Raj

0

1つの簡略化は、人口密度などの1つのアイテムをカートグラムで表現することです。つまり、各ユニットの面積を人口に比例するように変形します。

2008年米国大統領選挙
(ソース:amherst.edu

主な欠点は、視聴者が「通常の」形状からゾーンの歪みを認識できる必要があることです。

詳細はこちら:http : //gis.amherstma.gov/data/SpringNearc2009/Session4Cartograms.pdf


1
これには潜在的な可能性があると思いますが、この特定の状況(同じ空間で複数の属性を同時に表示)にカートグラムをどれだけうまく適用できるかは不明です。理論的には多数の小さな複数のカートグラムを作成できますが、解釈が難しい場合があります(小さな複数の場合に不可欠な、マップ間の一貫性が失われます)。おそらく、カートグラムをより興味深い方法で色と組み合わせて、複数の属性を表示できます。
アンディW

1
小さな複数のカートグラム
Andy W
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.