印刷可能/非対話型マップに、ゾーンごとに次のデータ(合計30ゾーン)をプロットしたいと思います。
- 平均年齢
- 平均世帯収入
- 世帯数
- 人口密度
- 人々の数
- 労働者数
上記の6つのレイヤーを1つのマップにどのように効果的に表示しますか?
印刷可能/非対話型マップに、ゾーンごとに次のデータ(合計30ゾーン)をプロットしたいと思います。
上記の6つのレイヤーを1つのマップにどのように効果的に表示しますか?
回答:
1つのマップにすべてのデータを含めることはできず、意味をなさないと思います。Tufteの小さな倍数の原則に沿って考えることをお勧めします。同じ領域に複数の小さなマップがあり、それぞれが異なる変数を使用しています。例:http : //www.juiceanalytics.com/writing/better-know-visualization-small-multiples/
それでも、たくさんの異なるユニットを使用しているという問題があるので、たくさんのキーが必要です。データを表示する別の方法(ただし、マップではない)は、すべての値が色付けされたテーブルを使用することです(つまり、平均未満、平均、平均以上の異なる色)
地図のアイデアについては、国勢調査地図をご覧になることをお勧めします:http : //www.census.gov/population/www/cen2000/censusatlas/
あなたが伝えようとしているメッセージをより正確に反映するのに役立つかもしれません(あなたが持っているデータだけでなく)。
単一の地図上に大量のデータを効率的に表示することはできません。2つの可能性:
6つのマップを作成し、
データを分析して地域を分類し、分類の結果を表示します。主成分分析では、あなたの変数の中で最も重要な相関を決定するのに役立ちます。このメソッドは、この合成マップを作成するために使用されています。
これらから:
この問題に対処するには、おそらく小さな倍数が良い方法であることに同意します。マップを補足するために、変数の散布図マトリックスを提案します。これにより、二変量相関が識別されます。データの地理的側面を失いながら、2つのマップを並べて比較するよりも、散布図内の変数間の関係を視覚化する方がはるかに簡単です。
何らかの空間トレンドをキャプチャしたい場合は、分布や元の変数の間に空間統計(ローカルモランのIなど)を含めることができます。
編集:最近、Andre-Michel Guerryが公開した(元は1883年)モラル統計を再検討する仕事に出くわしました。これらの著者の実装は、このスレッドで提案されているもの、小さな倍数、主成分分析、散布図マトリックス、ポリゴンダイアグラム内で非常によく似ています。添付のA.-Mの写真 。フランスのゲリーの道徳統計:多変数空間分析の課題 :マイケル・フレンドリー統計科学、Vol。22、No。3(2007年8月)、pp。368-399(PDFは無料です)。また、別の記事(Dray and Jombart、2010)は同じデータを分析し、Rにいくつかのソースコードを入れてプロットを作成しています。
1つの図は散布図マトリックスで、もう1つの図は星図と呼ばれるものです(これは、Pabloが提案したような棒グラフを表すための単なる別の方法です)。
ここにある小さな倍数の素晴らしい例アンドリュー・ゲルマンさん(および会社ブログ)に掲載統計モデル、因果推論、社会科学。このマップは、州ごとの学校バウチャーに対する有権者のサポートであり、収入、さまざまな人種および宗教のカテゴリーを条件としています。白い非福音主義者は、実際に学校のバウチャーを嫌います!(実際のブログにアクセスすると、2004年の調査データに表示されますが、そのグループの学校バウチャーに対するサポートが増えています)。
ここで提示するソリューションから選択するには、2つの重要な情報を提供できます。
ここで引用されているソリューションは、目的と公開によって効率が異なる場合があります。
J. Bertinによって記述された行列の対角化の手法を引用して、Julien(PCAによる1つの合成マップ)の答えを一般化したいと思います。完全なデータ表示ではなく、すべての情報の合成を求める場合に役立ちます。
簡単に言えば、各変数をヒストグラムで表現し、値(マップゾーン)が対角線状に並ぶようにヒストグラムをスタックでソートし、類型を取得することです。
(出典:http : //books.google.com/books?id=2tlQAAAAMAAJ&dq=bertin % 20graphique % 20information&hl=fr& source= gbs_similarbooks)
それは多くの情報であり、それらをすべてテーマごとに組み合わせた単一のマップは、視覚的な汚染のために役に立たないプレゼンテーションになるという事実です。一方、30のゾーンがあるため、各ゾーンの多くのマップも汚染の原因になります。
私の解決策:最も重要な情報を選択して、たとえば「世帯収入」とし、次に収入のいくつかのカテゴリーにマップをゾーニングします。最後に、各収入スポットについて、他の5つの属性とバーチャットをプロットします。
このマップを使用すると、たとえば次のような比較を行うことができます。「高所得地域では、常に多数の労働者と平均年齢21歳以上が表示されます」。
例を見てください...
おそらく、これらのアイデアのいくつかが役立つでしょうか?
6つの次元があると仮定します。
1:コロプレス:世帯収入の例0
2、3、4:シンボル:背景を見ることができるように、人数をドットで表します。例1、 例2、労働者/非労働者にグレースケールを使用し、年齢を示すために異なる配色を使用します。
6:(6番目の方法は考えられません!)
「世帯数」、「人口密度」、「人数」を表示するのは冗長ですか?
この複雑さを備えたマップが、あなた以外の誰にも明らかであるならば、私は懐疑的です。プレゼンテーションを行う場合、まず各要素を個別に表示し、次に追加して、視聴者が手順を理解できるようにします。
別の方法の1つ(各ゾーンのレーダーグラフ用のスペースがない場合は、この情報を表す「グリフ」を作成することができます。例4、図10.28。これらは通常理解が難しく、設計が容易ではないと思います明らかにですが、この場合はリンクされた例を使用できます。
私が考えていた別の考えは、各ポリゴンでポリゴンを同じ高さに押し出し、高さのセクションを使用してこれらのパラメーターを表すことです。各エリアの棒グラフを作成するのと似ていますが、各セクションが同じ間隔で上に重ねられます。これは3Dから表示する必要があり、その一部は不明瞭になります。
それはやりがいのある仕事です。私の答えは、多変量マップを使用することです。この地図をご覧ください。1つのマップにすべての変数を表示すると、マップはビジーに見えます。多変量マップを使用する場合は、適切な配色を選択してください。
1つの簡略化は、人口密度などの1つのアイテムをカートグラムで表現することです。つまり、各ユニットの面積を人口に比例するように変形します。
(ソース:amherst.edu)
主な欠点は、視聴者が「通常の」形状からゾーンの歪みを認識できる必要があることです。
詳細はこちら:http : //gis.amherstma.gov/data/SpringNearc2009/Session4Cartograms.pdf