世界の一次元地図?


59

ちょっと奇妙な質問ですが、ここで質問してもいいと思います。

誰もが世界地図の「1次元」投影を聞いたことがありますか?それは地球上のすべての点を単一の線にマッピングしていますか?

私はそのようなことをすることを考えていました-地球上で「近く」にある都市を「近く」で維持しようとしています。

これを行う前に、この分野の最新技術はどうなるのだろうかと考えました。


良いアイデアですが、私はその線が「2次元」の特徴であると言いたいです。
ベントラム

16
ラインは1次元です。これは、それに沿ってポイントを見つけるのに1つの座標しか必要としないためです。ポイントは0次元で、ポリゴンは2次元です。
blah238

5
Apple Peelプロジェクション:t1.thpservices.com/fotos/thum4/013/881/sfd-362035.jpg、すぐに使用できるアルゴリズムには遭遇していませんが... ;-)
matt wilkie

2
@Mattそれはかわいいものです。近似値として、この投影は(lat、lon)=(f、l)に近いポイントを(Int((90-f)/ e)、l)にマッピングします。ここで、eはピールの「らせん」の数です。(少し混乱していますが、これがその要点です。)問題は、eが大きくなると、不連続点が密になり、希望する動作とは正反対にあることを意味します:ほとんどすべての点のペア地球に近いものは、互いに遠くにマッピングされます。
whuber

回答:


49

距離の歪みを最小限に抑えて、ポイントのコレクション(距離が与えられている)をユークリッド空間(3空間、平面、線など)にマッピングする一般的な手法は、多次元スケーリング(MDS)と呼ばれます。いくつかのアルゴリズムがあります。ソリューションはRで無料で利用でき、多くの場合、商用統計パッケージが提供されます。

ここでは、米国最大の20都市がStata 11のデフォルトのMDS設定でマッピングされています。目盛りは100 km間隔を示します。

一次元米国


素晴らしい-はい、これはまさに私がやろうとしていたことです-「Stochastic Neighbor Embedding」と呼ばれるMDSアルゴリズムを使用したいのですが、本質的には同じです。ただし、すでにこれを行っていることがわかります。私が思う主なことは、それが私にとってかなり論理的/良いように見えることです!おもしろい、それはそれ自身の方法だ。ありがとう!
utunga

多次元スケーリングは2Dのものです!
huckfinn 14

@huckfinn任意の数の次元で実行できます。2は単なる一般的なアプリケーションです。とりわけブジャ等を参照次元kに制限を設けておらず、その最初の例(図1左)は明らかに1つの次元で機能します。または、私の1D MDSソリューションをご覧ください!
whuber

はい、それは事実ですが、2D IMOより下では意味がありません。MDSは通常の距離測定に劣化し、ナンバービームに再投影されます。叙階は、私がシュアではない仕分けに変わりますか?
ハックフィン14

この回答で私が提示した地図は「意味がない」と本当に主張しているのですか?それは誰もがはっきり(1)それがいることを見ることができるように、あなたの一部にかなりの説明が必要になるだろう便利な地理情報を伝え、(2)それがないではないに減らす「通常の距離測定。」
whuber

17

最初の答えをくれた@whuberに感謝します。ほぼ同じことをした結果をアップロードする必要があると思いました...

私が使用した特定の形式のMDSに価値があるのは、t-SNE(別名't-distributed Stochastic Neihbor Embedding')と呼ばれるもので、次の画像を実現します。

すべての都市の写真を順番に示します-左の軸は、その都市の実際の1次元の場所であり、都市は上から下、その軸を横切って左から右に順番に配置されています。color = country 順番に都市

ここに別の写真を示します。私は都市の線を取り、それを世界地図にプロットしました。この問題は、最終的には巡回セールスマンの問題にかなり近いものになりますが、都市の順序だけでなく都市の1次元ラインへのマッピング...

世界地図を通る道

ここで使用される完全な出力データまたは方法論が必要な場合は、メッセージを送ってください。

-

編集:

@whuberのコメントに応えて

はい、ローカル距離を強調するのは正しいです(つまり、直近の近隣のローカル距離は、世界地図上の実際の距離にできるだけ近づける必要があります)。MDSの問題は巡回セールスマンの問題に帰着します。ただし、より広い/より中程度の範囲で距離の最適化(または一致)を強調すると、異なる結果が得られます。たとえば、「perplexity」に高い値を使用するとt-sneアルゴリズムが提供するものを次に示します。ここに画像の説明を入力してください


共有してくれてありがとう。これは、実際には出張セールスマンに似ています。MDSではありません。MDSソリューションの歪みははるかに大きくなりますが、世界と地図の間の関係は通常の予測可能なものになります。このように、返信は元の問題に対するさらに別の解決策を構成します。
whuberの

私の答えを更新して別のバリエーションを与え、あなたの意見に興味を持ってください。
utunga

2番目は、好奇心and盛で興味深いソリューションです。「t-sne」アルゴリズムが各ポイントを正確に訪問しようとしているようです。これは、2Dの場合、各ポイントの周囲に非常に正確なローカル投影を作成し、ポイント間で投影を中断させ、ほぼ完全なローカル忠実度を維持しながら距離と方向をひどくゆがめることに似ています。特殊な用途があるかもしれませんが、実際には、グローバルソリューションを大幅に改善するのに十分な余裕があるため、通常は少しの投影エラーを許容します。
whuber

12

できることは、ペアノ曲線やヒルベルト曲線などの1次元空間充填曲線で2次元空間をカバーすることです。次に、ポイントを曲線上の最も近いポイントにマッピングします。曲線のラップを解除すると、ライン上で最も近いスペースにある最も近い都市のラインをある程度取得する必要があります。

それは完璧ではありません(何もできるとは思いません)が、巡回セールスマンアルゴリズムの基礎として使用されているのを見てきました-線に沿ってセールスマンの旅をするなら、最高のソリューション。


4
これは機能しますが、注意してください。ラインが空間内で最も近くにある都市の1つですが、一般に、スペース内の近くの都市はライン上で互いに近くありません(曲線は、ℝ->ℝ²連続的な逆があります)。
左辺り

2
この答えは、ペアノ/ヒルベルト曲線がどのように見えるか(および/または定義へのリンク)のグラフィック例から恩恵を受けるでしょう
マットウィルキー

1
あるいはあなたがそのすべてが...自分をWikipediaに行くことができる、私は本当にあまりにも...ここにウィキペディアを繰り返すことでポイントが表示されない
Spacedman

1
まあ、少し繰り返すことができると思います!リンクまたは2つと画像はどうですか?
blah238

例示の目的のために、一つはランダルマンローのを見ることができるインターネットのXKCDマップ(すなわち平面に線をマッピング、逆である)正確にこの技術を使用して、
waldyrious

9

奇妙な質問は、しばしば最も興味深いものです!

地図作成で寸法が使用される方法で最新技術を探している場合は、Bertinのグラフィック記号学から始めることができます。Bertinによれば、一枚の紙(またはiPadの表面)には3つの次元があります。2つの平面次元と値/テクスチャーです。グラフィック記号学は、情報ディメンションをこれらの表現ディメンションにマップするルールを提供します。2つの平面ディメンションが空間ディメンションである場合、グラフィックはマップであり、3番目のディメンションは情報を表すために使用されます。

1次元のマップを作成する場合、目的の情報(都市間の近接度)を表すために紙のディメンションのいずれかを使用しないように制限することを選択します。そのような制約を課し、法線マップを作成しないことが本当に必要ですか?

他の回答で述べたように、本当に必要な場合、それはできません!都市間の近接関係を1つの次元で表すことはできません。そのためには、次のことができます。

  • 「ユーザー中心のアプローチ」を使用します。マップオーディエンスがどこかにある場合、または焦点を当てる特定の場所がある場合、この場所を起点とし、他のすべての都市はこの起点までの距離に基づいてソートされます。
  • 相対的な距離だけでなく、他の類似性基準(人口、大陸、住民あたりの車の数など)に従って都市を並べ替えます。次に、主成分分析などのいくつかの統計処理により、都市をランク付けできる単一のディメンションラインを提供できます。

ここまでのすべての答えは非常に興味深いものであり、啓発的です。これの最初の箇条書きは、原点を選択し、他のすべては「原点からの距離」であり、最もすぐに実用的であるようです。
マットウィルキー

よく知られているように、2次元への投影も「できません」。ところで、旅行を計画するためのストリップマップなど、1D投影には多くのアプリケーションがあります。
whuber

7
trying to keep cities that are 'close' on the globe 'close' on the line

たとえば、正三角形の頂点など、互いに同じ距離にある3つの都市を想像してください。それを線でどのように表現しますか?一部の情報失われます。

すべての都市を平行線または子午線に投影するなど、1つのディメンションを完全に破棄するか(異なる国間で都市の南北の相対的な位置を比較するために使用されないため、後者は興味深いでしょう)、または特定の1つを選択します次元の尺度、たとえば「ニューヨークからの距離」。

Spacedmanによって提案されたペアノ曲線は非常に興味深いものであり、元のマップになりますが、近くの都市はその曲線上で非常に遠くなる可能性があります。


5
...近い近いあなたの都市を維持し、あなたの地球儀...
トーマス・

1
+1良い発言。ただし、それはどちらかまたは命題ではありません。線に投影したり、基点からの距離に縮小したりする必要はありません。(通常の)2D投影に使用されるのと同じように、非線形ソリューションも利用できます。目的は、投影距離と実際の距離の差の測定値を最小化することです。この点で、ペアノ曲線は特に劣りますが、その変種(構築の初期段階ですべての所望の点を通過するように適合されている)が機能する可能性があります。
whuber

3

使用したことはありませんが、GeoHashがこれに役立つかもしれません。

ジオハッシュは、任意の精度や、コードの末尾から文字を徐々に削除してサイズを縮小する(および精度を徐々に失う)などのプロパティを提供します。

段階的な精度低下の結果として、近くの場所はしばしば(常にではないが)同様のプレフィックスを提示します。逆に、共有プレフィックスが長いほど、2つの場所は近くなります。


これらのハッシュは、球の表面の洗練された細分化を単語にエンコードすることで機能する傾向があり、それにより本質的に2次元です。それらから一次元座標を抽出する方法は明確ではありません(意味のある方法で)。
whuber

@whuberしたがって、都市のリストがあり、lat / longをgeohash.orgに渡すことで都市のハッシュを生成し、ハッシュに基づいて都市をソートした場合、都市の順序は1次元のマッピングを表しません(それがどれほど正確であるかにかかわらず)?
カーク

1
それは完全にハッシュに依存します。単なる順序付けは1次元ではなく、単なる順序付けです。さらに、意味のある数値座標が必要です。それもハッシュから出ている場合、実際には1Dプロジェクションがありますが、恐ろしい特性を持っている可能性があります。予測の全体的なポイントは、視覚化や分析に関係のない歪みを無視し、歪みを最小限に抑えることです。ハッシュがほとんどの目的のための投影として有用である可能性はほとんどありません。
whuberの
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.