ちょっと奇妙な質問ですが、ここで質問してもいいと思います。
誰もが世界地図の「1次元」投影を聞いたことがありますか?それは地球上のすべての点を単一の線にマッピングしていますか?
私はそのようなことをすることを考えていました-地球上で「近く」にある都市を「近く」で維持しようとしています。
これを行う前に、この分野の最新技術はどうなるのだろうかと考えました。
ちょっと奇妙な質問ですが、ここで質問してもいいと思います。
誰もが世界地図の「1次元」投影を聞いたことがありますか?それは地球上のすべての点を単一の線にマッピングしていますか?
私はそのようなことをすることを考えていました-地球上で「近く」にある都市を「近く」で維持しようとしています。
これを行う前に、この分野の最新技術はどうなるのだろうかと考えました。
回答:
距離の歪みを最小限に抑えて、ポイントのコレクション(距離が与えられている)をユークリッド空間(3空間、平面、線など)にマッピングする一般的な手法は、多次元スケーリング(MDS)と呼ばれます。いくつかのアルゴリズムがあります。ソリューションはRで無料で利用でき、多くの場合、商用統計パッケージが提供されます。
ここでは、米国最大の20都市がStata 11のデフォルトのMDS設定でマッピングされています。目盛りは100 km間隔を示します。
最初の答えをくれた@whuberに感謝します。ほぼ同じことをした結果をアップロードする必要があると思いました...
私が使用した特定の形式のMDSに価値があるのは、t-SNE(別名't-distributed Stochastic Neihbor Embedding')と呼ばれるもので、次の画像を実現します。
すべての都市の写真を順番に示します-左の軸は、その都市の実際の1次元の場所であり、都市は上から下、その軸を横切って左から右に順番に配置されています。color = country
ここに別の写真を示します。私は都市の線を取り、それを世界地図にプロットしました。この問題は、最終的には巡回セールスマンの問題にかなり近いものになりますが、都市の順序だけでなく都市の1次元ラインへのマッピング...
ここで使用される完全な出力データまたは方法論が必要な場合は、メッセージを送ってください。
-
編集:
@whuberのコメントに応えて
はい、ローカル距離を強調するのは正しいです(つまり、直近の近隣のローカル距離は、世界地図上の実際の距離にできるだけ近づける必要があります)。MDSの問題は巡回セールスマンの問題に帰着します。ただし、より広い/より中程度の範囲で距離の最適化(または一致)を強調すると、異なる結果が得られます。たとえば、「perplexity」に高い値を使用するとt-sneアルゴリズムが提供するものを次に示します。
できることは、ペアノ曲線やヒルベルト曲線などの1次元空間充填曲線で2次元空間をカバーすることです。次に、ポイントを曲線上の最も近いポイントにマッピングします。曲線のラップを解除すると、ライン上で最も近いスペースにある最も近い都市のラインをある程度取得する必要があります。
それは完璧ではありません(何もできるとは思いません)が、巡回セールスマンアルゴリズムの基礎として使用されているのを見てきました-線に沿ってセールスマンの旅をするなら、最高のソリューション。
奇妙な質問は、しばしば最も興味深いものです!
地図作成で寸法が使用される方法で最新技術を探している場合は、Bertinのグラフィック記号学から始めることができます。Bertinによれば、一枚の紙(またはiPadの表面)には3つの次元があります。2つの平面次元と値/テクスチャーです。グラフィック記号学は、情報ディメンションをこれらの表現ディメンションにマップするルールを提供します。2つの平面ディメンションが空間ディメンションである場合、グラフィックはマップであり、3番目のディメンションは情報を表すために使用されます。
1次元のマップを作成する場合、目的の情報(都市間の近接度)を表すために紙のディメンションのいずれかを使用しないように制限することを選択します。そのような制約を課し、法線マップを作成しないことが本当に必要ですか?
他の回答で述べたように、本当に必要な場合、それはできません!都市間の近接関係を1つの次元で表すことはできません。そのためには、次のことができます。
trying to keep cities that are 'close' on the globe 'close' on the line
たとえば、正三角形の頂点など、互いに同じ距離にある3つの都市を想像してください。それを線でどのように表現しますか?一部の情報は失われます。
すべての都市を平行線または子午線に投影するなど、1つのディメンションを完全に破棄するか(異なる国間で都市の南北の相対的な位置を比較するために使用されないため、後者は興味深いでしょう)、または特定の1つを選択します次元の尺度、たとえば「ニューヨークからの距離」。
Spacedmanによって提案されたペアノ曲線は非常に興味深いものであり、元のマップになりますが、近くの都市はその曲線上で非常に遠くなる可能性があります。
使用したことはありませんが、GeoHashがこれに役立つかもしれません。
ジオハッシュは、任意の精度や、コードの末尾から文字を徐々に削除してサイズを縮小する(および精度を徐々に失う)などのプロパティを提供します。
段階的な精度低下の結果として、近くの場所はしばしば(常にではないが)同様のプレフィックスを提示します。逆に、共有プレフィックスが長いほど、2つの場所は近くなります。