地理座標に一連の場所があります。各場所で記録された変数のグループごとの平均を計算するために、階層的クラスタリングとそれに続くさまざまな「高さ」でのツリーカットを使用してポイントをグループ化したいと思います。
緯度と経度が等間隔ではないため、地理座標の距離行列の階層的クラスタリングは、グループを形成するための誤解を招く方法であると私は推測しています。
次に、次の2つの方法を想像できます。
- 距離メトリックに大圏距離を使用します。
- 地理座標を均等にスケーリングされた投影に変換し、ユークリッド距離を求めます。
オプション2の実行はより複雑ですが、これらのアプローチは同等ですか?そして、これらの場合の木の伐採高さの正確な意味は何ですか?
2
Re 2:「等倍投影」のようなものはありません。任意の投影で取得される距離行列は、測地線距離を使用する場合と異なります。ただし、すべてのポイントが近くにある場合(たとえば、互いに数千キロメートル以内にある場合)は、距離行列が正しいものにかなり近い近似を持つ多くの投影があります。地球全体で作業する場合は、3番目のオプションを使用できます。3D距離行列の使用を検討してください。計算は簡単で、一般に、測地線距離と同様の結果が得られます。
—
whuber