未満の距離空間の点集合の中心点を見つけますか?


9

メトリック空間で定義されたポイントのセットがあるので、ポイント間の「距離」を測定できますが、それ以外は測定できません。このセット内で最も中心的なポイントを見つけたいと思います。これを、他のすべてのポイントまでの距離の合計が最小になるポイントとして定義します。メトリックの計算は遅いため、可能な限り回避する必要があります。

このポイントを見つける明白な方法は、メトリック距離計算を使用します。これは、(a)各ポイントについて、他のすべてのポイントまでの距離の合計を計算し、(b)最小ポイントを取るためです。2

未満の距離比較でこれを行う方法はありますか?(おそらく、三角形の不等式を何らかの方法で利用していますが、これは私の測定基準に当てはまるはずです。)O2

正確な方法が存在しない場合は、適切な近似で十分です。


三角形の不等式(または測定されていないエッジに関する情報を取得する他の方法)がない場合、が唯一の解決策です。これは敵対的な議論で見ることができます。O2
Kittsil

三角形の不等式が利用可能であると仮定します-それは私の測定基準のためでなければなりません。
オープンドアロジスティクス

これは基本的に、三角形の等式でグラフの無線を計算しています。
Kaveh

@カベ私はあなたが半径を意味していると思います...グラフの端が切れていない限り。知らない語彙が多すぎるので確認しています。---しかし、それは完全なグラフであり、入力サイズは頂点の数のみです。
バブー2015

@OpenDoorLogistics三角形の不等式がない場合、定義により、これはメトリック空間ではありません。質問を明確にしてください。メトリック空間であることがわかっている場合は、三角形の不等式があることがわかります。三角形の不等式があることを知らない場合は、それが計量空間であると主張することはできません。
David Richerby

回答:


6

いいえ。最悪の場合、よりも上手くいくことはできません。Θ2

ポイントのすべてのペアが互いに距離にあるポイントの配置を考えます。(これは可能な構成です。)次に、すべてのエッジを調べるよりも良い方法はありません。あなたが検討していないすべてのエッジがある場合は特に、その後、攻撃者は、いずれかのようにその辺の長さを選ぶことができる0.91.0、または1.1 ; これらの選択はすべて、これまでに行った他のすべての観察およびメトリックの要件(たとえば、三角形の不等式)と一致しているため、3つすべてが可能です。ただし、異なる出力が必要です。したがって、アルゴリズムがそのエッジを調べずに何かを出力しない場合、攻撃者は常に、アルゴリズムの出力を誤ってしまう未調査のエッジの長さを選択できます。10.91.01.1


ただし、すべての点が(座標が与えられていなくても)に存在することがわかっている場合は、縮退がない(サブセットがないと仮定して、O d + 1 n )の距離を測定することで問題を解決できます。d + 1ポイントは同一平面上にあります)。RdOd+1d+1

特に、ポイントをランダムに選択します。これらはアンカーポイントになります。それらのペアワイズ距離を指定すると、ペアワイズ距離と一致する座標を計算できます。ここで、他のすべてのポイントPについてPから各アンカーポイントまでの距離を計算します。三角測量とこれらの距離を使用して、アンカーポイントを基準にしたPの位置、つまりPの座標を計算できます。すべての非アンカーポイントPに対してこれを行いますd+1PPPPP。これで、すべてのポイントの座標が得られました。これらの座標を使用して、オラクルにペアワイズ距離を要求することなく、中心点を見つけることができます。この最後のステップを時間より速く実行できるかどうかはわかりませんが、ペアワイズ距離を測定しなくても実行できます。O2


あなたは持っているの点の次元でのn - 1。入力のすべての座標を見る場合でも、Θ n 2時間必要です。1Θ2
Louis

@Louis質問は寸法については何も言わず、それがメトリックであるかどうかはわかりません。私たちが持っているのは、三角形の不平等です。したがって、適切なビューは、Kavehのコメントのビューです。完全なグラフとして。それはこの答えと一致しています。しかし、が無限に大きくなるとき、それが固定メトリックと一致するかどうかはわかりません。
バブー2015

@DWありがとう-平均的なケースではもっと良いことはできますか?これは実際の問題によって動機付けられているため、データは「平均的」である可能性があります(意味が何であれ)。
オープンドアロジスティクス

@all-混乱に関する謝罪re:メトリック(私は理論上のCSの素人です)。私の距離関数は、Wikipediaの計量空間リンクの定義に従って、計量空間の4つの基準に確実に従います。
オープンドアロジスティクス

@OpenDoorLogistics、私はより良くすることが可能であると思われる特別なケースを1つ追加しました。
DW

0

メトリック空間の高速アルゴリズムに関するPiotr Indykの作業を確認してください。(メトリックスペースの問題のためにサブリニアアルゴリズムで、STOC '99の予稿集、pp.428-434 ACM、1999; PS)第3節では線形時間近似1-メジアンアルゴリズムを与えます。


1
アルゴリズムの概要を教えてください。私たちは理想的には、外部コンテンツへのリンクではなく、完全な答えを探しています。
David Richerby

返信が非常に遅いことをお詫びします。StackExchangeを頻繁にチェックしないのは明らかです。Piotrの論文は美しく書かれており、アルゴリズムを非常にはっきりと説明しており、その隣にすべての正確な定義がありますが、適切な要約を書くには1時間以上かかると思います。個人的には、私が作成できる中品質の内部コンテンツではなく、この高品質の外部コンテンツを利用することを強くお勧めします。簡単な答えは、おおよその中央値を見つけるだけの場合は、線形時間O(n)で求めることができます。
user71641 2017年
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.