2つの均一に分散されたポイント間の予想距離を見つける方法は?


9

Iは、座標を定義した場合およびX 2Y 2(X1,Y1)(X2,Y2)

X1,X2Unif(0,30) and Y1,Y2Unif(0,40).

それらの間の距離の期待値をどのように見つけますか?

距離は、によって算出されるので、私は、考えていたと期待される値ちょうど?1/30+1/302+1/40+1/402(X1X2)2+(Y1Y2)2)(1/30+1/30)2+(1/40+1/40)2


LaTeXコードが正しくレンダリングされませんでした。私は私の修正はあなたが意図したものであると思います
ピーターFlom -復活モニカ

ほとんど、しかしそれは結局私をそこに導くのを助けました、多くの感謝。
Mathlete 2013年

2
数学サイトの同等の質問:四角形内のランダムポイント間の平均距離。関連する質問:長方形の一様にランダムな点がユークリッド距離が指定されたしきい値未満である確率。(残念ながら、私は彼の提案について@whuberを取り上げることに決して取り掛かりませんでした。それを行うための時間を見つけるように努めます。)
枢機卿

1
それらのリンクをありがとう、@ cardinal。数学バージョンは答えを説明していませんが、それは提示しているだけであり、1つの派生へのリンクが含まれています。
whuber

回答:


2
##problem
x <- runif(1000000,0,30)
y <- runif(1000000,0,40)
Uniform <- as.data.frame(cbind(x,y))
n <- nrow(Uniform)
catch <- rep(NA,n)
for (i in 2:n) {
      catch[i] <-((x[i+1]-x[i])^2 + (y[i+1]-y[i])^2)^.5
}
mean(catch, na.rm=TRUE)
18.35855

私があなたが探しているものを正しく理解していれば、これが役立つかもしれません。X値はunif(0,30)から生成され、Y値はunif(0,40)から生成されるランダムなポイント間の距離を把握しようとしています。これらのそれぞれから分布への100万のRVを作成し、xとyをバインドして、それぞれのポイントを作成しました。次に、ポイント2と1の間の距離を、ポイント1,000,000と999,999の間の距離まで計算しました。平均距離は18.35855でした。これがあなたが探していたものと異なる場合はお知らせください。


フォーマットのために編集の自由を取りました。
curious_cat 2013年

2
あなたはかなり近くに来ました-たぶん偶然かもしれません。本当の答えは =です。コードには2つの問題があります。(1)反復は相互に独立していない。(2)妥当な精度を得るには、より高速になるようにコーディングする必要があります。のように、直接シミュレーションを実行してみませんか。標準誤差を計算することで確認できるので、(短時間で)約4つの有意な数値が得られます。18.3459191108(871+960log(2)+405log(3))18.345919n <- 10^7; distance <- sqrt((runif(n,0,30)-runif(n,0,30))^2 + (runif(n,0,40)-runif(n,0,40))^2)sd(distance) / sqrt(n)
whuber

@whuber:あなたの#1を説明できますか?たとえば(Case-I)と言うと、与えられた分布から乱数のペアを抽出し、差を計算して平均を取った。Versus(Case-II)一度に1つの数字を描き続け、最後の数字の抽選に関して実行中の差を計算し続け、その後平均しました。Case-IとCase-IIによって報告された平均値は体系的に異なりますか?
curious_cat 2013年

1
@curious_catいいえ、平均はほぼ同じですが、標準誤差の計算は異なります。平均が真の値にどの程度近づくかを推定するために、この計算が必要です。より複雑なSEの計算を計算するのではなく、質問で規定されているとおりに、完全に互いに独立してポイントのペアを生成する方が簡単です。(シミュレーションが
失敗する原因

@whuber:明確にしていただきありがとうございます。それで、クラークが彼のコードをより長く実行したならば、彼はより多くの小数位を得たかもしれませんか?
curious_cat 2013年

16

幾何学的に質問を見ると、凸型セット内の2つの独立した均一なランダムポイント間の予想距離は、その直径の半分より少し小さくなることが明白です。(2つのポイントがコーナーなどの極端な領域内に配置されることは比較的まれであり、多くの場合、それらは中心の近くにあり、それらは近くにあります。)この長方形の直径は、これにより推論だけでは、答えは弱になると予想します。255025

正確な答えは、距離の確率加重値としての期待の定義から得られます。一般に、辺がで長方形を考えます。後で正しいサイズに拡大します(設定し、期待値にを掛けます)。この長方形の場合、座標を使用すると、一様確率密度はます。この長方形内の平均距離は、1λλ=40/3030(x,y)1λdxdy

0λ010λ01(x1x2)2+(y1y2)21λdx1dy11λdx2dy2.

基本的な統合方法を使用するのは簡単ですが、行うのは面倒です。コンピューター代数システム(Mathematica)を使用して答えを取得しました

[2+2λ521+λ2+6λ21+λ22λ41+λ2+5λArcSinh(λ)+5λ4log(1+1+λ2λ)]/(30λ2).

これらの用語の多くにが存在しても驚くことではありません。これは、長方形の直径(その中の任意の2点間の最大距離)です。対数(arcsinhを含む)の出現も、単純な平面図内の平均距離を調べた場合は当然のことです。どういうわけか常に表示されます(これのヒントは割線関数の積分に現れます)。ちなみに、分母にが存在することは、との辺の長方形が関係する問題の詳細とは何の関係もありません。これは普遍的な定数です。)1+λ2303040

の因子によってスケールアップに、この評価さ。30 1λ=4/3301108(871+960log(2)+405log(3))18.345919


状況をより深く理解する1つの方法は、さまざまな値のについて、の直径に対する平均距離をプロットすることです。極端な値(近い、またははるかに超える)の場合、長方形は基本的に1次元になり、より基本的な積分は、平均距離が直径の3分の1に減少することを示します。また、とある長方形の形状は同じであるため、結果を対数スケールでプロットするのが自然です。(正方形)について対称でなければなりません。ここにあります: λ01λ1/λλλ=11+λ2λ01λ1/λλλ=1

プロット

これで経験則がわかります。長方形内の平均距離は直径のから(約)であり、大きい値は四角い長方形に関連付けられ、小さい値は長いスキニー(線形)に関連付けられます。 )長方形。これらの両極端の間の中点は、アスペクト比が長方形でほぼ達成されます。このルールを念頭に置いて、長方形をちらっと見て、2つの重要な数字までの平均距離を見積もることができます。0.37 3 11/30.330.373:1


「直径」ではなく「対角線」にすべきですか?私がつまらない場合は申し訳ありません。
curious_cat 2013年

@curious_cat定義により、(任意のメトリック空間内の)ポイントのセットの直径は、その中の任意の2つのポイント間の距離の上限です。長方形の場合、それは(明らかに)対角線の長さです。
whuber

ありがとう!気づきませんでした。私は素朴な直径の概念を使用していました。
curious_cat 2013年

余談ですが、特定の領域のすべての長方形について、正方形の平均距離は最小化されますか?
curious_cat 2013年

2
精神では、この、私はあなたがこの答えを開始していることを望む「それはある平面 ...」(1)
カーディナル
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.