正規分布クロックの不正確さの修正


10

特定のイベントの発生を測定する、世界中に分散した何百ものコンピューターで実行される実験があります。各イベントは互いに依存しているので、それらを昇順に並べてから、時間差を計算できます。

イベントは指数的に分布する必要がありますが、ヒストグラムをプロットすると、次のようになります。

イベントのヒストグラム

コンピュータのクロックが不正確であるため、一部のイベントには、依存するイベントよりも早いタイムスタンプが割り当てられます。

PDFのピークが0ではない(全体が右にシフトした)ために、クロック同期が非難されるのではないかと思いますか?

クロックの差が正規分布している場合、影響が互いに相殺し、計算された時間差だけを使用すると仮定できますか?

回答:


13

クロック同期の問題により、実際にピークが右にシフトする可能性があります。次のRのシミュレーションは、この現象を示しています。指数時間と通常の時計の差を使用して、おおよその画像に似た形状を取得しました。

時計

左側の分布(実際の差、エラーなしで測定)のピークは0ですが、右側の分布(エラーありで測定された差)のピークは100前後です。

Rコード:

set.seed(20120904)

# Generate exponential time differences:
x<-rexp(100000,1/900)

# Generate normal clock differences:
y<-rnorm(100000,0,50)

# Resulting observations:
xy<-x+y

# Truncate at 500:
xy<-xy[xy<=500]

# Plot histograms:
par(mfrow=c(1,2))
hist(x[x<=500],breaks=100,col="blue",main="Actual differences")
hist(xy,breaks=100,col="blue",main="Observed differences")
lines(c(0,0),c(0,550),col="red")

クロックの差が平均0で正常である場合、観測された差の平均は実際の差の平均と等しくなければならないという意味で、差は相殺されます。これが当てはまるかどうかは、最初のイベントが発生するコンピューターと2番目のイベントが発生するコンピューターの間に系統的な違いがあるかどうかによって異なります。


4
+1見事に図解。数学的には、データは誤差分布と(推定)指数分布の合計から得られます。エラー分布を推定し、データをデコンボリューションして真の分布を推定するのは魅力的です。
whuber
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.