サンプル平均が与えられたサンプル中央値の期待値


16

ましょう中央値を表すとletサイズのランダムサンプルの平均を表しである分布から。を計算するにはどうすればよいですか?ˉ X N = 2 のk + 1 N μ σ 2E Y | ˉ X = ˉ XYX¯n=2k+1N(μ,σ2)E(Y|X¯=x¯)

直観的には、正規性の仮定のため、と主張するのは理にかなっています。しかし、それを厳密に示すことはできますか?E(Y|X¯=x¯)=x¯

私の最初の考えは、一般に既知の結果である条件付き正規分布を使用してこの問題にアプローチすることでした。問題は、期待値と中央値の分散がわからないため、次統計量を使用してそれらを計算する必要があるということです。しかし、それは非常に複雑で、絶対に必要な場合を除き、私はそこに行きたくありません。 k+1


2
これは、stats.stackexchange.com / a / 83887に投稿したばかりの一般化の直接的な結果だと思います。残差の分布は、xix¯はっきりについて対称である0したがって、その平均値がゼロである、彼らの中央値は、対称分布を持ってそこから、。したがって、中央値自体の期待は(だけでなく、残差)に等しい0+E(X¯ | X¯=x¯)=x¯、QEDを。
whuber

@whuber申し訳ありませんが、残差はありますか?
JohnK 14年

私はコメントでそれらを定義しました:それらは各xiとそれらの平均の違いです。
whuber

@whuberいいえ、わかりませんが、あなたの他の答えが私の質問にどのように関係しているか、そしてあなたが使った期待が正確にどのように機能するかを理解するためにまだ取り組んでいます。
JohnK 14年

2
オーケー@whuber私が間違っている場合は、正しい私を喜ばE(Y|X¯)=E(X¯|X¯)+E(YX¯|X¯)そして今、第二項はゼロ理由中央値は、対称の周りにあるx¯。したがって、期待が減少するx¯
JohnK

回答:


7

ましょ示す元のサンプル及びZは、エントリのランダムベクトルZのK = X K - ˉ Xを。次に、Zは通常の中心になります(ただし、その合計は完全な確率でゼロであるという事実からわかるように、そのエントリは独立ではありません)。線形機能としてX、ベクトルZ ˉ Xはことを示すために、したがって、その共分散行列で十分の計算正常でZは無関係であるˉ XXZZk=XkX¯ZX(Z,X¯)ZX¯

参照する、一つはその見Y = ˉ X + T Tは中央値であるZ。具体的には、Tは、に依存Zだけ従ってTは無関係であるˉ X、及び分布Zは、したがって対称的であるTが中心に置かれます。YY=X¯+TTZTZTX¯ZT

最後に、

E(YX¯)=X¯+E(TX¯)=X¯+E(T)=X¯.

ありがとう
JohnK 14年

7

サンプルの中央値は次数統計であり、非正規分布を持っているため、サンプルの中央値とサンプルの平均の有限サンプル分布(これは正規分布を持っています)は二変量正規分布ではありません。近似に頼ると、漸近的に次のことが成り立ちます(こちらの私の答えをご覧ください):

n[(X¯nYn)(μv)]LN[(00),Σ]

Σ=(σ2E(|Xv|)[2f(v)]1E(|Xv|)[2f(v)]1[2f(v)]2)

where X¯n is the sample mean and μ the population mean, Yn is the sample median and v the population median, f() is the probability density of the random variables involved and σ2 is the variance.

So approximately for large samples, their joint distribution is bivariate normal, so we have that

E(YnX¯n=x¯)=v+ρσvσX¯(x¯μ)

where ρ is the correlation coefficient.

Manipulating the asymptotic distribution to become the approximate large-sample joint distribution of sample mean and sample median (and not of the standardized quantities), we have

ρ=1nE(|Xv|)[2f(v)]11nσ[2f(v)]1=E(|Xv|)σ

So

E(YnX¯n=x¯)=v+E(|Xv|)σ[2f(v)]1σ(x¯μ)

We have that 2f(v)=2/σ2π due to the symmetry of the normal density so we arrive at

E(YnX¯n=x¯)=v+π2E(|Xμσ|)(x¯μ)

where we have used v=μ. Now the standardized variable is a standard normal, so its absolute value is a half-normal distribution with expected value equal to 2/π (since the underlying variance is unity). So

E(YnX¯n=x¯)=v+π22π(x¯μ)=v+x¯μ=x¯

2
As always, nice answer +1. However, since we have no information about the sample size, the asymptotic distribution might not hold. If there is no way to obtain the exact distribution though, I suppose I'll have to make do. Thank you very much.
JohnK

6

The answer is x¯.

Let x=(x1,x2,,xn) have a multivariate distribution F for which all the marginals are symmetric about a common value μ. (It does not matter whether they are independent or even are identically distributed.) Define x¯ to be the arithmetic mean of the xi, x¯=(x1+x2++xn)/n and write xx¯=(x1x¯,x2x¯,,xnx¯) for the vector of residuals. The symmetry assumption on F implies the distribution of xx¯ is symmetric about 0; that is, when ERn is any event,

PrF(xx¯E)=PrF(xx¯E).

Applying the generalized result at /stats//a/83887 shows that the median of xx¯ has a symmetric distribution about 0. Assuming its expectation exists (which is certainly the case when the marginal distributions of the xi are Normal), that expectation has to be 0 (because the symmetry implies it equals its own negative).

Now since subtracting the same value x¯ from each of a set of values does not change their order, Y (the median of the xi) equals x¯ plus the median of xx¯. Consequently its expectation conditional on x¯ equals the expectation of xx¯ conditional on x¯, plus E(x¯ | x¯). The latter obviously is x¯ whereas the former is 0 because the unconditional expectation is 0. Their sum is x¯, QED.


Thank you for posting it as a full answer. I now understand the essence of your argument but I might ping you if something is still unclear.
JohnK

5
JohnK, I need to alert you to be cautious. A counterexample to this argument has been brought to my attention. I have encouraged its originator to post it here for further discussion, but briefly it concerns a discrete bivariate distribution with symmetric marginals but asymmetric conditional marginals. Its existence points to a flawed deduction early in my argument. I currently hope that the argument might be rescued by imposing stronger conditions on the xi, but my attention is presently focused elsewhere and I might not get to think about this for awhile.
whuber

4
In the meantime I would encourage you to unaccept this answer. I would ordinarily delete any answer of mine known to be incorrect, but (as you might be able to tell) I like solutions based on first principles rather than detailed calculations, so I hope this argument can be rescued. I therefore intend to leave it open for criticism and improvement (and therefore made it CW); let the votes fall as they may.
whuber

もちろん、私に知らせてくれてありがとう。時間があれば、さらに説明します。それまでの間、@ Alecos Papadopoulosによって提案された漸近的な議論に落ち着きます。
JohnK

6

これは、上記の答えよりも簡単です。サンプル平均は完全で十分な統計です(分散がわかっているが、結果が分散に依存しないため、分散が不明な状況でも有効です)。次に、Rao-BlackwellとLehmann-Scheffeの定理(ウィキペディアを参照)は、算術平均が与えられた場合の中央値の条件付き期待値が、期待値の一意の最小分散不偏推定量であることを意味しますμ。しかし、それは算術平均であることがわかっているため、結果は次のようになります。

また、中央値が不偏推定量であることも使用しました。これは対称性に基づいています。


1
By symmetry E[Y]=μ, indeed. Then from these two theorems we know that E[Y|X¯] is the Unique Minimum Variance Unbiased Estimator for μ which we already know to be equal to X¯. This is a brilliant answer, thank you very much. I would have marked it as the correct one, had I not done that already for another answer.
JohnK
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.