はい、サンプルの平均と分散を使用して類似の結果を得ることができます。おそらく、プロセスでいくつかのわずかな驚きが生じます。
最初に、質問文を少し改良して、いくつかの仮定を設定する必要があります。重要なことは、母集団の分散を右側のサンプル分散で置き換えることを期待できないことは明らかです。後者はランダムであるためです。そこで、我々は同等の不平等に私達の注意を再び焦点を合わせる
P(X−EX≥tσ)≤11+t2.
ケースでは、我々は単純に置き換えたこと、これらは同等であることに注意してください明確ではありません
tと
tσ一般性を損なうことなく、元の不平等では。
第二に、我々は、ランダムなサンプルがあるとX1,…,Xn、我々は、上位類似量行きに興味を持っている
P(X1−X¯≥tS)、X¯サンプル平均であり、Sサンプルの標準偏差です。
半歩前進
そのすでに元の片側チェビシェフの不等式を適用することにより、注、我々はそれを得る
P(X 1 - ˉ X ≥ T σ )≤ 1X1−X¯σ2=VR(X1)であり、より小さなオリジナルバージョンの右側より。意味あり!サンプルからのランダム変数の特定の実現は、母平均よりも貢献するサンプル平均に(わずかに)近い傾向があります。以下で説明するように、さらに一般的な仮定の下でσをSに置き換えます。
P(X1−X¯≥tσ)≤11+nn−1t2
σ2=Var(X1)σS
片側チェビシェフのサンプルバージョン
主張:をP(S = 0 )= 0となるようなランダムサンプルとします。その後、P(X 1 - ˉ X ≥ T S )≤ 1X1,…,XnP(S=0)=0特に、バウンドのサンプルバージョンは、元のポピュレーションバージョンよりも厳密です。
P(X1−X¯≥tS)≤11+nn−1t2.
注:X iには有限平均または分散があるとは想定していません!Xi
Proof. The idea is to adapt the proof of the original one-sided Chebyshev inequality and employ symmetry in the process. First, set Yi=Xi−X¯ for notational convenience. Then, observe that
P(Y1≥tS)=1n∑i=1nP(Yi≥tS)=E1n∑i=1n1(Yi≥tS).
Now, for any c>0, on {S>0},
1(Yi≥tS)=1(Yi+tcS≥tS(1+c))≤1((Yi+tcS)2≥t2(1+c)2S2)≤(Yi+tcS)2t2(1+c)2S2.
Then,
1n∑i1(Yi≥tS)≤1n∑i(Yi+tcS)2t2(1+c)2S2=(n−1)S2+nt2c2S2nt2(1+c)2S2=(n−1)+nt2c2nt2(1+c)2,
since
Y¯=0 and
∑iY2i=(n−1)S2.
The right-hand side is a constant (!), so taking expectations on both sides yields,
P(X1−X¯≥tS)≤(n−1)+nt2c2nt2(1+c)2.
Finally, minimizing over
c, yields
c=n−1nt2, which after a little algebra establishes the result.
That pesky technical condition
Note that we had to assume P(S=0)=0 in order to be able to divide by S2 in the analysis. This is no problem for absolutely continuous distributions, but poses an inconvenience for discrete ones. For a discrete distribution, there is some probability that all observations are equal, in which case 0=Yi=tS=0 for all i and t>0.
We can wiggle our way out by setting q=P(S=0). Then, a careful accounting of the argument shows that everything goes through virtually unchanged and we get
Corollary 1. For the case q=P(S=0)>0, we have
P(X1−X¯≥tS)≤(1−q)11+nn−1t2+q.
Proof. Split on the events {S>0} and {S=0}. The previous proof goes through for {S>0} and the case {S=0} is trivial.
A slightly cleaner inequality results if we replace the nonstrict inequality in the probability statement with a strict version.
Corollary 2. Let q=P(S=0) (possibly zero). Then,
P(X1−X¯>tS)≤(1−q)11+nn−1t2.
Final remark: The sample version of the inequality required no assumptions on X (other than that it not be almost-surely constant in the nonstrict inequality case, which the original version also tacitly assumes), in essence, because the sample mean and sample variance always exist whether or not their population analogs do.