連続ランダムのi次統計量の分布PDFの変数は、「ベータF」複合分布によって与えられます。この分布について考える直観的な方法は、サンプルでi次の統計量を考慮することです。ランダム変数のi次統計量の値がと等しくなるためには、3つの条件が必要です。
NXx
- i−1未満の値。これは、各観測値確率を持ちます。ここで、は確率変数XのCDFです。xFX(x)FX(x)=Pr(X<x)
- N−i上の値、これは確率x1−FX(x)
- を含む無限小区間内の1つの値、これには確率がありますは確率変数 PDFxfX(x)dxfX(x)dx=dFX(x)=Pr(x<X<x+dx)X
この選択を行うには方法があります。(N1)(N−1i−1)
fi(xi)=N!(i−1)!(N−i)!fX(xi)[1−FX(xi)]N−i[FX(xi)]i−1dx
私の元の投稿で編集、私はこの点からさらに進むことで非常に悪い試みをしました、そして以下のコメントはこれを反映しています。私はこれを以下で修正しようとしました
このpdfの平均値を取得すると、次のようになります。
E(Xi)=∫∞−∞xifi(xi)dxi
そして、この積分では、変数次のように変更します(@henryのヒントを使用)。積分は次のようになります。pi=FX(xi)
E(Xi)=∫10F−1X(pi)Beta(pi|i,N−i+1)dpi=EBeta(pi|i,N−i+1)[F−1X(pi)]
したがって、これは逆CDFの期待値であり、デルタ法を使用して次のように近似できます。
EBeta(pi|i,N−i+1)[F−1X(pi)]≈F−1X[EBeta(pi|i,N−i+1)]=F−1X[iN+1]
より適切な近似を行うには、2次(微分を示す素数)に展開し、逆の2次導関数が次のようになることに注意します。
∂2∂a2F−1X(a)=−F′′X(F−1X(a))[F′X(F−1X(a))]3=−f′X(F−1X(a))[fX(F−1X(a))]3
ましょう。それから私達にあります:νi=F−1X[iN+1]
EBeta(pi|i,N−i+1)[F−1X(pi)]≈F−1X[νi]−VarBeta(pi|i,N−i+1)[pi]2f′X(νi)[fX(νi)]3
=νi−(iN+1)(1−iN+1)2(N+2)f′X(νi)[fX(νi)]3
さて、通常の場合に特化した
fX(x)=1σϕ(x−μσ)→f′X(x)=−x−μσ3ϕ(x−μσ)=−x−μσ2fX(x)
FX(x)=Φ(x−μσ)⟹F−1X(x)=μ+σΦ−1(x)
なお、そして、およそ次のようになります。fX(νi)=1σϕ[Φ−1(iN+1)]
E[xi]≈μ+σΦ−1(iN+1)+(iN+1)(1−iN+1)2(N+2)σΦ−1(iN+1)[ϕ[Φ−1(iN+1)]]2
そして最後に:
E[xi]≈μ+σΦ−1(iN+1)⎡⎣⎢⎢1+(iN+1)(1−iN+1)2(N+2)[ϕ[Φ−1(iN+1)]]2⎤⎦⎥⎥
@whuberが指摘しているように、これは正確ではありません。実際には、異なるパラメーターを持つベータの歪度のために、それはより悪いかもしれないと思います