上部中央付近にあるベータ中央値()の式は概算であることに注意してください。Pythonのベータ分布の逆累積分布関数(値関数)を使用して、効果的に「正確な」数値中央値を計算できるはずです(、およそ中央値が得られますが、式はを与え)。α−13α+β−23beta(2,3)0.38570.3846
切り捨てられた分布のこの平均は、ベータ版ではかなり単純です。正の確率変数の場合、
E(X|X<k)=∫k0xf(x)dx/∫k0f(x)dx
ここで、はパラメータおよびを持つベータの密度です(これを記述します):fαβf(x;α,β)
f(x;α,β)=1B(α,β)xα−1(1−x)β−1,0<x<1,α,β>0
したがって、xf(x)=B(α+1,β)B(α,β)f(x;α+1,β)=αα+βf(x;α+1,β)
したがって、E(X|X<k)=αα+β∫k0f(x;α+1,β)dx/∫k0f(x;α,β)dx
現在、2つの積分は、Pythonですでに使用可能なベータCDFです。
我々が得る。これはシミュレーションと一致しています(シミュレーションはを与え)。α=2,β=3,k=0.4E(X|X<0.4)≈0.24195106≈0.24194
中央値の場合、
、これもシミュレーションと一致しています(シミュレーションでは)。F−1(12F(0.4;2,3);2,3)≈0.25040106≈0.25038
この場合、2つはかなり近いですが、それは一般的な結果ではありません。それらは時々もっと大きく異なるかもしれません。