正確な確率を計算することはできませんが(特別な状況を除きます)、数値的にすばやく正確に計算できます。この制限にもかかわらず、標準偏差が最大のランナーが勝つ可能性が最も高いことを厳密に証明できます。図は状況を示し、この結果が直感的に明らかな理由を示しています。n≤2
5人のランナーの時間の確率密度が表示されます。すべては共通の平均に関して連続的で対称的です。(すべての時間が正の値になるように、スケーリングされたベータ密度が使用されました。)濃い青で描かれた1つの密度は、より大きな広がりを持っています。左尾の可視部分は、他のランナーが通常は一致できない時間を表します。比較的大きな面積を持つ左テールはかなりの確率を表しているため、この密度のランナーがレースに勝つ可能性が最も高くなります。(彼らは最後に来る最大のチャンスもあります!)μ
これらの結果は、正規分布だけでなく証明されています。ここで紹介する方法は、対称で連続的な分布にも同様に適用されます。 (これは、実行時間をモデル化するために正規分布を使用することに反対する人にとって興味深いものです。)これらの仮定に違反すると、最大の標準偏差を持つランナーが勝つ可能性が最も高くない可能性があります(反例の構築はただし、SDが十分に大きければ、SDが最大のランナーが勝つ可能性が最も高いという穏やかな仮定の下で証明できます。
この図は、片側のみへの分布の分散を測定する標準偏差の片側アナログ(いわゆる「セミバリアンス」)を検討することでも同じ結果が得られることを示唆しています。左側に大きく分散している(より良い時間に向かって)ランナーは、ディストリビューションの残りの部分で何が起こっているかに関係なく、勝つ可能性が高くなるはずです。これらの考慮事項は、(グループ内で)最高であることの特性が、平均などの他の特性とどのように異なるかを理解するのに役立ちます。
ましょランナー時間を表すランダム変数です。問題は、それらが独立しており、共通の平均μで正規分布していることを前提としています。(これは文字通り不可能なモデルですが、負の時間の正の確率を仮定しますが、標準偏差が実質的にμより小さい場合、現実の合理的な近似になります。)X1,…,Xnμμ
以下の議論を実行するために、独立性の仮定を保持しますが、そうでなければ、分布はF iによって与えられ、これらの分布法則は何でもあり得ると仮定します。 便宜上、分布F nが密度f nで連続していると仮定します。後で、必要に応じて、正規分布のケースが含まれている場合は、追加の仮定を適用できます。XiFiFnfn
任意のyおよび無限小のdyについて、最後のランナーが間隔内の時間(y−dy,y]持ち、すべての関連する確率を乗算することによって得られる(すべての時間は独立しているため)チャンス:
Pr(Xn∈(y−dy,y],X1>y,…,Xn−1>y)=fn(y)dy(1−F1(y))⋯(1−Fn−1(y)).
これらの相互に排他的な可能性をすべて統合することにより、
Pr(Xn≤min(X1,X2,…,Xn−1))=∫Rfn(y)(1−F1(y))⋯(1−Fn−1(y))dy.
正規分布の場合、場合、この積分は閉じた形で評価できません。数値評価が必要です。n>2
この図は、標準偏差が1:2:3:4:5の比率である5人のランナーそれぞれの被積分関数をプロットしています。SDが大きいほど、関数はより左にシフトされ、その面積が大きくなります。面積は約8:14:21:26:31%です。特に、最大のSDを持つランナーは31%の確率で勝ちます。
閉じたフォームは見つかりませんが、確固たる結論を導き出し、SDが最大のランナーが勝つ可能性が最も高いことを証明できます。などの 分布の標準偏差が変化するとどうなるかを調べる必要があります。ランダム変数X nがその平均を中心にσ > 0で再スケーリングされると、そのSDにσが乗算され、f n(y )d yはf n(y / σ )d y / σに変化しますFnXnσ>0σfn(y)dyfn(y/σ)dy/σ。変数の変更を作るの積分では、ランナーのチャンスのために表現できますn個の関数として、勝利をσ:y=xσnσ
ϕ(σ)=∫Rfn(y)(1−F1(yσ))⋯(1−Fn−1(yσ))dy.
ここで、すべてのn分布の中央値が等しく、すべての分布が対称で連続しており、密度がf iであるとします。(これは、質問の条件下では確かに当てはまります。なぜなら、標準の中央値はその平均値だからです。)変数の単純な(位置)変化により、この共通の中央値は0であると仮定できます。対称性とは、f n(y )= f n(− y )および1 − F j(− y )= F j(ynfi0fn(y)=fn(−y)すべての yに対して。これらの関係は不可欠オーバーを結合するために私達を可能にする(- ∞ 、0 ]の積分を超えると(0 、∞ )与えます1−Fj(−y)=Fj(y)y(−∞,0](0,∞)
ϕ(σ)=∫∞0fn(y)(∏j=1n−1(1−Fj(yσ))+∏j=1n−1Fj(yσ))dy.
関数微分可能です。被積分関数を微分することにより得られるその導関数は、各項が次の形式の積分の合計です。ϕ
yfn(y)fi(yσ)(∏j≠in−1Fj(yσ)−∏j≠in−1(1−Fj(yσ)))
以下のために。i=1,2,…,n−1
私たちは、ディストリビューションについて行われた仮定は、それを確実にするために設計されたのためのx ≥ 0。以降このように、X = Y σ ≥ 0、左製品における各用語が適切な製品で、その対応する用語を超え、製品の違いを意味することは非負です。他の要因Y F N(Y )F I(Y σは)密度が負であることができないので、明らかに非負であり、そしてFj(x)≥1−Fj(x)x≥0x=yσ≥0yfn(y)fi(yσ)。我々は結論付けることができる φを'(σ )≥ 0のための σ ≥ 0、証明そのチャンスそのプレイヤー Nの標準偏差が勝利増加 X nが。y≥0ϕ′(σ)≥0σ≥0nXn
これは、X nの標準偏差が十分に大きければ、ランナーが勝つことを証明するのに十分です。これは、SDが大きいと物理的に非現実的なモデルになる可能性があるため、あまり満足のいくものではありません(負の勝利時間にはかなりのチャンスがある場合)。しかし、すべての分布が標準偏差を除いて同一の形状を持っていると仮定します。彼らはすべて同じSDを持っている場合この場合、Xは、私は独立しており、同一分布:誰が誰よりも大きいか、勝利の低いチャンスを持つことはできませんので、すべてのチャンスは(に等しい1 / N)。すべての分布をランナーnの分布に設定することから始めますnXnXi1/nn。次に、他のすべてのランナーのSDを1つずつ徐々に減らします。これが発生すると、勝つ可能性は減少できませんが、他のすべてのランナーの可能性は減少します。その結果、nが勝つ可能性が最も高くなります(QED)。nn