私のクラスでは、「単純な」状況を使用します。これは、自由度が何を意味するのか疑問に思うかもしれません。
これは、テーマに対する「フォレストガンプ」アプローチのようなものですが、試してみる価値があります。
平均および分散が不明な通常の母集団から来た10個の独立した観測があるとします。X1,X2,…,X10∼N(μ,σ2)μσ2
あなたの観察はと両方に関する情報を集合的にもたらします。結局のところ、観測値は実際の値と未知の値に近いはずの1つの中心値に広がる傾向があり、同様に、が非常に高いか非常に低い場合は、観測値を見ることができますそれぞれ非常に高い値または非常に低い値を収集します。適切な「代替」は(実際の値の知識がない場合)、観測の平均であるです。 μσ2μμμX¯
また、観測値が互いに非常に近い場合は、が小さくなければならないことを示す可能性があり、同様に、が非常に大きい場合は、大幅に異なる値が表示されることが予想されます用に。 σ2σ2X1X10
との実際の値に週の賃金を賭ける場合、お金を賭ける値のペアを選択する必要があります。小数点以下200桁まで正しく推測しない限り、給料を失うほど劇的なことは考えないでください。いや。とを推測するほど報酬が増えるという賞賛システムを考えてみましょう。μσ2μμσ2
ある意味では、の値に対するより良い、より多くの情報に基づいた、より丁寧な推測はます。その意味で、は周りの何らかの値でなければならないと推定し。同様に、「代替」として適切なもの(現時点では必要ありません)は、サンプル分散であるであり、これにより適切な推定が行われます。μX¯μX¯σ2S2σ
これらの代替がとの実際の値であると信じている場合、おそらく間違っているでしょう。なぜなら、非常にスリムで幸運だったので、観測が調整されて贈り物が得られるからです。はに等しく、は等しい。いや、おそらくそれは起こらなかった。μσ2X¯μS2σ2
しかし、あなたはさまざまなレベルの悪で、少し間違ったものから、本当に、本当に、本当に悲惨な間違ったものまでさまざまです(別名、「バイバイ、給料。来週お会いしましょう!」)。
では、推測としてしたとしましょう。と 2つのシナリオだけを考えてみましょう。最初に、あなたの観察結果はかなり近くにあります。後者では、観察結果は大きく異なります。どのシナリオで、あなたはあなたの潜在的な損失にもっと関心を持つべきですか?2番目のものを考えた場合、あなたは正しい。についての推定値は、賭けに対する自信を非常に合理的に変化させます。より大きなあるほど、が変化することを期待できます。X¯μS2=2S2=20,000,000σ2σ2X¯
しかし、についての情報を超えてと、あなたの観測も有益でもない話ではありませんだけで、純粋なランダムな変動のいくつかの量運ぶもおよそ。 μσ2μσ2
どうやって気付くことができますか?
さて、議論のために、神は存在し、と両方の実際の(そして今のところ未知の)値を具体的に伝えること自体に余裕があると仮定します。μσ
そして、ここにこのリゼルギー物語の迷惑なプロットのねじれがあります:彼はあなたがあなたの賭けをした後にあなたにそれを伝えます。おそらくあなたを啓発し、おそらくあなたを準備し、おそらくあなたをあざけるために。どうやって知りますか?
さて、それであなたの観測に含まれるとについての情報は今ではまったく役に立たなくなります。観測の中心位置と分散は、すでに知っているので、との実際の値に近づくのに役立ちません。μσ2X¯S2μσ2
神をよく知っていることの利点の1つは、を使用して正確にを推測できなかったこと、つまり推定誤差を実際に知ることができることです。μX¯(X¯−μ)
さて、、(もしそうなら私に信頼してください)、(わかりました、私も信頼してください)、そして最後に、
(それは何だと思いますか?私も信頼してください)、またはに関する情報はまったくありません。Xi∼N(μ,σ2)X¯∼N(μ,σ2/10)(X¯−μ)∼N(0,σ2/10)
X¯−μσ/10−−√∼N(0,1)
μσ2
あのね?個々の観測値のいずれかを推測として使用した場合、推定誤差はとして分布します。まあ、推定の間とと任意の選択し、、より良いビジネスになるので、そうは、個々のよりも惑わされにくい傾向がありました。μ(Xi−μ)N(0,σ2)μX¯XiX¯Var(X¯)=σ2/10<σ2=Var(Xi)X¯μXi
とにかく、ももについても全く情報がありません。(Xi−μ)/σ∼N(0,1)μσ2
「この物語は終わりますか?」あなたは考えているかもしれません。また、「およびについて情報を提供しないランダムな変動はありますか?」μσ2
[あなたは後者について考えていると思うのが好きです。]
はいあります!
以下のためのあなたの推定誤差の平方とで割っ、
二乗分布であるカイ二乗分布、持っているの標準的な通常の私は、あなたが気づいては絶対にありいずれかに関する情報も、しかし、あなたが直面していることを期待すべき変動についての情報を伝えていません。μXiσ
(Xi−μ)2σ2=(Xi−μσ)2∼χ2
Z2Z∼N(0,1)μσ2
これは非常によく知られた分布であり、10回の観測のそれぞれについてギャンブル問題のシナリオから、そして平均からも自然に発生します。
および10個の観測の変動の収集から:
最後の人はカイ二乗分布を持たない、なぜなら彼はそれらのカイ二乗分布の10の合計であり、それらはすべて互いに独立しているからだ(
(X¯−μ)2σ2/10=(X¯−μσ/10−−√)2=(N(0,1))2∼χ2
∑i=110(Xi−μ)2σ2/10=∑i=110(Xi−μσ/10−−√)2=∑i=110(N(0,1))2=∑i=110χ2.
X1,…,X10)。これらの単一のカイ2乗分布のそれぞれが、直面するはずのランダムな変動の量への1つの寄与であり、合計への寄与はほぼ同じです。
各寄与の値は他の9つの値と数学的に等しくありませんが、それらはすべて、分布において同じ期待される動作をします。その意味で、それらは何らかの形で対称的です。
それらのカイ二乗のそれぞれは、その合計で予想される純粋でランダムな変動性の量への1つの寄与です。
100個の観測値がある場合、上記の合計は、より多くの寄与のソースがあるという理由だけで大きくなると予想されます。
同じ振る舞いを持つ「貢献のソース」のそれぞれは、自由度と呼ばれます。
ここで、1つまたは2つ前の手順を実行し、必要に応じて前の段落を読み直して、求められている自由度の突然の到着に対応します。
ええ、各自由度は、必ず発生することが予想され、またはの推測の改善に何ももたらさない変動の1つの単位と考えることができます。μσ2
重要なのは、これらの10の同等の変動源の振る舞いに頼り始めることです。100個の観測値がある場合、その合計に対して厳密にランダムな変動の100の独立した同等に振る舞うソースがあります。
10カイ二乗の合計が呼び出されるとカイ二乗分布10自由度を今から、と書かれた。私たちは、数学的に呼ばれるに今からその単一のカイ二乗分布(から密度から派生することができ、その確率密度関数から始まることを期待するかを記述できるとカイ二乗分布1自由度と書かれた)、それは正規分布の密度から数学的に導き出すことができます。χ210χ21
"だから何?" ---あなたは考えているかもしれません---「それは、神が私に伝えることができるすべてのことのとの値を私に話すのに時間をかけた場合にのみ良いことです!」μσ2
確かに、万能の神がとの値を伝えるのに忙しすぎた場合、その10個のソース、つまり10個の自由度があります。μσ2
神に反抗し、神があなたを愛用することを期待せずに、自分ですべてをやり遂げようとすると、物事は奇妙になり始めます(ハハハハ;今だけ!)
あなたは持っていると、のための推定と。より安全な賭けへの道を見つけることができます。X¯S2μσ2
との場所でとして上記の合計を計算することを検討でき:
しかしそれは元の合計とは異なります。X¯S2μσ2
∑i=110(Xi−X¯)2S2/10=∑i=110(Xi−X¯S/10−−√)2,
"何故なの?" 両方の合計の平方内の用語は非常に異なります。たとえば、すべての観測値がより大きくなる可能性は低いですが、その場合は、これはですが、その順番で。なぜなら。 μ(Xi−μ)>0∑10i=1(Xi−μ)>0∑10i=1(Xi−X¯)=0∑10i=1Xi−10X¯=10X¯−10X¯=0
さらに悪いことに、少なくとも2つの観測値が異なる場合に厳密な不等式(異常ではない)。∑10i=1(Xi−X¯)2≤∑10i=1(Xi−μ)2
「しかし、待って!もっとあります!」
は標準正規分布がありません、
はありません1自由度のカイ二乗分布、
はカイ二乗分布がありません10自由度
は標準正規分布がありません。
Xi−X¯S/10−−√
(Xi−X¯)2S2/10
∑i=110(Xi−X¯)2S2/10
X¯−μS/10−−√
「それはすべて無益だったのですか?」
ありえない。今魔法が来る!そのノート
、または同等の
∑i=110(Xi−X¯)2σ2=∑i=110[Xi−μ+μ−X¯]2σ2=∑i=110[(Xi−μ)−(X¯−μ)]2σ2=∑i=110(Xi−μ)2−2(Xi−μ)(X¯−μ)+(X¯−μ)2σ2=∑i=110(Xi−μ)2−(X¯−μ)2σ2=∑i=110(Xi−μ)2σ2−∑i=110(X¯−μ)2σ2=∑i=110(Xi−μ)2σ2−10(X¯−μ)2σ2=∑i=110(Xi−μ)2σ2−(X¯−μ)2σ2/10
∑i=110(Xi−μ)2σ2=∑i=110(Xi−X¯)2σ2+(X¯−μ)2σ2/10.
次に、これらの既知の顔に戻ります。
最初の項は10自由度のカイ2乗分布を持ち、最後の項は1自由度のカイ2乗分布(!)を持ちます。
単純に、2つの部分で10の独立した同等に振る舞う変動源でカイ2乗を分割します。両方とも正の値です。1つの部分は1つの変動源を持つカイ2乗で、もう1つは証明できます(信頼の飛躍? )また、9(= 10-1)個の独立した均等に振る舞う変動源を持ち、両方の部分が互いに独立したカイ2乗になること。
これはすでに良いニュースです。というのも、今ではその配布があるからです。
残念ながら、使用しますが、これにはアクセスできません(神が私たちの闘争を見ていることを思い出してください)。σ2
さて、
したがって
したがって、
これは標準正規分布ではありませんが、その密度は標準法線と自由度のカイ2乗の密度。
S2=110−1∑i=110(Xi−X¯)2,
∑i=110(Xi−X¯)2σ2=∑10i=1(Xi−X¯)2σ2=(10−1)S2σ2∼χ2(10−1)
X¯−μS/10−−√=X¯−μσ/10√Sσ=X¯−μσ/10√S2σ2−−−√=X¯−μσ/10√(10−1)S2σ2(10−1)−−−−−−√=N(0,1)χ2(10−1)(10−1)−−−−−√,
(10−1)
20世紀初頭に非常に賢い人がその計算を行い[^ 1]、意図しない結果として、彼は上司をスタウトビール業界の絶対的な世界的リーダーにした。私は話していますウィリアム・ゴセット ;(はい、別名学生それから学生、分布)とセント・ジェームズ・ゲート醸造所(別名ギネスビール、私は敬虔午前います)、。t
[^ 1]:@whuberは、以下のコメントで、ゴセットは計算を行わなかったが、代わりに推測したと述べました!その時点でどの偉業がより驚くべきものであるかは本当にわかりません。
それは、私の親友、自由度分布の起源です。標準法線と独立カイ二乗の平方根の比を自由度で割ったもので、予測できない潮の流れの中で、サンプル平均を使用するときに受ける推定誤差の予想される動作を記述します推定すると使用しての変動を推定するために。t(10−1)X¯μS2X¯
行くぞ ひどく多くの技術的な詳細が敷物の後ろにひどく流されましたが、あなたの給料全体を危険に賭けるための神の介入だけに依存していませんでした。