これで直感的なブロックができました。二項問題の場合、カウントの標準偏差はです。逆に、サンプル比率の標準偏差は増加とともに減少し、ます。nで除算することはできますが、標準偏差が反対方向に移動する理由がわかりません。 n
これで直感的なブロックができました。二項問題の場合、カウントの標準偏差はです。逆に、サンプル比率の標準偏差は増加とともに減少し、ます。nで除算することはできますが、標準偏差が反対方向に移動する理由がわかりません。 n
回答:
非常に大まかに、私たちは公正なコインを投げていると想像してください。成功は頭として定義されます。コインを1回投げる場合、成功または成功をカウントします。どちらも、発生する確率が等しく正です。次に、コインを回投げる()と想像してください。これで、と成功が得られます(両方の可能性は低くなります)が、から(可能性が高い)も得られます。分散が一連の数値の広がり具合を測定する場合、トスで、よりもスプレッドが広いことがわかります。1 0 (1 / 2 )10 N = 10 0 1 2 10 10 1 N投げたり裁判。これは、成功数の分散がとともに増加する理由を説明しています。
比率(成功の数をトスの数で割ったもの)で、真の値を概算しようとしています。より多くの試行でより多くの情報を得ると、に関する不確実性が下がり、分散が縮小します。頭が上がると、あなたはあまり知りません(そのだけ。ではすべてのヘッドであることが判明することを投げ、あなたはかなり確信していることだ近いものです。 p p ≠ 0 )10 p
二項分布の標準偏差が正しい(そうである)と仮定することから始めましょう。これは、一定の成功確率与えられた場合の回の試行のうちの成功数の分布の標準偏差です。成功数を呼び出します。
つまりであり、これは標準偏差の2乗です。
比率は試行回数に対する成功数であるため、次のようになります。
。
したがって、標準偏差はもちろんです。
1つのケースではカウントを調べ、もう1つのケースではカウントをサンプルサイズで割ったものを調べます。
直感的に、成功数のカウントが比率()よりもはるかに高い()と想像できます。が増加すると、値が整数、多くの異なる(より大きな)をとり、より変動性を有することができます。一方、は0と1の間で制限されます。したがって、方が変動性があります。
はい!私はそれを非常に簡単にします。
通常、stdとvarianceを使用する場合、後ろ向きになって、何が起こっているのかを確認してから、将来を予測します。振り返ってみると、通常、より多くの試行がより多くの情報を得るために役立ちます。ますます多くの試行が何が起こったかを絞り込むのに役立ちます。そして平均値を中心に回転します。Stdとvarは平均値を中心に回転するので、何が起こるかがますます近くなります。
二項式は異なります!私たちはすでに何が起こっているかを知っています、私たちは確率を知っています。つまり、確率を知っているからです。試行回数が増えると、平均値を中心に物事がどのように回転するかを理解するのに役立ちませんが、分布がますます広くなります。試行回数を増やしても、実際には変動の余地が増えるだけです。
2つのシナリオを想像してみてください。1つは、部屋の全員の身長を知りたい場合です。より多くの測定=部屋の実際の平均の高さに近い、新しい測定ごとに感謝します。
第二に、あなたはコインを持っています。あなたはすでに平均が何であるか知っています。その50/50は、その時点で完了したという意味です。したがって、フリップを開始したふりをしてみましょう。新しいフリップを行うたびに、エラーが発生する可能性が高くなります。あなたは10回裏返し、あなたはすべての10の頭を手に入れます、あなたはあなたの友達に何と言っています!その確率はどこにありましたか?まあ、ひっくり返せば、クレイジーな外れ値のチャンスは1回しかなかったでしょう。より多くのフリップは本当にあなたにもっと多くの情報を与えません。
算数0と数式0が役立つことを願っています。