誰かが非常に基本的な用語で十分な統計を説明してもらえますか?私はエンジニアリングのバックグラウンドを持っており、多くのことを経験しましたが、直感的な説明を見つけることができませんでした。
誰かが非常に基本的な用語で十分な統計を説明してもらえますか?私はエンジニアリングのバックグラウンドを持っており、多くのことを経験しましたが、直感的な説明を見つけることができませんでした。
回答:
十分な統計情報は、サンプルに含まれるすべての情報を要約しているため、サンプルを提供したか、統計情報のみを提供したかにかかわらず、同じパラメーターを推定できます。情報を失うことなくデータを削減します。
次に例を示します。仮定ゼロに対して対称分布を有しています。サンプルを提供する代わりに、代わりに絶対値のサンプルを渡します(これが統計です)。あなたはサインを見ることはできません。しかし、あなたは分布が対称であることを知っているので、与えられた値のためにX、- XおよびXは同じ確率(条件付き確率がある0.5)。だから、あなたは公正なコインを裏返すことができます。頭に浮かんだ場合は、そのxを負にします。テールの場合は、ポジティブにします。これにより、元のデータXと同じ分布を持つX ′からのサンプルが得られます。。基本的に、統計からデータを再構築できました。それで十分です。
あなたはコインを持っているとし、それが公正かどうかわからないとします。言い換えれば、それは確率持つヘッド(考え出すの)と尾(来るの)、そして次の値を知らない。
コインを数回、たとえばn回投げて、の値を把握しようとします。
さんが言ってみましょうとあなたが得ることが起こる結果はシーケンスである。
今、あなたはあなたの統計学者の友人にあなたのためにの価値を見積もってもらい、そしておそらくコインが公正である可能性が高いかどうかをあなたに伝えたいです。計算を行って結論を出すために、どのような情報を伝える必要がありますか?
すべてのデータ、つまり伝えることができます。しかし、これは必要ですか?関連データを失うことなく、このデータを要約できますか?
コイントスの順序は無関係であることが明らかです。なぜなら、あなたは各コイントスに対して同じことをしており、コイントスは互いに影響しなかったからです。たとえば、結果が場合、結論は変わりません。統計学者の友人に伝える必要があるのは、頭がいくつあったかだけです。
頭の数はpにとって十分な統計量であると言うことでこれを表現します。
この例は、コンセプトのフレーバーを示しています。正式な定義とどのように結び付いているかをご覧になりたい場合は、引き続きお読みください。
形式的には、統計値が与えられた場合、結果の確率分布がパラメーターを含まない場合、パラメーターはパラメーターで十分です。
この例では、頭の数を知る前に、結果の確率は。明らかにこれは依存します。
しかし、我々は、ヘッドの数は3(または他の値)であることを知っていたら、3頭(とすべての結果、、)も同様に可能性が高い(彼らはすべての確率は持っているので、実際には10の可能性があるある)。そのため、分布はもはやとは関係ありません。直観的に、これは、私たちが観察する特定の結果が、pに関するそれ以上の情報を教えないことを意味します、結果は影響を受けないためです。
余談ですが、頭の数を知る前の確率は、頭の数を通してのみ依存することに注意してください。これは、pに十分な頭の数に等しいことがわかります。