素人向けの十分な統計


23

誰かが非常に基本的な用語で十分な統計を説明してもらえますか?私はエンジニアリングのバックグラウンドを持っており、多くのことを経験しましたが、直感的な説明を見つけることができませんでした。

回答:


33

十分な統計情報は、サンプルに含まれるすべての情報を要約しているため、サンプルを提供したか、統計情報のみを提供したかにかかわらず、同じパラメーターを推定できます。情報を失うことなくデータを削減します。

次に例を示します。仮定ゼロに対して対称分布を有しています。サンプルを提供する代わりに、代わりに絶対値のサンプルを渡します(これが統計です)。あなたはサインを見ることはできません。しかし、あなたは分布が対称であることを知っているので、与えられた値のためにX- XおよびXは同じ確率(条件付き確率がある0.5)。だから、あなたは公正なコインを裏返すことができます。頭に浮かんだ場合は、そのxを負にします。テールの場合は、ポジティブにします。これにより、元のデータXと同じ分布を持つX からのサンプルが得られます。Xxxx0.5xXX。基本的に、統計からデータを再構築できました。それで十分です。


明確化/確認するには:統計はパラメーターに十分です。そここの例で述べたいかなるパラメータがないのですが、私は統計はのために十分であると仮定任意の任意の選択されたパラメトリックな分布のXのパラメータ?したがって、これは珍しい例ですが、それでも直観には役立ちます。
デンジロー

2
@Denziloe 0を中心とした対称性の強い仮定の下で、その分布の任意のパラメーターに十分です。これは、直感を構築するために設計されたおもちゃの例です。
Dimitriy V. Masterov

13

ベイジアン用語では、観測可能なプロパティXとパラメーターΘます。共同分布X,Θ指定されたが、の条件付き分布として因数分解されるXΘとの事前分布Θ。統計量Tとの事後分布場合だけ、このモデルのために十分であるΘXと同じであるΘT(X)のすべての事前分布のために Θ。つまり、の値を知った後のΘに関する更新された不確実性Xおよそあなたの更新の不確実性と同じであるΘの値を知った後、T(X)あなたはについて持って前にどんな情報 Θ。十分性はモデルに依存する概念であることに留意してください。


1

あなたはコインを持っているとし、それが公正かどうかわからないとします。言い換えれば、それは確率持つpヘッド(考え出すのH)と1p尾(来るのT)、そして次の値を知らないp

コインを数回、たとえばn回投げて、pの値を把握しようとします。n

さんが言ってみましょうn=5とあなたが得ることが起こる結果はシーケンスである(H,H,T,H,T)

今、あなたはあなたの統計学者の友人にあなたのためにpの価値を見積もってもらい、そしておそらくコインが公正である可能性が高いかどうかをあなたに伝えたいです。計算を行って結論を出すために、どのような情報を伝える必要がありますか?

すべてのデータ、つまり(H,H,T,H,T)伝えることができます。しかし、これは必要ですか?関連データを失うことなく、このデータを要約できますか?

コイントスの順序は無関係であることが明らかです。なぜなら、あなたは各コイントスに対して同じことをしており、コイントスは互いに影響しなかったからです。たとえば、結果が(H,H,T,T,H)場合、結論は変わりません。統計学者の友人に伝える必要があるのは、頭がいくつあったかだけです。

頭の数はpにとって十分な統計量であると言うことでこれを表現します。

この例は、コンセプトのフレーバーを示しています。正式な定義とどのように結び付いているかをご覧になりたい場合は、引き続きお読みください。

形式的には、統計値が与えられた場合、結果の確率分布がパラメーターを含まない場合、パラメーターはパラメーターで十分です。

この例では、頭の数を知る前に、結果の確率はpnumber of heads(1p)n - number of heads。明らかにこれはp依存します。

しかし、我々は、ヘッドの数は3(または他の値)であることを知っていたら、3頭(とすべての結果(H,H,T,H,T)(H,H,T,T,H)...)も同様に可能性が高い(彼らはすべての確率は持っているので、実際には10の可能性があるある1/10)。そのため、分布はもはやpとは関係ありません。直観的に、これは、私たちが観察する特定の結果が、pに関するそれ以上の情報を教えないことを意味しますp、結果はp影響を受けないためです。

余談ですが、頭の数を知る前の確率は、頭を通してpのみ依存することに注意してください。これは、pに十分な数に等しいことがわかります。number of headsnumber of headsp

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.