十分な統計の目的とメカニズムの背後にある直感的な意味は何ですか?


9

十分な統計量の定義は次のとおりを、パラメーターによってインデックスが付けられた分布からのランダムサンプルとする。してみましょう統計こと。すべてのおよびすべての可能な値について、がは依存せず、のみ依存する場合のの条件付き結合分布を仮定します。次に、はパラメーター十分な統計量です。 θ T θ T T XX1,...,XnθTθtT T = T T θ T θX1,...,XnT=ttθTθ

十分な統計量を理解するためのパズルのいくつかの部分(因数分解の定理など)を知っているように感じますが、全体的な理論を把握していません。

私の主な質問は:

1)がパラメータ十分な統計量あると彼らが言うのはなぜですか?場合は正規分布の母集団の平均だった、と言う、それは私たちが言う、の確率を見つけたいという、いつでも、どういう意味、我々は必要しないこと、特定の方法で発生しました、人口の平均の値?θ θTθθX 1X nμX1,...,Xn

2)実生活では、なぜ十分な統計量を使用したいのですか?統計値を計算するだけではそれほど多くの作業(Xの合計など)ではいけないようですが、なぜそれが必要なのでしょうか。

ありがとう!

回答:


7
  1. いいえ、彼らがいる場合で何と言う、元のデータと同じ母集団から別のランダムなサンプルであるX 1... Xはnは、約確率的情報を同量含まθを。したがって、Tを保持し、X 1X nを破棄すると、「データを回復」できます。そのため、Tは「十分」です。X1,,XnX1,,XnθTX1,,XnT

  2. データ削減。が十分である場合、が関係している限り、Xによって運ばれる「追加情報」は無意味です。その場合、この余分な無関係な情報を使用しない推論手順を検討するのは自然なことです。これは、持続性の原則につながります。推論手順は、十分な統計を通じてのみデータに依存する必要があります。TXθ

データ削減に関連する原則の詳細については、こちらをご覧ください。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.