十分な統計、詳細/直感の問題


16

私は楽しみのためにいくつかの統計を教えていますが、十分な統計に関する混乱があります。混乱をリスト形式で書きます。

  1. 分布にパラメーターがある場合、十分な統計がありますか?nnn

  2. 十分な統計とパラメーターの間に何らかの直接的な対応関係はありますか?または、基礎となる分布のパラメーターについて同じ推定値を計算できるように設定を再作成できるように、十分な統計が単に「情報」のプールとして機能するようにします。

  3. すべての分布に十分な統計がありますか?すなわち。因数分解定理が失敗することはありますか?

  4. データのサンプルを使用して、データの出所である可能性が最も高い分布を想定し、分布のパラメーターの推定値(MLEなど)を計算できます。十分な統計は、データ自体に依存せずにパラメーターの同じ推定値を計算できる方法ですよね?

  5. 十分な統計のすべてのセットには、最小限の十分な統計がありますか?

これは、トピックの問題を理解しようとするために使用している資料です:https : //onlinecourses.science.psu.edu/stat414/node/283

私が理解していることから、共同分布を2つの関数に分離する因数分解定理がありますが、分布を関数に因数分解した後に十分な統計を抽出する方法がわかりません。

  1. この例で与えられたポアソン質問には明確な因数分解がありましたが、十分な統計はサンプル平均とサンプル合計であると述べられました。最初の方程式の形を見るだけで、それらが十分な統計量であることをどのように知ったのでしょうか?

  2. 分解結果の2番目の方程式がデータ値自体に依存する場合、十分な統計を使用して同じMLE推定を実行する方法はありますか?たとえば、ポアソンの場合、2番目の関数はデータの階乗の積の逆数に依存しており、データはもうありません!バツ

  3. Webページのポアソンの例と比較して、サンプルサイズが十分な統計量ではないのはなぜですか?最初の関数の特定の部分を再構成するためにを必要とするのに、なぜそれも十分な統計量ではないのですか?nnn


簡単にわかりやすい質問-あなたはどの「角度」から十分に来ていますか?最尤法?ベイジアン?最大エントロピー?サンプリング理論?他に何か?
確率論的

私はMLEの立場から来ていました。私の投稿が最高ではなかった場合は申し訳ありませんが、このフォーラムへの最初の投稿です。
キムチ

回答:


12

おそらく、これらの質問のほとんどが詳細にカバーされている理論統計に関する教科書の十分性について読むことから恩恵を受けるでしょう。簡単に...

  1. 必ずしも。これらは特別な場合です:サポート(データが取ることができる値の範囲)が未知のパラメーターに依存しない分布の場合、指数ファミリーの変数のみが、次の数と同じ次元の十分な統計量を持ちます。パラメーター。したがって、独立した観測からワイブル分布の形状とスケール、またはロジスティック分布の位置とスケールを推定するには、順序統計量(シーケンスを無視した観測のセット全体)は最小限で十分です。パラメータに関する情報。サポートが未知のパラメーターに依存する場合、変化します:一様分布の場合、サンプルの最大値は十分です。θ θ - 1 θ + 1 0θθθ1θ+1サンプルの最小値と最大値で十分です。

  2. 「直接通信」とはどういう意味かわかりません。あなたが与える代替案は、十分な統計を記述するための公正な方法のようです。

  3. はい:データ全体で十分です。(誰かが十分な統計がないと言うのを聞いた場合、低次元の統計がないことを意味します。)

  4. はい、それがアイデアです。(残っているもの-十分な統計を条件とするデータの分布-は、未知のパラメーターとは無関係に分布の仮定を確認するために使用できます。)

  5. 明らかにそうではありませんが、反例は、実際に使用する可能性が高い分布ではありません。[測定理論にあまり深く入り込まずにこれを説明できる人がいれば幸いです。]

さらなる質問に応えて...

  1. 最初の要因である、介してのみに依存します。だからどんなの一対一の機能十分である:、、、およびように。 λΣ X I Σ X I Σ X I Σ X I / NΣ X I 2enλλバツλバツバツバツバツ/nバツ2

  2. 2番目の要因、は依存しないため、が最大になるの値には影響しません。MLEを取得して、自分で確かめてください。λλFXλ1バツ1バツ2バツnλλfバツ;λ

  3. サンプルサイズは、確率変数‡の実現値ではなく既知の定数なので、十分な統計量の一部とは見なされません。推測したいもの以外の既知のパラメーターについても同じことが言えます。n

†この場合、は常に正であるため、二乗は1対1 です。バツ

ランダム変数実現値である場合、それは十分な統計量ます。コインを投げて10または100のサンプルサイズを選択したとしますはの値については何も伝えませんが、推定の精度には影響します。この場合、補助的な補数と呼ばれ、実際の値を調整することで推論を進めることができます。実際には、異なる結果が出ている可能性があることを無視します。n Nバツnnθバツ


1
5の反例を見てみたい。しばらくの間、Zornの補題を使って反対のことを証明しようとしたが、ある時点で壊れてしまう。しかし、私が集めたものから反例は本当に奇抜なはずです。見つけられる基準点はありますか?私はそれが測定理論に重いことを気にしません。
sjm.majewski 14年

@ sjm.majewski:Lehmannは、ピッチャー(1957)、「必要かつ十分な統計またはサブフィールドを認めない一連の測定」、Ann。数学。統計学者。28、p267-268; およびLanders&Rogge(1973)。「十分性と不変性について」、アン。統計学者。1、p543-544。
Scortchi -復活モニカ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.