大規模なサンプルの漸近/理論-なぜ気にするのか?


13

この質問が「あまりにも一般的」とマークされないことを望み、すべてに利益をもたらす議論が開始されることを望みます。

統計では、大規模なサンプル理論の学習に多くの時間を費やしています。漸近的に不偏であるか、漸近的に効率的であるか、それらの漸近分布などを含む推定器の漸近特性を評価することに深く興味があります。漸近という言葉は、という仮定と強く結びついていnます。

しかし実際には、常に有限の扱いnます。私の質問は:

1)大きなサンプルとはどういう意味ですか?小さいサンプルと大きいサンプルをどのように区別できますか?

2)と言うときn、文字通りn行くべきだという意味ですか?

二項分布の場合、はCLTで正規分布に収束するために約n = 30が必要です。我々は持っている必要があり、N かによって、この場合には我々は30以上を意味します!バツ¯n

3)有限のサンプルがあり、推定量の漸近的挙動に関するすべてを知っていると仮定します。だから何?推定器が漸近的に不偏であると仮定すると、有限サンプルの対象パラメータの不偏推定がありますか、それともがあれば不偏のものになりますか?n

上記の質問からわかるように、私は「大規模なサンプル漸近性」の背後にある哲学を理解し、私たちが気にする理由を学ぼうとしていますか?私が学んでいる定理についていくつかの直観を得る必要があります。


5
大規模サンプルの動作は、特定の推定量が無限のデータの制限内で機能することを示す1つの方法です。推定器が実際にどれほど優れているかについて必ずしも何も言わないことは正しいですが、それは最初のステップです:漸近的に一貫性のない(または何でも)推定器を使用することはまずありません。漸近解析の利点は、有限サンプル解析よりも簡単に計算できることが多いことです。
ドゥーガル

snバツ=バツ

1
n>30p=0.001n=30np1p>15

回答:


6

絶対に遅れることはありません。最初に、推定量の漸近的不偏性(一貫性)に焦点を当てる3つの(重要だと思う)理由を挙げてみましょう。

a)一貫性は最小の基準です。推定器が大量のデータを使用しても正しく推定できない場合、それは何が良いでしょうか?これは、Wooldridge:Introductory Econometricsで説明されている正当化です。

b)有限サンプルプロパティを証明するのははるかに困難です(あるいは、漸近的なステートメントが簡単です)。私は現在自分でいくつかの研究を行っていますが、大規模なサンプルツールに頼ることができるときはいつでも、物事がずっと簡単になります。多数の法則、マルチンゲール収束定理などは、漸近的な結果を得るための優れたツールですが、有限のサンプルでは役立ちません。これらの線に沿って何かが林(2000)で言及されていると思います:計量経済学。

c)推定量が小さなサンプルに偏っている場合、いわゆる小さなサンプルの修正により、潜在的に修正するか、少なくとも改善することができます。これらはしばしば理論的に複雑です(修正なしで推定器で改善されることを証明するため)。さらに、ほとんどの人は大規模なサンプルに頼るので問題ありません。そのため、標準的な統計ソフトウェアには小さなサンプルの修正が実装されないことがよくあります。したがって、これらの一般的ではない修正を使用するには、特定の障壁があります。

ご質問について。「大きなサンプル」とはどういう意味ですか?これはコンテキストに大きく依存し、特定のツールについては、シミュレーションで回答できます。つまり、データを人為的に生成し、拒否率がサンプルサイズの関数としてどのように動作するか、バイアスがサンプルサイズの関数としてどのように動作するかを確認します。具体的な例はここにあります。著者は、OLSクラスター標準エラー、ブロックブートストラップ標準エラーなどがうまく機能するために必要なクラスター数を確認しています。一部の理論家は収束率に関する記述も持っていますが、実際的な目的のためには、シミュレーションはより有益であるように見えます。

n

質問3では、通常、不偏性(すべてのサンプルサイズ)と一貫性(大きなサンプルの不偏性)の問題は別々に考慮されます。推定量にバイアスをかけることはできますが、一貫性があります。その場合、実際には大きなサンプル推定値のみがバイアスされません。しかし、偏りがなく一貫性のある推定量もあり、理論的には任意のサンプルサイズに適用できます。(推定器は、技術的な理由から不偏でも一貫性がない場合があります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.