ブートストラップ標準誤差と信頼区間は、等分散性の仮定に違反する回帰で適切ですか?


13

標準のOLS回帰で2つの仮定(エラーの正規分布、等分散性)に違反する場合、標準誤差と信頼区間のブートストラップは、リグレッサ係数の有意性に関して意味のある結果を得るための適切な代替手段ですか?

ブートストラップされた標準誤差と信頼区間を使用した有意性検定は、依然として不均一分散で「機能」していますか?

「はい」の場合、このシナリオで使用できる適用可能な信頼区間は何ですか(パーセンタイル、BC、BCA)。

最後に、このシナリオでブートストラップが適切な場合、この結論に到達するために読んで引用する必要がある関連文献は何でしょうか?ヒントは大歓迎です!


1
そのような違反がある場合、ブートストラップがそれを治すとは思わない。代わりに、データを変換(ログ)して正常に近づけ、Rのサンドイッチパッケージなどの堅牢な標準エラーを使用してみませんか?
B_Miner

あなたがにしている状況にリサンプリング手法を適応させる場合には、ブートストラップは、罰金に動作します。
Glen_b -Reinstateモニカ

回答:


20

独立しているが同一に分散されていないデータで線形回帰のブートストラップを実行するには、少なくとも3つ(またはそれ以上)のアプローチがあります。(たとえば、時系列データとの自己相関、サンプリング設計によるクラスタリングなどにより、「標準」の仮定に他の違反がある場合、事態はさらに複雑になります)。

  1. 観測全体をリサンプリングできます。つまり、元のデータ{ y ix i}からを置換したサンプルを取得できます。これは、Huber-Whiteの不均一分散補正を実行することと漸近的に等価です。(yj,xj){(yi,xi)}
  2. あなたは、あなたのモデルに適合残差を得ることができます、およびリサンプル独立して、X * JE * Jei=yixiβ^xjejがある場合は、それぞれの経験分布からの置き換えではなく、不均一パターンダウンこの休憩をany、だから私はこのブートストラップが一貫しているとは思わない。
  3. ワイルドブートストラップを実行して、残差の符号をリサンプリングすることができます。これは、条件付きの2番目の瞬間を制御します(さらに、条件付きの3番目の瞬間も調整します)。これは私が推奨する手順です(「不均一分散を制御するために何をしましたか?どのように機能することを知っていますか?」

最終的な参考文献はWu(1986)ですが、Annalsはまさに絵本の読み物ではありません。

コメントで尋ねられたOPのフォローアップ質問に基づく更新

レプリケートの数は私には大きそうに見えました。私が知っているこのブートストラップパラメータの唯一の良い議論は、Efron&TibshiraniのIntro to Bootstrap bookにあります。

Huber / Whiteの標準誤差を使用しても、分布の仮定の欠如に対する一般的に同様の修正が得られると思います。Cameron&Triverdiの教科書では、ペアのブートストラップとWhiteの不均一分散補正の等価性について説明しています。等価性は、推定の一般的なロバスト性理論から得られます。両方の修正は、分布の仮定を修正することを目的としています。ブートストラップ補正と不均一分散補正の比較についても参照してください。M有限サンプルのより具体的な比較 Hausman and Palmer(2012)(この論文のバージョンは、著者のWebサイトのいずれかで入手できます)


ご協力ありがとうございました!1つのフォローアップの質問を許可してください:私が違反している唯一の仮定は、エラーの正規分布と等分散性の仮定です。また、回帰係数がsigであるかどうかを確認するだけです。予想された方向またはいいえ。効果の大きさは重要ではありません。これまでに行ったことはオプション1だと思います。標準エラーをブートストラップし、さらにブートストラップされた信頼区間を生成しました。Stataを使用してそれを行いました:vce(bootstrap、reps(2500)bca)、estat bootstrap。それは私の仮定違反を治しますか?
デビッド

私はあなたの構文だけに基づいてデータの診断を行いません、そして誰もしません。データセットのサイズは?reps(2500)少なくとも標準エラーに関しては、おそらく過剰です。私reps(500)は、ほとんどの実用的な目的には問題ないと思います。Efron&Tibshiraniのイントロブートストラップブックには、複製数に関するセクションがあります。回帰に関する章もありますので、参照してください。
StasK

迅速なご回答をありがとうございました。データセットは最大250です。複製の数に関する質問(リンクに感謝します!)、ブートストラップされた標準エラー(全体としての観測値のリサンプリングによる)および/またはブートストラップされた信頼区間(たとえば、パーセンタイルまたはバイアス修正)は等分散性とエラーの正規分布の仮定の違反を前提として、回帰係数の有意性(またはその欠如)を決定する適切な方法は?ご意見ありがとうございます!
デビッド

はい、私はそれが良いと言うでしょう。ただし、Stataを使用robustすると、回帰のオプションを使用して非常に類似した答えを得ることができます。est store結果とest tab, seそれらの両方を並べて比較します。
StasK

StasKに感謝します。また、このサイトのどこかで行った次のコメントも見ました。「リサンプリングによる単純なブートストラップ⇔Whiteの不均一分散ロバスト推定量」。上記で概説した私の質問の文脈において:この点を指摘する出版されたジャーナル記事はありますか?
デビッド
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.