階層データからのブートストラップ信頼区間の取得と解釈


10

数量Xのブートストラップされた信頼区間を取得することに興味があります。この数量が10人の個人ごとに10回測定される場合です。

1つのアプローチは、個人ごとの平均を取得し、平均をブートストラップすることです(たとえば、置換で平均を再サンプリングする)。

別のアプローチは、ブートストラップ手順の各反復で次のことを行うことです。各個人内で、その個人の10個の観測値を置き換えてリサンプリングし、その個人の新しい平均を計算し、最後に新しいグループ平均を計算します。このアプローチでは、元のデータセットで観察された各個人が、ブートストラップ手順の各反復で常にグループ平均に寄与します。

最後に、3番目のアプローチは、上記の2つのアプローチを組み合わせることです。個体をリサンプリングしてから、それらの個体内でリサンプリングします。このアプローチは、同じ個人が各反復でグループ平均に乗算することを可能にするという点で、前述のアプローチとは異なりますが、各寄与は独立したリサンプリング手順によって生成されるため、これらの寄与は互いにわずかに異なると予想される場合があります。

実際には、これらのアプローチでは信頼区間の推定値が異なることがわかります(たとえば、1つのデータセットを使用すると、3番目のアプローチは最初の2つのアプローチよりもはるかに大きな信頼区間をもたらすことがわかります)。表現すると解釈されます。

回答:


7

最初のアプローチは、中間のS CIです。S内で測定したい場合、それは間違ったアプローチです。

2番目のアプローチは、これらの10人の個人にのみ適用されるS内CIを生成します。

最後のアプローチは、S CI内での正しいアプローチです。CIの増加は、CIが10 Sの代わりに母集団に適用できるCIをより代表しているためです。


6

DavisonとHinckley( "Bootstrapメソッドとそのアプリケーション"、1997、セクション3.8)によると、3番目のアルゴリズムは保守的です。彼らは第4のアプローチを提唱します:単に被験者をリサンプリングするだけです。


1
興味深いことに、私はその参照を調べなければなりません。「4番目の」アプローチを意味しますか?私がリストする最初のアプローチは、「主題を単純にリサンプリングする」ことを説明しているようです。
Mike Lawrence、

1
はい、ありますが、対象の手段のリサンプリングについて説明しています。D&Hは、被験者をリサンプリングし、元のモデルに適合させることを提唱しています。
Andrew Robinson、

2
最近公開された、Ren、Shiquan、Lai、Hong、Tong、Wenjing、Aminzadeh、Mostafa、Hou、XuezhangおよびLai、Shenghan(2010)の「ノンパラメトリックブートストラッピングの階層データ」、Journal of Applied Statistics、 37:9、1487 — 1498
Andrew Robinson

2
@マイク:クラスタ全体をリサンプリングすることは、調査統計家がブートストラップで行うことです。これは確かに、(i)平均を推定するだけであり、(ii)データに重み付けがなく、バランスが取れている場合にのみ、「最初の」アプローチと同等の異なる手順です。参照してくださいciteulike.org/user/ctacmo/article/1334050citeulike.org/user/ctacmo/article/1475866citeulike.org/user/ctacmo/article/582039を
StasK 2011
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.