1
クラスター化されたデータの適切なブートストラップ手法?
強力なクラスタリングが存在するデータで使用する適切なブートストラップ手法に関する質問があります。 私は、最新の請求データに基づいて現在のベースラインモデルをスコアリングすることにより、保険請求データの多変量混合効果予測モデルを評価するタスクを担当しました95パーセンタイル)。モデルの有効性を評価するために、感度、特異性、および正の予測値(PPV)が使用されます。 ブートストラップは、感度、特異性、PPVの割合の信頼区間を構築する正しい方法のようです。残念なことに、素朴なブートストラップは、請求データが1)ケア提供者によって相関付けられていること、2)ケアのエピソードの数か月前に頻繁に訪問するケアのエピソードにグループ化されているため、適切ではありません(そのため、自己相関が存在します)。ムービングブロックブートストラップテクニックのバリエーションはここで適切でしょうか? または、3段階のブートストラップ手順が機能する可能性があります:1)データ内の個別のプロバイダーからの置換のサンプル、2)選択したプロバイダーによる個別のケアエピソードの置換のサンプル、3)各内の個別のクレームからの置換のサンプル選択したエピソード。 ご提案ありがとうございます!