サンプルサイズが非常に小さい回帰


9

4から5の説明変数を使用して回帰を実行したいのですが、観測値が15しかありません。これらの変数が正規分布しているとは想定できませんが、ノンパラメトリックまたは他の有効な回帰方法はありますか?


5
説明変数のいずれかが正常であるという仮定はありません。応答の限界分布についての仮定もありません。CIまたは仮説検定を行っている場合、通常の推論では、応答の条件付き正常性を想定しています。より重要なのは、線形性と一定の分散の仮定です。あなたの反応は何で構成されていますか(なぜ正常ではないのですか)?
Glen_b-モニカを

3
いいえ、十分なデータがありません。これは探索的分析です。暗示的な関係をよく目にするかもしれません。ただし、p値、信頼区間、仮説検定は避けてください。
チャールズ

回答:


10

@Glen_bは、回帰1における正規性の仮定の性質について正しいです。

私の大きな問題は、4から5の説明変数をサポートするのに十分なデータがないことだと思います。標準的な経験則2では、説明変数ごとに少なくとも10データ、つまりケースでは40または50データが必要です(これは、仮定について疑問のない理想的な状況の場合です)。モデルが完全に飽和しないため3(フィットするパラメーターよりも多くのデータがある)、パラメーター(勾配など)の推定値を取得できます。理想的な状況では、推定値は漸近的に偏りがありません。ただし、推定値が実際の値から大きく離れ、SE / CIが非常に大きくなる可能性が高いため、統計的検出力はありません。ノンパラメトリックまたはその他の代替の回帰分析を使用しても、この問題から抜け出せないことに注意してください。

ここで行う必要があるのは、フィールドまたは直感の以前の理論に基づいて(データを確認する前に)単一の説明変数を選択するか、説明変数を組み合わせる必要があります。後者のオプションの合理的な戦略は、主成分分析(PCA)を実行し、最初の主成分を説明変数として使用することです。

参考資料:
1. 残差は正規分布しているがYは分布していない場合はどうなりますか?
2. 重回帰の最小サンプルサイズの経験則
3. 重回帰方程式に入力できる独立変数の最大数

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.