スプラインまたは分数多項式を使用するときに、欠落データをどのように処理できますか?


12

私は、多変数モデルの構築を読んでいます Patrick RoystonとWillie Sauerbreiによる連続変数のモデリングのための分数多項式に基づく回帰分析への実用的なアプローチ。これまでのところ、私は感銘を受けており、これまで考えもしなかった興味深いアプローチです。

しかし、著者は欠損データを扱っていません。確かに、p。17彼らは、データの欠落は「多くの追加の問題を引き起こす。ここでは考慮されない」と言う。

複数の代入は分数多項式で動作します>

FPは、ある意味では(すべてではありませんが)スプラインの代替です。スプライン回帰の欠落データを処理するのは簡単ですか?


xの欠落、yの欠落、またはその両方を処理していますか?
グレン_b-モニカの復活

2
+1(!)他の誰かが同様の質問をするのを見て本当にうれしいです。最近、私はこの質問を投稿しました:stats.stackexchange.com/questions/295977/…Rのマウスで制限付きキュービックスプラインを使用する方法について。スプラインは多くの関数形式に対して十分に柔軟であるのに対し、分数多項式を指定する必要がないため、特にスプラインを選択します。しかし、これがあなたの質問に答えるかどうかはわかりません(したがって、このコメント)。
IWS

2
これは興味深い質問です。欠落しているデータに対応する能力を対照することにより、これらのいくつかの平滑化/補間手法に対する批判に影響を与える可能性を(可能性のある答えの1つの次元として)開きます。(ある程度、欠落に対する脆弱性は、現代の方法に対する「恥ずかしさ」です。)私は、ベイジアン実装があなたの帰属を「無料で」得る明白なポイントを渡すことでのみ注意します。
デビッドC.ノリス

2
@ DavidC.Norrisあなたのコメントは私を魅了します!ベイズの方法が欠落している「無料」に対応する方法について詳しく説明してもらえますか(これは、分析方法によって「自動的に」、デフォルトとして適切に処理されると思います)?(または参照先を示します)
IWS

2
ここでの「無料」の非無料ランチの部分は、ベイジアンモデルを書き留める必要があることです。これは、データ生成プロセスDGP)について明示的に考えることを意味します。それが完了したら、欠損値を[迷惑]パラメーターとして扱います。(ベイジアンでは、「すべてがパラメータです潜在変数も参照してください。」)MCMCは、指定されたDGPを本質的に活用して、欠損値を「無料」で「補完」します。
デビッドC.ノリス

回答:


1

fバツfバツ=バツ+バツ.5fmM1MmMfmバツ

使用しているソフトウェアがxの一意の値ごとに標準誤差の推定値を提供できると仮定すると、標準誤差の計算にRubin(調査での無応答の多重代入; 1987)式を使用できます。多重代入による自由度の大小のサンプル式があります。大きなサンプル式(Rubinでも同様)は、標準誤差と同じ入力を受け取るため、使用することもできます。小さなサンプルケースは、入力としてモデルの自由度を取ります。この式をここで適用できるかどうかは私には明らかではありません。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.