との形式のデータセットが与えられたとします。xの値に基づいてを予測するタスクが与えられます。:我々は2つの回帰どこ見積もり yと
我々はまた、の値を予測する回帰推定の値に基づいて、(X 1、⋯ 、X N - 1):であり、 X N =をfを3(X 1、⋯ 、X N - 1)
値が与えられたとすると、yを予測する2つの異なる方法があることになります。
一般的にどちらが良いでしょうか?
最初の方程式は2つの形式のデータポイントからの情報を利用するので、2番目の方程式は予測子値を持つデータポイントのみからの情報を利用するため、より良いと思います。統計に関するトレーニングは限られているため、専門家のアドバイスを求めたいと思います。
また、一般的に、情報が不完全なデータに対する最善のアプローチは何ですか?つまり、次元すべてに値がないデータから最も多くの情報を抽出するにはどうすればよいでしょうか。
実績による見積もりと見積もりによる見積もり-決定:)
—
PhD
本当にそれは簡単ですか?
—
Xiaowen Li
答えは、場合によります。どのくらいのデータが欠落していますか?全体でどのくらいのデータがありますか?予測変数はいくつありますか?
—
Joel W.