ランダムフォレストを構築するために使用しているx、yデータのセットがあります。xデータは、いくつかのNAを含む値のベクトルです。そのためrfImpute
、欠けているデータを処理してランダムフォレストを作成するために使用します。今、私は新しい目に見えない観測x(NAあり)を持っており、yを予測したいと思います。すでに成長したランダムフォレストを使用できるように、欠損値をどのように代入するのですか?rfImpute
この関数は、xとyを必要としているようです。予測のためにxしかありません。
私の質問はこの質問に似ています(ただし異なります)。たとえば、同じ虹彩データセットを使用できます。私が参照する質問の回答のコードを正しく解釈した場合iris.na[148, , drop=FALSE]
、ステートメントのコードiris.na2 = rbind(iris.imputed, iris.na[148, , drop=FALSE])
はSpecies
(Y値)を含む新しいデータを表します。私の問題では、私は知らないでしょう— Species
ランダムフォレストを使用してそれを予測したいと思います。4つの独立変数がありますが、一部はNA
特定の行のものである可能性があります。類推を続けるために、私が4つの変数のうち3つを持っていると想像してください(1つは欠落しています)。私はその価値を主張したいと思います。それから私は知らない種を予測したいと思います。
私がイラストを追加すべきだというガンのコメントに応えて、虹彩データセットの観点から説明させてください。花に関する次のデータがあるとします。私はそれが、、であることを知っていますがSepal.Length
、Sepal.Width
でPetal.Length
はありませんPetal.Width
。を代入してPetal.Width
から、RFモデル内でこれらの4つの値を使用してを予測したいと思いますSpecies
。