randomForest
新しいケースのクラスを予測するアプリケーションで使用したい細かい分類モデルがあります。新しいケースには必然的に欠損値があります。NAの場合、Predictはそのようには機能しません。それでは、どうすればよいですか。
data(iris)
# create first the new case with missing values
na.row<-45
na.col<-c(3,5)
case.na<-iris[na.row,]
case.na[,na.col]<-NA
iris.rf <- randomForest(Species ~ ., data=iris[-na.row,])
# print(iris.rf)
myrf.pred <- predict(iris.rf, case.na[-5], type="response")
myrf.pred
[1] <NA>
試しましたmissForest
。元のデータと新しいケースを組み合わせ、それをmissForest
でシェイクし、新しいケースでNAの帰属値を得ました。しかし、あまりにも重いコンピューティング。
data.imp <- missForest(data.with.na)
しかし、rf-modelを使用して、欠損値のある新しいケースを予測する方法があるはずですよね?
パーティーパッケージは欠損値をより適切に処理すると思います
—
Simone
@Simone様、
—
hermo 2013
party
パッケージはテストセットのNAでどのように機能しますか?party
マニュアルや例に代入の痕跡を見つけることができませんでした。
@hermoは、パーティーの紙citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.92.9930を見てみようとしています。アルゴリズムはCARTのように機能しているようです。代理分割を探します。
—
Simone
randomForest
R のパッケージには、説明した代入法しかありません。同様の環境にとどまりたい場合gbm
は、新しいデータの欠損値を処理するためのややスムーズな方法があります(完璧ではありませんが、便利です)。