Rのランダムフォレストモデルを使用して予測しようとしています。
ただし、テストセットとトレーニングセットでは値が異なる要因があるため、エラーが発生します。たとえば、因子にCat_2
は34, 68, 76
、トレーニングセットに表示されないテストセットの値などがあります。残念ながら、テストセットを制御することはできません...そのまま使用する必要があります。
私の唯一の回避策は、問題のある要素を数値に変換して戻すことas.numeric()
でした。それは機能しますが、これらの値は数値的な意味を持たないコードであるため、私はあまり満足していません...
テストセットから新しい値を削除する別の解決策があると思いますか?ただし1, 2, 14, 32
、トレーニングとテストの両方にあり、予測に役立つ可能性のある情報を含む他のすべての因子値(たとえば、値など)を削除することはありません。