パラメーターの調整機能と統一されたインターフェイスは非常に気に入っていますが、適用された "裸の"モデルでNAが許可されていても、常に完全なデータセット(つまりNAなし)が必要です。そもそも必要ではない面倒な代入法を適用する必要があるという点で、これは非常に面倒です。代入を回避し、キャレットの利点をどのように使用できますか?
3
あなたは常に欠損値で何かをしなければなりません。私はあなたの質問を本当に理解していないと言わなければなりません-あなたは何らかの万能のアプローチを探しています。NAを帰属させたくない場合、NAで何をしたいですか?削除しますか?
—
ティム
そこでNAを残し、NAに対処するためにモデルに任せたいと思います。たとえば、C50でC5.0関数を使用すると、NA自体に対処できますが、この場合はキャレットを使用できません。キャレットのtrain関数では、C5を使用する場合でもデータセットでNAを使用できないためです。上記のC50の0機能。
—
フレドリック
しかし、「モデル」が行うことは、このデータを無視(削除)して、サンプルを小さくすることです。それらの値を推定(入力)します。または、「NA」カテゴリを予測します(たとえば、一部のツリーベースのモデル)。「モデル」に他に何をしてほしいですか?一部のソフトウェアは自動的にこれらの処理を行いますが、コーヒーマシンから「デフォルトの」コーヒーが提供されることを想像してください。
—
ティム
キャレットがNAを許可しないことを確認しますか?列車のヘルプページのデフォルトの例でNAを導入しようとしましたが、メソッドC5.0の列車ではうまく機能しました。ランダムフォレストで失敗しました。
—
mpiktas