因子変数を数値に変換したいのですが、as.numeric
期待した効果がありません。
以下に、元の変数に基づく変数の数値バージョンの要約統計を取得します。手段は1ずつカウントアップし続けます...おそらく(彼は推測します)因子のレベルには名前と数値の両方があり、数値as.numeric
を使用するように設計されている場合、新しい変数の値は名前から来ると期待していますか?
> describe.by(as.numeric(df$sch), df$sch)
group:
var n mean sd median trimmed mad min max range skew kurtosis se
1 1 5389 1 0 1 1 0 1 1 0 NaN NaN 0
---------------------------------------------------------
group: 001
var n mean sd median trimmed mad min max range skew kurtosis se
1 1 19 2 0 2 2 0 2 2 0 NaN NaN 0
---------------------------------------------------------
group: 002
var n mean sd median trimmed mad min max range skew kurtosis se
1 1 54 3 0 3 3 0 3 3 0 NaN NaN 0
---------------------------------------------------------
1
追加した新しいタグを削除しました。それらは私には一般的すぎて差別的ではないか、as.factorが狭すぎる場合(Rベースの関数であるため)のように思えました。何かが失われたと思われる場合は、タグを付け直してください。
—
JMS