タグ付けされた質問 「r-factor」

14
サブセット化されたデータフレームのドロップファクターレベル
を含むデータフレームがありfactorます。subsetまたは別のインデックス関数を使用してこのデータフレームのサブセットを作成すると、新しいデータフレームが作成されます。ただし、factor変数が新しいデータフレームに存在しない場合でも、変数は元のレベルをすべて保持します。 これにより、ファセットプロットを実行するとき、または因子レベルに依存する関数を使用するときに問題が発生します。 新しいデータフレームの要素からレベルを削除する最も簡単な方法は何ですか? 次に例を示します。 df <- data.frame(letters=letters[1:5], numbers=seq(1:5)) levels(df$letters) ## [1] "a" "b" "c" "d" "e" subdf <- subset(df, numbers <= 3) ## letters numbers ## 1 a 1 ## 2 b 2 ## 3 c 3 # all levels are still there! levels(subdf$letters) ## [1] "a" "b" "c" "d" …
543 r  dataframe  r-factor  r-faq 

2
因子レベルと因子ラベルの間の混乱
Rでは因子のレベルとラベルに違いがあるようです。これまでは、レベルは因子レベルの「実際の」名前であり、ラベルは出力(テーブルやプロットなど)に使用される名前であると常に思っていました。次の例に示すように、明らかにこれは当てはまりません。 df <- data.frame(v=c(1,2,3),f=c('a','b','c')) str(df) 'data.frame': 3 obs. of 2 variables: $ v: num 1 2 3 $ f: Factor w/ 3 levels "a","b","c": 1 2 3 df$f <- factor(df$f, levels=c('a','b','c'), labels=c('Treatment A: XYZ','Treatment B: YZX','Treatment C: ZYX')) levels(df$f) [1] "Treatment A: XYZ" "Treatment B: YZX" "Treatment C: ZYX" レベル( …
106 r  r-factor  r-faq 

7
Rの要因:煩わしさ以上のもの?
Rの基本的なデータ型の1つは因子です。私の経験では、要素は基本的に苦痛であり、私はそれらを使用することはありません。私はいつもキャラクターに変換します。何かが足りないように感じます。 因子データ型が必要になるグループ化変数として因子を使用する関数のいくつかの重要な例はありますか?ファクターを使用する必要がある特定の状況はありますか?
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.