別の値に基づいて1つのベクトルを並べ替える方法


112

ベクトルxがあり、ベクトルyの値の順序に基づいてソートしたい。2つのベクトルの長さが同じではありません。

x <- c(2, 2, 3, 4, 1, 4, 4, 3, 3)
y <- c(4, 2, 1, 3)

予想される結果は次のとおりです。

[1] 4 4 4 2 2 1 3 3 3

回答:


70

こちらがワンライナーです...

y[sort(order(y)[x])]

[編集:]これは次のように分類されます。

order(y)             #We want to sort by y, so order() gives us the sorting order
order(y)[x]          #looks up the sorting order for each x
sort(order(y)[x])    #sorts by that order
y[sort(order(y)[x])] #converts orders back to numbers from orders

1
それは非常に簡潔ですが、そこで何が起こっているのかを理解するのに苦労しています。もう少し詳しく説明してもらえますか?
マットパーカー、

3
これはきれいで、Rの組み込み関数をよく理解しています。+1
Godeke

6
一般に、yが1:length(y)の順列でない場合でも、これを実行することができます。その場合、このソリューションは機能しませんが、以下のgd047のソリューションx [order(match(x、y))]は機能します。
Rahul Savani、2012

5
なぜこれが40の賛成票を持っているのか、私は実際に困惑しています。これは、上のように多くの単純なバリエーションで失敗したxyx <- c(1,4,2); y <- c(1,2,4)例えば。
thelatemail '10 / 09/15

1
@thelatemail同意します。狂気を止めて、この答えに反対票を投じてください!
Ian Fellows

184

これはどうですか

x[order(match(x,y))]

29
これはとても一般的であり、受け入れられた回答のIMHOよりも優れています。
fmark

2
私はこれがベースのGNU-Rにあるべきだと言うまで行きます。
壊滅的障害

この答えは、xとyの両方に文字ベクトルを使用するときにうまくいきました。受け入れられた回答のように分解/わずかな詳細を追加するとよいでしょう
mavericks

4

あなたはx順序付けられた因子に変換できます:

x.factor <- factor(x, levels = y, ordered=TRUE)
sort(x)
sort(x.factor)

明らかに、数値を係数に変更すると、ダウンストリームのコードがに反応する方法が根本的に変わる可能性がありますx。しかし、あなたは私たちに次に何が起こるかについてどんな文脈も与えなかったので、私はこれをオプションとして提案すると思いました。


1
これは整数以外の場合でも機能するので、これが最良の答えになるはずです。あるいはまた、作業中の値がある場合にx仕分けベクトルではないyわずかな変化を伴う:x <- c(2, 2, 3, 4, 1, 4, 4, 3, 3, 6); y <- c(4, 2, 1, 3); as.numeric(as.character(sort(factor(x, unique(c(y, x))))))
RAWR


2

数字でも文字でも「y」で注文する必要がある場合:

x[order(ordered(x, levels = y))]
4 4 4 2 2 1 3 3 3

ステップごと:

a <- ordered(x, levels = y) # Create ordered factor from "x" upon order in "y".
[1] 2 2 3 4 1 4 4 3 3
Levels: 4 < 2 < 1 < 3

b <- order(a) # Define "x" order that match to order in "y".
[1] 4 6 7 1 2 5 3 8 9

x[b] # Reorder "x" according to order in "y".
[1] 4 4 4 2 2 1 3 3 3

1

[ 編集:明らかにイアンは正しいアプローチを持っていますが、後世のために残しておきます。]

yベクトルにインデックスを付けることにより、ループなしでこれを行うことができます。yに増分する数値を追加し、それらをマージします。

y <- data.frame(index=1:length(y), x=y)
x <- data.frame(x=x)
x <- merge(x,y)
x <- x[order(x$index),"x"]
x
[1] 4 4 4 2 2 1 3 3 3

0
x <- c(2, 2, 3, 4, 1, 4, 4, 3, 3)
y <- c(4, 2, 1, 3)
for(i in y) { z <- c(z, rep(i, sum(x==i))) }

zの結果:4 4 4 2 2 1 3 3 3

重要なステップ:

  1. for(i in y)-対象の要素をループします。

  2. z <-c(z、...)-各部分式を順番に連結します

  3. rep(i、sum(x == i))-i(現在の対象要素)sum(x == i)回(xでiを見つけた回数)を繰り返します。


0

また、次のような関数で使用sqldfおよび実行できます。joinsql

library(sqldf)
x <- data.frame(x = c(2, 2, 3, 4, 1, 4, 4, 3, 3))
y <- data.frame(y = c(4, 2, 1, 3))

result <- sqldf("SELECT x.x FROM y JOIN x on y.y = x.x")
ordered_x <- result[[1]]
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.