行または列ベクトルの「クローン」


155

行または列ベクトルを行列に「クローン」すると便利な場合があります。クローニングとは、次のような行ベクトルを変換することを意味します

[1,2,3]

マトリックスに

[[1,2,3]
 [1,2,3]
 [1,2,3]
]

または次のような列ベクトル

[1
 2
 3
]

[[1,1,1]
 [2,2,2]
 [3,3,3]
]

matlabまたはoctaveでは、これはかなり簡単に行われます。

 x = [1,2,3]
 a = ones(3,1) * x
 a =

    1   2   3
    1   2   3
    1   2   3

 b = (x') * ones(1,3)
 b =

    1   1   1
    2   2   2
    3   3   3

これを数え切れないほど繰り返したいのですが、失敗しました

In [14]: x = array([1,2,3])
In [14]: ones((3,1)) * x
Out[14]:
array([[ 1.,  2.,  3.],
       [ 1.,  2.,  3.],
       [ 1.,  2.,  3.]])
# so far so good
In [16]: x.transpose() * ones((1,3))
Out[16]: array([[ 1.,  2.,  3.]])
# DAMN
# I end up with 
In [17]: (ones((3,1)) * x).transpose()
Out[17]:
array([[ 1.,  1.,  1.],
       [ 2.,  2.,  2.],
       [ 3.,  3.,  3.]])

最初の方法(In [16])が機能しなかったのはなぜですか?よりエレガントな方法でPythonでこのタスクを達成する方法はありますか?


6
Matlabでは、使用する方がはるかに速いことに注意してくださいrepmatrepmat([1 2 3],3,1)またはrepmat([1 2 3].',1,3)
Luis Mendo

オクターブも持っていrepmatます。
ma11hew28 14年

tile_df ここ
zelusp

回答:


80

エレガントでPython的な方法は次のとおりです。

>>> array([[1,2,3],]*3)
array([[1, 2, 3],
       [1, 2, 3],
       [1, 2, 3]])

>>> array([[1,2,3],]*3).transpose()
array([[1, 1, 1],
       [2, 2, 2],
       [3, 3, 3]])

の問題は[16]、転置が配列に影響しないことです。代わりに、おそらくマトリックスが必要です。

>>> x = array([1,2,3])
>>> x
array([1, 2, 3])
>>> x.transpose()
array([1, 2, 3])
>>> matrix([1,2,3])
matrix([[1, 2, 3]])
>>> matrix([1,2,3]).transpose()
matrix([[1],
        [2],
        [3]])

1
(転置は2D配列で機能します。例では正方形のもの、または(N,1)を使用して.reshape(-1, 1)
Mark

34
これは非常に非効率的です。pv。の回答にnumpy.tile示されているように使用します
David Heffernan

303

使用numpy.tile

>>> tile(array([1,2,3]), (3, 1))
array([[1, 2, 3],
       [1, 2, 3],
       [1, 2, 3]])

または繰り返し列の場合:

>>> tile(array([[1,2,3]]).transpose(), (1, 3))
array([[1, 1, 1],
       [2, 2, 2],
       [3, 3, 3]])

16
賛成投票!私のシステムでは、10000個の要素が1000回繰り返されているベクトルのtile場合、このメソッドは、現在受け入れられている回答の方法よりも19.5倍高速です(multiplication-operator-methodを使用)。
Jan-Philip Gehrcke博士、2012年

1
2番目のセクション(「繰り返し列」)では、角括弧の2番目のセットが何を行うかを説明できます。つまり、[[1,2,3]]
Ant

@Antは、最初の軸の長さが1(画面の垂直)、2番目の軸が長さ3(画面の水平)の2D配列になります。転置すると、最初の軸の長さが3になり、2番目の軸の長さが1になります。のタイルシェイプは、(1, 3)この列を3回以上コピーします。そのため、結果の行にはそれぞれ1つの異なる要素が含まれます。
BallpointBen 2018

すでに初期化されている任意のベクトルを渡すことができますが、受け入れられたベクトルは、ベクトルを初期化するときにコンマを追加した場合にのみ機能するため、これは受け入れられる答えになるはずです。よろしくお願いします!
Yohan Obadia、

これを2dから3dのソリューションで機能させることはできません:(
john ktejik

42

最初に、numpyのブロードキャスト操作では、行と列を複製する必要はありません。説明については、これこれを参照してください。

しかし、これを行うには、繰り返し新しい軸がおそらく最良の方法です

In [12]: x = array([1,2,3])

In [13]: repeat(x[:,newaxis], 3, 1)
Out[13]: 
array([[1, 1, 1],
       [2, 2, 2],
       [3, 3, 3]])

In [14]: repeat(x[newaxis,:], 3, 0)
Out[14]: 
array([[1, 2, 3],
       [1, 2, 3],
       [1, 2, 3]])

この例は行ベクトルですが、これを列ベクトルに適用することは明らかです。繰り返しはこれをうまく綴るようですが、あなたの例のように乗算でそれを行うこともできます

In [15]: x = array([[1, 2, 3]])  # note the double brackets

In [16]: (ones((3,1))*x).transpose()
Out[16]: 
array([[ 1.,  1.,  1.],
       [ 2.,  2.,  2.],
       [ 3.,  3.,  3.]])

5
newaxisには、必要になるまで実際にデータをコピーしないという追加の利点があります。したがって、これを乗算または別の3x3配列に追加する場合は、繰り返しは不要です。アイデアを取得するために乱暴な放送について読んでください。
AFoglia

@AFoglia-良い点。私はこれを指摘するために私の答えを更新しました。
tom10 2009年

1
np.repeatvs を使用する利点は何np.tileですか?
mrgloom 2018

@mrgloom:ほとんどの場合、この場合はありません。小さな1Dアレイの場合、それらは類似しており、大きな違い/利点/利点などはありません。個人的には、行と列の複製の対称性がより直感的であることがわかります。タイルに必要な転置は好きではありませんが、それは好みの問題です。Mateen Ulhaqの答えは、繰り返しがより速いことも示していますが、これは考慮される正確なユースケースに依存する可能性があります。2Dでは動作が異なるため、そこで重要です。
tom10 2018

12

みましょう:

>>> n = 1000
>>> x = np.arange(n)
>>> reps = 10000

ゼロコストの割り当て

ビューは、任意の追加のメモリを取ることはありません。したがって、これらの宣言は瞬時に行われます。

# New axis
x[np.newaxis, ...]

# Broadcast to specific shape
np.broadcast_to(x, (reps, n))

強制割り当て

コンテンツをメモリに常駐させたい場合:

>>> %timeit np.array(np.broadcast_to(x, (reps, n)))
10.2 ms ± 62.3 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)

>>> %timeit np.repeat(x[np.newaxis, :], reps, axis=0)
9.88 ms ± 52.4 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)

>>> %timeit np.tile(x, (reps, 1))
9.97 ms ± 77.3 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)

3つの方法はすべてほぼ同じ速度です。

計算

>>> a = np.arange(reps * n).reshape(reps, n)
>>> x_tiled = np.tile(x, (reps, 1))

>>> %timeit np.broadcast_to(x, (reps, n)) * a
17.1 ms ± 284 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)

>>> %timeit x[np.newaxis, :] * a
17.5 ms ± 300 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)

>>> %timeit x_tiled * a
17.6 ms ± 240 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)

3つの方法はすべてほぼ同じ速度です。


結論

計算の前に複製したい場合は、「ゼロコスト割り当て」方法のいずれかを使用することを検討してください。「強制割り当て」によるパフォーマンスの低下はありません。


8

numpyでブロードキャストを使用するのが最善であり、高速であると思います

次のように比較しました

import numpy as np
b = np.random.randn(1000)
In [105]: %timeit c = np.tile(b[:, newaxis], (1,100))
1000 loops, best of 3: 354 µs per loop

In [106]: %timeit c = np.repeat(b[:, newaxis], 100, axis=1)
1000 loops, best of 3: 347 µs per loop

In [107]: %timeit c = np.array([b,]*100).transpose()
100 loops, best of 3: 5.56 ms per loop

ブロードキャストを使用すると、約15倍速くなります


None同じことを行うためにインデックスを付けることができます。
DanielSank 2015年

newaxisとは何ですか?
dreab

np.newaxisなしの別名である
ジョンktejik

リピートはより高速でした:5.56 ms = 5560 µs
Augusto Fadel

4

クリーンなソリューションの1つは、NumPyの外積関数を1のベクトルで使用することです。

np.outer(np.ones(n), x)

n行を繰り返します。引数の順序を切り替えて、繰り返し列を取得します。同じ数の行と列を取得するには

np.outer(np.ones_like(x), x)

3

使用できます

np.tile(x,3).reshape((4,3))

タイルはベクトルの担当者を生成します

そして、形を変えればあなたが望む形になります


1

あなたがパンダのデータフレームを持っていて、dtypes、さらにはカテゴリカルを保存したいなら、これはそれを行うための速い方法です:

import numpy as np
import pandas as pd
df = pd.DataFrame({1: [1, 2, 3], 2: [4, 5, 6]})
number_repeats = 50
new_df = df.reindex(np.tile(df.index, number_repeats))

-1
import numpy as np
x=np.array([1,2,3])
y=np.multiply(np.ones((len(x),len(x))),x).T
print(y)

収量:

[[ 1.  1.  1.]
 [ 2.  2.  2.]
 [ 3.  3.  3.]]
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.