リストを複製またはコピーする方法は?


2549

Pythonでリストを複製またはコピーするオプションは何ですか?

を使用している間new_list = my_listnew_list変更はmy_list毎回変わります。どうしてこれなの?

回答:


3330

ではnew_list = my_list、実際には2つのリストはありません。割り当ては、実際のリストではなくリストへの参照をコピーするだけなので、割り当て後は両方とも同じリストnew_listmy_list参照します。

リストを実際にコピーするには、さまざまな可能性があります。

  • 組み込みlist.copy()メソッド(Python 3.3以降で使用可能)を使用できます。

    new_list = old_list.copy()
  • あなたはそれをスライスすることができます:

    new_list = old_list[:]

    これに関するAlex Martelliの意見(少なくとも2007年には)は、これは奇妙な構文であり、これを使用しても意味がありません。;)(彼の意見では、次のものはもっと読みやすいです)。

  • 組み込みlist()関数を使用できます。

    new_list = list(old_list)
  • あなたはジェネリックを使うことができますcopy.copy()

    import copy
    new_list = copy.copy(old_list)
    

    これは、first list()のデータ型を見つける必要があるため、少し遅くなりますold_list

  • リストにオブジェクトが含まれていて、それらもコピーする場合は、genericを使用しますcopy.deepcopy()

    import copy
    new_list = copy.deepcopy(old_list)
    

    明らかに最も低速でメモリを必要とする方法ですが、避けられない場合もあります。

例:

import copy

class Foo(object):
    def __init__(self, val):
         self.val = val

    def __repr__(self):
        return 'Foo({!r})'.format(self.val)

foo = Foo(1)

a = ['foo', foo]
b = a.copy()
c = a[:]
d = list(a)
e = copy.copy(a)
f = copy.deepcopy(a)

# edit orignal list and instance 
a.append('baz')
foo.val = 5

print('original: %r\nlist.copy(): %r\nslice: %r\nlist(): %r\ncopy: %r\ndeepcopy: %r'
      % (a, b, c, d, e, f))

結果:

original: ['foo', Foo(5), 'baz']
list.copy(): ['foo', Foo(5)]
slice: ['foo', Foo(5)]
list(): ['foo', Foo(5)]
copy: ['foo', Foo(5)]
deepcopy: ['foo', Foo(1)]

7
私が誤解していないのであればnewlist = [*mylist]、Python 3でも可能性newlist = list(mylist)があります。
ステファン・

9
別のpossiblityはnew_list = old_list * 1である
ARIS

4
これらの方法のどれが浅いコピーであり、どれが深いコピーですか?
Eswar

4
@Eswar:最後の1つを除くすべてが浅いコピーを実行します
フェリックスクリング

3
@Eswarそれは浅いコピーです。
juanpa.arrivillaga

604

Felixはすでに優れた答えを提供していますが、私はさまざまな方法の速度比較を行うと思いました。

  1. 10.59秒(105.9us / itn)- copy.deepcopy(old_list)
  2. 10.16秒(101.6us / itn)-ディープCopy()コピーでクラスをコピーする純粋なPython メソッド
  3. 1.488秒(14.88us / itn)-純粋なPython Copy()メソッドがクラスをコピーしない(dicts / lists / tuples のみ)
  4. 0.325秒(3.25us / itn)- for item in old_list: new_list.append(item)
  5. 0.217秒(2.17us / itn)- [i for i in old_list]リストの理解度
  6. 0.186秒(1.86us / itn)- copy.copy(old_list)
  7. 0.075秒(0.75us / itn)- list(old_list)
  8. 0.053秒(0.53us / itn)- new_list = []; new_list.extend(old_list)
  9. 0.039秒(0.39us / itn)- old_list[:]リストのスライス

したがって、最速はリストのスライスです。ただしcopy.copy()list[:]ととlist(list)は異なりcopy.deepcopy()、Pythonバージョンではリスト内のリスト、辞書、クラスインスタンスはコピーされないため、オリジナルが変更された場合、コピーされたリストでも変更され、その逆も同様です。

(誰かが興味を持っている、または問題を提起したい場合のスクリプトは次のとおりです:)

from copy import deepcopy

class old_class:
    def __init__(self):
        self.blah = 'blah'

class new_class(object):
    def __init__(self):
        self.blah = 'blah'

dignore = {str: None, unicode: None, int: None, type(None): None}

def Copy(obj, use_deepcopy=True):
    t = type(obj)

    if t in (list, tuple):
        if t == tuple:
            # Convert to a list if a tuple to 
            # allow assigning to when copying
            is_tuple = True
            obj = list(obj)
        else: 
            # Otherwise just do a quick slice copy
            obj = obj[:]
            is_tuple = False

        # Copy each item recursively
        for x in xrange(len(obj)):
            if type(obj[x]) in dignore:
                continue
            obj[x] = Copy(obj[x], use_deepcopy)

        if is_tuple: 
            # Convert back into a tuple again
            obj = tuple(obj)

    elif t == dict: 
        # Use the fast shallow dict copy() method and copy any 
        # values which aren't immutable (like lists, dicts etc)
        obj = obj.copy()
        for k in obj:
            if type(obj[k]) in dignore:
                continue
            obj[k] = Copy(obj[k], use_deepcopy)

    elif t in dignore: 
        # Numeric or string/unicode? 
        # It's immutable, so ignore it!
        pass 

    elif use_deepcopy: 
        obj = deepcopy(obj)
    return obj

if __name__ == '__main__':
    import copy
    from time import time

    num_times = 100000
    L = [None, 'blah', 1, 543.4532, 
         ['foo'], ('bar',), {'blah': 'blah'},
         old_class(), new_class()]

    t = time()
    for i in xrange(num_times):
        Copy(L)
    print 'Custom Copy:', time()-t

    t = time()
    for i in xrange(num_times):
        Copy(L, use_deepcopy=False)
    print 'Custom Copy Only Copying Lists/Tuples/Dicts (no classes):', time()-t

    t = time()
    for i in xrange(num_times):
        copy.copy(L)
    print 'copy.copy:', time()-t

    t = time()
    for i in xrange(num_times):
        copy.deepcopy(L)
    print 'copy.deepcopy:', time()-t

    t = time()
    for i in xrange(num_times):
        L[:]
    print 'list slicing [:]:', time()-t

    t = time()
    for i in xrange(num_times):
        list(L)
    print 'list(L):', time()-t

    t = time()
    for i in xrange(num_times):
        [i for i in L]
    print 'list expression(L):', time()-t

    t = time()
    for i in xrange(num_times):
        a = []
        a.extend(L)
    print 'list extend:', time()-t

    t = time()
    for i in xrange(num_times):
        a = []
        for y in L:
            a.append(y)
    print 'list append:', time()-t

    t = time()
    for i in xrange(num_times):
        a = []
        a.extend(i for i in L)
    print 'generator expression extend:', time()-t

9
ベンチマークを行っているため、参照ポイントを含めると役立つ場合があります。これらの数値は、完全にコンパイルされたコードでPython 3.6を使用して2017年でもまだ正確ですか?以下の回答(stackoverflow.com/a/17810305/26219)はすでにこの回答に質問しています。
マークエディントン2017

4
timeitモジュールを使用します。また、このような任意のマイクロベンチマークから多くを結論付けることはできません。
Corey Goldberg

3
3.5+の新しいオプションを含めたい場合は、[*old_list]とほぼ同等list(old_list)ですが、これは構文であり、一般的な関数呼び出し経路ではないため、実行時に多少の節約になります(そしてold_list[:]、タイプ変換を行わないとは異なり、[*old_list]イテラブルで動作し、list)を生成します。
ShadowRanger 2018

3
わずかに小さい任意のマイクロベンチマークの@CoreyGoldberg(用途timeit、代わり100Kの50メートルラン)を参照stackoverflow.com/a/43220129/3745896
リバー

1
@ShadowRangerは、[*old_list]実際には他のほとんどすべての方法よりも優れているようです。(以前のコメントにリンクされている私の回答を参照してください)
River

151

Python 3.3以降でメソッドを追加すると言われます、これはスライスと同じくらい高速です。list.copy()

newlist = old_list.copy()


6
はい、そしてdocs docs.python.org/3/library/stdtypes.html#mutable-sequence-typesのように、(と同じ)のs.copy()浅いコピーを作成します ss[:]
Cyber​​Mew 2018

実際には現在、と思われるpython3.8.copy()ある若干速くスライシングより。以下の@AaronsHallの回答を参照してください。
loved.by.Jesus

126

Pythonでリストを複製またはコピーするオプションは何ですか?

Python 3では、浅いコピーを次のようにして作成できます。

a_copy = a_list.copy()

Python 2および3では、オリジナルの完全なスライスを含む浅いコピーを取得できます。

a_copy = a_list[:]

説明

リストをコピーするには、2つの意味論的な方法があります。浅いコピーは同じオブジェクトの新しいリストを作成し、深いコピーは新しい同等のオブジェクトを含む新しいリストを作成します。

浅いリストのコピー

浅いコピーでは、リスト内のオブジェクトへの参照のコンテナであるリスト自体のみがコピーされます。含まれているオブジェクトが変更可能で、1つが変更された場合、変更は両方のリストに反映されます。

Python 2と3でこれを行う方法はいくつかあります。Python2の方法はPython 3でも機能します。

Python 2

Python 2では、リストの浅いコピーを作成する慣用的な方法は、オリジナルの完全なスライスを使用することです。

a_copy = a_list[:]

リストコンストラクターを介してリストを渡すことによって同じことを行うこともできます。

a_copy = list(a_list)

しかし、コンストラクタを使用すると効率が低下します。

>>> timeit
>>> l = range(20)
>>> min(timeit.repeat(lambda: l[:]))
0.30504298210144043
>>> min(timeit.repeat(lambda: list(l)))
0.40698814392089844

Python 3

Python 3では、リストはlist.copyメソッドを取得します。

a_copy = a_list.copy()

Python 3.5の場合:

>>> import timeit
>>> l = list(range(20))
>>> min(timeit.repeat(lambda: l[:]))
0.38448613602668047
>>> min(timeit.repeat(lambda: list(l)))
0.6309100328944623
>>> min(timeit.repeat(lambda: l.copy()))
0.38122922903858125

別のポインタを作成してもコピー作成されませ

次に、new_list = my_listを使用すると、my_listが変更されるたびにnew_listが変更されます。どうしてこれなの?

my_listメモリ内の実際のリストを指す単なる名前です。new_list = my_listコピーを作成しないと言うときは、メモリ内の元のリストを指す別の名前を追加するだけです。リストのコピーを作成すると、同様の問題が発生する可能性があります。

>>> l = [[], [], []]
>>> l_copy = l[:]
>>> l_copy
[[], [], []]
>>> l_copy[0].append('foo')
>>> l_copy
[['foo'], [], []]
>>> l
[['foo'], [], []]

リストはコンテンツへのポインタの配列にすぎないため、浅いコピーはポインタをコピーするだけなので、2つの異なるリストがありますが、コンテンツは同じです。コンテンツのコピーを作成するには、ディープコピーが必要です。

深いコピー

リストのディープコピーdeepcopycopyを作成するには、Python 2または3でモジュールで使用ます

import copy
a_deep_copy = copy.deepcopy(a_list)

これにより新しいサブリストを作成する方法を示すには、次のようにします。

>>> import copy
>>> l
[['foo'], [], []]
>>> l_deep_copy = copy.deepcopy(l)
>>> l_deep_copy[0].pop()
'foo'
>>> l_deep_copy
[[], [], []]
>>> l
[['foo'], [], []]

そして、ディープコピーされたリストは、元のリストとはまったく異なるリストであることがわかります。独自の関数をロールすることもできますが、ロールしないでください。標準ライブラリのディープコピー機能を使用することで、通常は発生しないバグを作成する可能性があります。

使わない eval

これはディープコピーの方法として使用されているように見えるかもしれませんが、そうしないでください:

problematic_deep_copy = eval(repr(a_list))
  1. 特に信頼できないソースから何かを評価している場合は危険です。
  2. コピーしているサブ要素に、同等の要素を再現するために評価できる表現がない場合は、信頼できません。
  3. また、パフォーマンスも低下します。

64ビットPython 2.7の場合:

>>> import timeit
>>> import copy
>>> l = range(10)
>>> min(timeit.repeat(lambda: copy.deepcopy(l)))
27.55826997756958
>>> min(timeit.repeat(lambda: eval(repr(l))))
29.04534101486206

64ビットPython 3.5の場合:

>>> import timeit
>>> import copy
>>> l = list(range(10))
>>> min(timeit.repeat(lambda: copy.deepcopy(l)))
16.84255409205798
>>> min(timeit.repeat(lambda: eval(repr(l))))
34.813894678023644

1
リストが2Dの場合は、ディープコピーは必要ありません。リストのリストであり、それらのリストにリストが含まれていない場合は、forループを使用できます。現在、私は使用 list_copy=[] for item in list: list_copy.append(copy(item))しており、はるかに高速です。
John Locke

54

適切なコピーを作成する方法を説明する回答はすでに多数ありますが、元の「コピー」が失敗した理由を説明する回答はありません。

Pythonは変数に値を格納しません。名前をオブジェクトにバインドします。元の割り当てでは、によって参照されmy_list、バインドされたオブジェクトも取得さnew_listれました。どちらの名前を使用しても、リストは1つしかないため、それを参照するときに加えられた変更は、としてmy_list参照するときにも保持されnew_listます。この質問に対する他の回答はそれぞれ、バインドする新しいオブジェクトを作成するさまざまな方法を提供しますnew_list

リストの各要素は名前のように機能し、各要素は非排他的にオブジェクトにバインドします。浅いコピーは、要素が以前と同じオブジェクトにバインドする新しいリストを作成します。

new_list = list(my_list)  # or my_list[:], but I prefer this syntax
# is simply a shorter way of:
new_list = [element for element in my_list]

リストのコピーをさらに一歩進めるには、リストが参照する各オブジェクトをコピーし、それらの要素のコピーを新しいリストにバインドします。

import copy  
# each element must have __copy__ defined for this...
new_list = [copy.copy(element) for element in my_list]

リストがその要素にバインドされているように、リストの各要素は他のオブジェクトを参照する可能性があるため、これはまだディープコピーではありません。リスト内のすべての要素を再帰的にコピーし、次に各要素によって参照される他の各オブジェクトをコピーするには、ディープコピーを実行します。

import copy
# each element must have __deepcopy__ defined for this...
new_list = copy.deepcopy(my_list)

コピーのコーナーケースの詳細については、ドキュメントを参照してください。



35

最初から始めて、この質問を探りましょう。

したがって、2つのリストがあるとします。

list_1=['01','98']
list_2=[['01','98']]

そして、両方のリストをコピーする必要があります。最初のリストから始めます。

それでは、最初に変数copyを元のリストに設定してみましょうlist_1

copy=list_1

これで、list_1がコピーされたと考えている場合は、誤りです。このid関数は、2つの変数が同じオブジェクトを指すかどうかを示します。これを試してみましょう:

print(id(copy))
print(id(list_1))

出力は次のとおりです。

4329485320
4329485320

どちらの変数もまったく同じ引数です。びっくりした?

Pythonが変数に何も格納しないことがわかっているので、変数はオブジェクトを参照しているだけで、オブジェクトは値を格納しています。ここではオブジェクトですが、list2つの異なる変数名で同じオブジェクトへの2つの参照を作成しました。つまり、両方の変数が同じオブジェクトを指しており、名前が異なっているだけです。

あなたがするときcopy=list_1、それは実際にやっています:

ここに画像の説明を入力してください

ここの画像では、リスト_1とコピーは2つの変数名ですが、オブジェクトは両方の変数で同じです list

したがって、コピーされたリストを変更しようとすると、リストがそこに1つしかないため、元のリストも変更されます。コピーされたリストまたは元のリストから行うかどうかに関係なく、そのリストを変更します。

copy[0]="modify"

print(copy)
print(list_1)

出力:

['modify', '98']
['modify', '98']

したがって、元のリストを変更しました:

では、リストをコピーするためのpythonicメソッドに移りましょう。

copy_1=list_1[:]

この方法により、最初の問題が修正されます。

print(id(copy_1))
print(id(list_1))

4338792136
4338791432

したがって、両方のリストのIDが異なることがわかります。これは、両方の変数が異なるオブジェクトを指していることを意味します。ここで実際に起こっていることは:

ここに画像の説明を入力してください

次に、リストを変更して、前の問題がまだ発生しているかどうかを確認します。

copy_1[0]="modify"

print(list_1)
print(copy_1)

出力は次のとおりです。

['01', '98']
['modify', '98']

ご覧のとおり、コピーされたリストのみが変更されました。それはそれが働いたことを意味します。

私たちが終わったと思いますか?いいえ。ネストしたリストをコピーしてみましょう。

copy_2=list_2[:]

list_2のコピーである別のオブジェクトを参照する必要がありますlist_2。確認しよう:

print(id((list_2)),id(copy_2))

出力を取得します。

4330403592 4330403528

これで、両方のリストが異なるオブジェクトを指していると想定できるので、それを変更して、目的の結果が得られていることを確認しましょう。

copy_2[0][1]="modify"

print(list_2,copy_2)

これは私たちに出力を与えます:

[['01', 'modify']] [['01', 'modify']]

以前使用していたのと同じ方法が機能したため、これは少し混乱するかもしれません。これを理解してみましょう。

あなたがするとき:

copy_2=list_2[:]

内部リストではなく、外部リストのみをコピーします。idこの機能をもう一度使用して、これを確認できます。

print(id(copy_2[0]))
print(id(list_2[0]))

出力は次のとおりです。

4329485832
4329485832

するとcopy_2=list_2[:]、これが起こります:

ここに画像の説明を入力してください

リストのコピーを作成しますが、ネストされたリストのコピーではなく、外側のリストのコピーのみを作成します。ネストされたリストは両方の変数で同じであるため、ネストされたリストを変更しようとすると、ネストされたリストオブジェクトが同じであるため、元のリストも変更されます両方のリスト。

解決策は何ですか?解決策はdeepcopy関数です。

from copy import deepcopy
deep=deepcopy(list_2)

これを確認しましょう:

print(id((list_2)),id(deep))

4322146056 4322148040

両方の外部リストは異なるIDを持っています。ネストされた内部リストでこれを試してみましょう。

print(id(deep[0]))
print(id(list_2[0]))

出力は次のとおりです。

4322145992
4322145800

両方のIDが異なることがわかるので、ネストされた両方のリストが異なるオブジェクトを指していると想定できます。

これは、deep=deepcopy(list_2)実際に何が起こるかを意味します。

ここに画像の説明を入力してください

両方のネストされたリストは異なるオブジェクトをポイントしており、ネストされたリストの個別のコピーを持っています。

次に、ネストされたリストを変更して、前の問題が解決されたかどうかを確認してみましょう。

deep[0][1]="modify"
print(list_2,deep)

それは出力します:

[['01', '98']] [['01', 'modify']]

ご覧のとおり、元のネストされたリストは変更されず、コピーされたリストのみが変更されました。



34

Python 3.6タイミング

Python 3.6.8を使用したタイミング結果は次のとおりです。これらの時間は絶対的なものではなく、相対的なものです。

浅いコピーのみを行うことに固執し、list.copy()(Python3 スライスの同等物)や2つの形式のリストのアンパック*new_list, = listおよびnew_list = [*list])など、Python2では不可能であったいくつかの新しいメソッドも追加しました。

METHOD                  TIME TAKEN
b = [*a]                2.75180600000021
b = a * 1               3.50215399999990
b = a[:]                3.78278899999986  # Python2 winner (see above)
b = a.copy()            4.20556500000020  # Python3 "slice equivalent" (see above)
b = []; b.extend(a)     4.68069800000012
b = a[0:len(a)]         6.84498999999959
*b, = a                 7.54031799999984
b = list(a)             7.75815899999997
b = [i for i in a]      18.4886440000000
b = copy.copy(a)        18.8254879999999
b = []
for item in a:
  b.append(item)        35.4729199999997

Python2の優勝者は今でも上手く機能していますがlist.copy()、特に後者の優れた可読性を考慮すれば、Python3 をはるかに凌ぐことはありません。

ダークホースは開梱と再梱包の方法(b = [*a])で、生のスライスよりも最大25%高速で、他の開梱方法(*b, = a)の2倍以上高速です。

b = a * 1 また、驚くほどうまくいきます。

これらのメソッドは、リスト以外の入力に対して同等の結果を出力しないことに注意してください。これらはすべてスライス可能オブジェクトで機能し、一部は反復可能オブジェクトで機能しますが、copy.copy()より一般的なPythonオブジェクトでのみ機能します。


これは関係者のためのテストコードです(ここからのテンプレート):

import timeit

COUNT = 50000000
print("Array duplicating. Tests run", COUNT, "times")
setup = 'a = [0,1,2,3,4,5,6,7,8,9]; import copy'

print("b = list(a)\t\t", timeit.timeit(stmt='b = list(a)', setup=setup, number=COUNT))
print("b = copy.copy(a)\t", timeit.timeit(stmt='b = copy.copy(a)', setup=setup, number=COUNT))
print("b = a.copy()\t\t", timeit.timeit(stmt='b = a.copy()', setup=setup, number=COUNT))
print("b = a[:]\t\t", timeit.timeit(stmt='b = a[:]', setup=setup, number=COUNT))
print("b = a[0:len(a)]\t\t", timeit.timeit(stmt='b = a[0:len(a)]', setup=setup, number=COUNT))
print("*b, = a\t\t\t", timeit.timeit(stmt='*b, = a', setup=setup, number=COUNT))
print("b = []; b.extend(a)\t", timeit.timeit(stmt='b = []; b.extend(a)', setup=setup, number=COUNT))
print("b = []; for item in a: b.append(item)\t", timeit.timeit(stmt='b = []\nfor item in a:  b.append(item)', setup=setup, number=COUNT))
print("b = [i for i in a]\t", timeit.timeit(stmt='b = [i for i in a]', setup=setup, number=COUNT))
print("b = [*a]\t\t", timeit.timeit(stmt='b = [*a]', setup=setup, number=COUNT))
print("b = a * 1\t\t", timeit.timeit(stmt='b = a * 1', setup=setup, number=COUNT))

1
3.8でも同様のストーリーを確認できますb=[*a]。これを行う1つの明白な方法です。
SuperShoot

20

他のすべての貢献者が素晴らしい答えを出しましたが、これは単一の次元(レベル化)リストがある場合に機能しますが、これまでに述べた方法の場合copy.deepcopy()、リストの複製/コピーのみに機能し、ネストされたlistオブジェクトをポイントしないようにします多次元のネストされたリスト(リストのリスト)の操作。一方でフェリックスクリングが彼の答えでそれを指し、もう少し問題と可能性へのより高速な代替を証明するかもしれないビルトインを使用して回避策がありますdeepcopy

一方でnew_list = old_list[:]copy.copy(old_list)'とPy3kのためのold_list.copy()単一の平準リストの仕事、彼らが指し示すに戻りlist内にネストされたオブジェクトold_listnew_list、との1への変更listオブジェクトは、他に生まれついています。

編集:新しい情報が明らかに

Aaron HallPM 2Ringの 両方で指摘されているように使用eval()することは悪い考えであるだけでなく、よりもはるかに遅いですcopy.deepcopy()

つまり、多次元リストの場合、唯一のオプションはcopy.deepcopy()です。そうは言っても、適度なサイズの多次元配列で使用しようとするとパフォーマンスが大幅に低下するため、これは実際にはオプションではありません。timeitバイオインフォマティクスアプリケーションでは前例のない42x42の配列を使用しようとしましたが、応答を待つことをあきらめ、この投稿への編集の入力を開始しました。

その場合、唯一の実際のオプションは、複数のリストを初期化して、それらを個別に処理することです。多次元リストのコピーを処理する方法について他の提案がある場合は、いただければ幸いです。

他の人が述べたように、モジュールの使用や多次元リストの場合、パフォーマンスに重大な問題があり ますcopycopy.deepcopy


5
によって返される文字列repr()がオブジェクトを再作成するのに十分であるという保証がないため、これは常に機能するとは限りません。また、eval()最後の手段となるツールです。詳細について、SOのベテランであるNed BatchelderによるEvalの危険性をご覧ください。したがって、使用を主張するときは、それが危険である可能性があることeval()本当に言及する必要があります。
PM 2Ring 2015

1
フェアポイント。Batchelderのポイントはeval()、一般的にPythonで関数を使用することにはリスクがあるということだと思いますが。コードで関数を使用するかどうかはそれほどではありませんが、Python自体のセキュリティホールです。私の例では、からの入力を受け取る機能とそれを使用していないinput()sys.agrvまたはさえテキストファイル。これは、空白の多次元リストを1回初期化し、ループの各反復で再初期化する代わりに、それをループでコピーする方法を持っているという線に沿っています。
AMR 2015

1
@AaronHallが指摘したように、を使用するnew_list = eval(repr(old_list))とパフォーマンスに重大な問題が発生する可能性があるため、悪い考えであるだけでなく、動作が遅すぎます。
AMR 2015

13

これはまだ言及されていないので驚きます。完全を期すために...

"splat operator":を使用してリストのアンパックを実行でき*ます。これにより、リストの要素もコピーされます。

old_list = [1, 2, 3]

new_list = [*old_list]

new_list.append(4)
old_list == [1, 2, 3]
new_list == [1, 2, 3, 4]

このメソッドの明らかな欠点は、Python 3.5以降でのみ使用できることです。

ただし、タイミングについては、他の一般的な方法よりもパフォーマンスが優れているようです。

x = [random.random() for _ in range(1000)]

%timeit a = list(x)
%timeit a = x.copy()
%timeit a = x[:]

%timeit a = [*x]

#: 2.47 µs ± 38.1 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)
#: 2.47 µs ± 54.6 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)
#: 2.39 µs ± 58.2 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)

#: 2.22 µs ± 43.2 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)

1
コピーを変更するとき、このメソッドはどのように動作しますか?
not2qubit 2018

2
@ not2qubitは、新しいリストの要素に追加または編集することを意味します。この例old_listnew_listは2つの異なるリストがあり、一方を編集しても他方は変更されません(要素自体を直接変更しない限り(リストのリストなど)、これらのメソッドはどれもディープコピーではありません)。
SCB 2018

8

Pythonバージョンに依存しない非常にシンプルなアプローチは、ほとんどの場合に使用できるすでに与えられた回答にはありませんでした(少なくとも私はそうします):

new_list = my_list * 1       #Solution 1 when you are not using nested lists

ただし、my_listに他のコンテナ(ネストされたリストなど)が含まれている場合は、コピーライブラリからの上記の回答で提案されている他のコンテナと同様に、deepcopyを使用する必要があります。例えば:

import copy
new_list = copy.deepcopy(my_list)   #Solution 2 when you are using nested lists

おまけ:要素をコピーしたくない場合(別名浅いコピー):

new_list = my_list[:]

Solution#1とSolution#2の違いを理解しましょう

>>> a = range(5)
>>> b = a*1
>>> a,b
([0, 1, 2, 3, 4], [0, 1, 2, 3, 4])
>>> a[2] = 55 
>>> a,b
([0, 1, 55, 3, 4], [0, 1, 2, 3, 4])

ご覧のとおり、ネストされたリストを使用していない場合でも、ソリューション#1は完全に機能しました。ネストされたリストにソリューション#1を適用するとどうなるかを確認してみましょう。

>>> from copy import deepcopy
>>> a = [range(i,i+4) for i in range(3)]
>>> a
[[0, 1, 2, 3], [1, 2, 3, 4], [2, 3, 4, 5]]
>>> b = a*1
>>> c = deepcopy(a)
>>> for i in (a, b, c): print i   
[[0, 1, 2, 3], [1, 2, 3, 4], [2, 3, 4, 5]]
[[0, 1, 2, 3], [1, 2, 3, 4], [2, 3, 4, 5]]
[[0, 1, 2, 3], [1, 2, 3, 4], [2, 3, 4, 5]]
>>> a[2].append('99')
>>> for i in (a, b, c): print i   
[[0, 1, 2, 3], [1, 2, 3, 4], [2, 3, 4, 5, 99]]
[[0, 1, 2, 3], [1, 2, 3, 4], [2, 3, 4, 5, 99]]   #Solution#1 didn't work in nested list
[[0, 1, 2, 3], [1, 2, 3, 4], [2, 3, 4, 5]]       #Solution #2 - DeepCopy worked in nested list

8

独自のカスタムクラスを定義した場合、いくつかの例があることに注意してください、あなたは、あなたが使用する必要がある属性を保持したいcopy.copy()か、copy.deepcopy()Pythonの3の例のために、代替ではなく:

import copy

class MyList(list):
    pass

lst = MyList([1,2,3])

lst.name = 'custom list'

d = {
'original': lst,
'slicecopy' : lst[:],
'lstcopy' : lst.copy(),
'copycopy': copy.copy(lst),
'deepcopy': copy.deepcopy(lst)
}


for k,v in d.items():
    print('lst: {}'.format(k), end=', ')
    try:
        name = v.name
    except AttributeError:
        name = 'NA'
    print('name: {}'.format(name))

出力:

lst: original, name: custom list
lst: slicecopy, name: NA
lst: lstcopy, name: NA
lst: copycopy, name: custom list
lst: deepcopy, name: custom list

5
new_list = my_list[:]

new_list = my_list これを理解してみてください。my_listがXのヒープメモリにあるとしましょう。つまり、my_listはXを指しています。今度は、割り当てによって、new_listがXをnew_list = my_list指しています。これは、浅いコピーと呼ばれます。

ここで割り当てる場合new_list = my_list[:]は、my_listの各オブジェクトをnew_listにコピーするだけです。これはディープコピーと呼ばれます。

これを行うことができるその他の方法は次のとおりです。

  • new_list = list(old_list)
  • import copy new_list = copy.deepcopy(old_list)

3

他の回答とは少し違うものを投稿したかったのです。これは最も理解しやすい、または最速のオプションではない可能性が高いですが、ディープコピーが機能する方法の内面図と、ディープコピーの別の代替オプションを提供します。これは、質問の回答のようにオブジェクトをコピーする方法を示すことですが、コアでディープコピーがどのように機能するかを説明するポイントとしても使用するためです。

深いコピー機能の中核は、浅いコピーを作成する方法です。どうやって?シンプル。ディープコピー機能は、不変オブジェクトのコンテナのみを複製します。ネストされたリストをディープコピーすると、リストの内部の変更可能なオブジェクトではなく、外部リストのみが複製されます。コンテナーを複製するだけです。クラスでも同じことが言えます。クラスをディープコピーすると、そのすべての変更可能な属性がディープコピーされます。では、どうやって?リスト、辞書、タプル、イター、クラス、クラスインスタンスなどのコンテナーをコピーする必要があるのはなぜですか?

それは簡単です。変更可能なオブジェクトは実際には複製できません。これは変更できないため、単一の値のみです。つまり、文字列、数値、ブール、またはそれらのいずれかを複製する必要はありません。しかし、どのようにコンテナを複製しますか?シンプル。すべての値で新しいコンテナを初期化するだけです。ディープコピーは再帰に依存しています。コンテナがなくなるまで、すべてのコンテナを複製します。コンテナは不変のオブジェクトです。

それがわかったら、参照なしでオブジェクトを完全に複製することは非常に簡単です。基本的なデータ型をディープコピーするための関数は次のとおりです(カスタムクラスでは機能しませんが、いつでも追加できます)

def deepcopy(x):
  immutables = (str, int, bool, float)
  mutables = (list, dict, tuple)
  if isinstance(x, immutables):
    return x
  elif isinstance(x, mutables):
    if isinstance(x, tuple):
      return tuple(deepcopy(list(x)))
    elif isinstance(x, list):
      return [deepcopy(y) for y in x]
    elif isinstance(x, dict):
      values = [deepcopy(y) for y in list(x.values())]
      keys = list(x.keys())
      return dict(zip(keys, values))

Python独自の組み込みディープコピーは、その例に基づいています。唯一の違いは、他のタイプをサポートし、属性を新しい複製クラスに複製することでユーザークラスもサポートし、メモリストまたは辞書を使用してすでに見られているオブジェクトへの参照で無限再帰をブロックします。そしてそれは本当に深いコピーを作るためのそれです。基本的に、深いコピーを作成することは、浅いコピーを作成することです。この答えが質問に何か追加されることを願っています。

次のリストがあるとします:[1、2、3]。不変の数値は複製できませんが、他のレイヤーは複製できます。リスト内包表記を使用して複製できます:[x for x in [1、2、3]

今、あなたがこのリストを持っていると想像してください:[[1、2]、[3、4]、[5、6]]。今回は、再帰を使用してリストのすべてのレイヤーをディープコピーする関数を作成します。上記のリスト内包表記の代わりに:

[x for x in _list]

リストに新しいものを使用します:

[deepcopy_list(x) for x in _list]

そして、deepcopy_listは次のようになります。

def deepcopy_list(x):
  if isinstance(x, (str, bool, float, int)):
    return x
  else:
    return [deepcopy_list(y) for y in x]

これで再帰を使用して、str、bool、floast、int、さらにはリストのリストを無限に多くのレイヤーにディープコピーできる関数ができました。ディープコピーがあります。

TLDR:不変オブジェクトは複製できないため、Deepcopyは再帰を使用してオブジェクトを複製し、以前と同じ不変オブジェクトを返すだけです。ただし、オブジェクトの最も外側の変更可能なレイヤーに到達するまで、変更可能なオブジェクトの最も内側のレイヤーをディープコピーします。


3

idとgcを通じてメモリを調べるための少し実用的な視点。

>>> b = a = ['hell', 'word']
>>> c = ['hell', 'word']

>>> id(a), id(b), id(c)
(4424020872, 4424020872, 4423979272) 
     |           |
      -----------

>>> id(a[0]), id(b[0]), id(c[0])
(4424018328, 4424018328, 4424018328) # all referring to same 'hell'
     |           |           |
      -----------------------

>>> id(a[0][0]), id(b[0][0]), id(c[0][0])
(4422785208, 4422785208, 4422785208) # all referring to same 'h'
     |           |           |
      -----------------------

>>> a[0] += 'o'
>>> a,b,c
(['hello', 'word'], ['hello', 'word'], ['hell', 'word'])  # b changed too
>>> id(a[0]), id(b[0]), id(c[0])
(4424018384, 4424018384, 4424018328) # augmented assignment changed a[0],b[0]
     |           |
      -----------

>>> b = a = ['hell', 'word']
>>> id(a[0]), id(b[0]), id(c[0])
(4424018328, 4424018328, 4424018328) # the same hell
     |           |           |
      -----------------------

>>> import gc
>>> gc.get_referrers(a[0]) 
[['hell', 'word'], ['hell', 'word']]  # one copy belong to a,b, the another for c
>>> gc.get_referrers(('hell'))
[['hell', 'word'], ['hell', 'word'], ('hell', None)] # ('hello', None) 

3

Pythonでは、次のことを覚えておいてください。

    list1 = ['apples','bananas','pineapples']
    list2 = list1

List2は実際のリストを格納しているのではなく、list1への参照を格納しています。したがって、list1に対して何かを行うと、list2も変更されます。コピーモジュール(デフォルトではなく、pipでダウンロード)を使用して、リストのcopy.copy()単純なリスト(copy.deepcopy()ネストされたリストの場合)の元のコピーを作成します。これにより、最初のリストで変更されないコピーが作成されます。


1

ディープコピーオプションは、私にとって有効な唯一の方法です。

from copy import deepcopy

a = [   [ list(range(1, 3)) for i in range(3) ]   ]
b = deepcopy(a)
b[0][1]=[3]
print('Deep:')
print(a)
print(b)
print('-----------------------------')
a = [   [ list(range(1, 3)) for i in range(3) ]   ]
b = a*1
b[0][1]=[3]
print('*1:')
print(a)
print(b)
print('-----------------------------')
a = [   [ list(range(1, 3)) for i in range(3) ] ]
b = a[:]
b[0][1]=[3]
print('Vector copy:')
print(a)
print(b)
print('-----------------------------')
a = [   [ list(range(1, 3)) for i in range(3) ]  ]
b = list(a)
b[0][1]=[3]
print('List copy:')
print(a)
print(b)
print('-----------------------------')
a = [   [ list(range(1, 3)) for i in range(3) ]  ]
b = a.copy()
b[0][1]=[3]
print('.copy():')
print(a)
print(b)
print('-----------------------------')
a = [   [ list(range(1, 3)) for i in range(3) ]  ]
b = a
b[0][1]=[3]
print('Shallow:')
print(a)
print(b)
print('-----------------------------')

次の出力につながります:

Deep:
[[[1, 2], [1, 2], [1, 2]]]
[[[1, 2], [3], [1, 2]]]
-----------------------------
*1:
[[[1, 2], [3], [1, 2]]]
[[[1, 2], [3], [1, 2]]]
-----------------------------
Vector copy:
[[[1, 2], [3], [1, 2]]]
[[[1, 2], [3], [1, 2]]]
-----------------------------
List copy:
[[[1, 2], [3], [1, 2]]]
[[[1, 2], [3], [1, 2]]]
-----------------------------
.copy():
[[[1, 2], [3], [1, 2]]]
[[[1, 2], [3], [1, 2]]]
-----------------------------
Shallow:
[[[1, 2], [3], [1, 2]]]
[[[1, 2], [3], [1, 2]]]
-----------------------------

1

これは、この行new_list = my_listが変数への新しい参照を割り当てるためmy_listです。new_list これは、次のCコードと同様です。

int my_list[] = [1,2,3,4];
int *new_list;
new_list = my_list;

copyモジュールを使用して、新しいリストを作成する必要があります。

import copy
new_list = copy.deepcopy(my_list)
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.