複数のdictを同じキーでマージする方法は?


83

私はこのような複数のdict /キーと値のペアを持っています:

d1 = {key1: x1, key2: y1}  
d2 = {key1: x2, key2: y2}  

結果を新しいdictにしたい(可能であれば最も効率的な方法で):

d = {key1: (x1, x2), key2: (y1, y2)}  

実際、結果dは次のようになります。

d = {key1: (x1.x1attrib, x2.x2attrib), key2: (y1.y1attrib, y2.y2attrib)}  

誰かが最初の結果を得る方法を教えてくれれば、残りを理解することができます。


3
@Salil:各キーがすべての辞書に存在すると想定できますか?
ビョルンポレックス2011年


こんにちはSpace_C0wb0y、はい、キーはすべての辞書に存在します。
サリル

すべてのdictが同じキーを持っているかどうかを指定することは絶対に重要です。
yugr 2018

回答:


43

すべてのキーが常にすべてのdictに存在すると仮定します。

ds = [d1, d2]
d = {}
for k in d1.iterkeys():
    d[k] = tuple(d[k] for d in ds)

注:Python 3.xでは、以下のコードを使用します。

ds = [d1, d2]
d = {}
for k in d1.keys():
  d[k] = tuple(d[k] for d in ds)

dicにnumpy配列が含まれている場合:

ds = [d1, d2]
d = {}
for k in d1.keys():
  d[k] = np.concatenate(list(d[k] for d in ds))

3
「d1のkの場合」だけで十分だと思います。
サリル

およびd [k]の代わりにd.get(k、None)
tahir 2013年

1
@tahirこれは、dictに一致しないキーがあるため、反復d1が正しくないことを意味します(他のdictのキーを見逃す可能性があります)。
yugr 2018

1
Python 3ユーザーの場合:d1.iterkeys()= d1.items()
Riley

Python3.xではまだ機能しません。値が配列でなくてもこれを試しましたが、機能します。ただし、出力される値は配列になります。stackoverflow.com/questions/54040858/...
リックS

73

キーが一部の辞書にのみ含まれている場合を含め、任意の量の辞書を処理する一般的なソリューションを次に示します。

from collections import defaultdict

d1 = {1: 2, 3: 4}
d2 = {1: 6, 3: 7}

dd = defaultdict(list)

for d in (d1, d2): # you can list as many input dicts as you want here
    for key, value in d.items():
        dd[key].append(value)

print(dd)

ショー:

defaultdict(<type 'list'>, {1: [2, 6], 3: [4, 7]})

また、を取得するには.attrib、に変更append(value)するだけですappend(value.attrib)


OPは値を必要としtupleないと思いますlist
user225312 2011年

1
@AA:それは本当に重要ですか?タプルは、いくつかのキーがどこにでも存在しない、複数の入力dictのより一般的なケースでは、構築するのがより難しいでしょう、imho
Eli Bendersky 2011年

1
その後、通常のようにしたいことdictのうちにdefaultdictあなたは、通常の持っているのでdict、存在しないキーの動作をなど: dd = dict(dd)
ネッドDeily

@Ned:良い点ですが、データの最終的な使用方法によって異なります
Eli Bendersky 2011年

@Eli:いいえ、それは問題ではありませんが、私はOPが望んでいたことに基づいてそれを基にしようとしていて、あなたからのタプルの解決策があることを望んでいました:-)
user225312 2011年

4

d1とd2しかない場合は、

from collections import defaultdict

d = defaultdict(list)
for a, b in d1.items() + d2.items():
    d[a].append(b)

4
dict1 = {'m': 2, 'n': 4}
dict2 = {'n': 3, 'm': 1}

キーが同じ順序になっていることを確認します。

dict2_sorted = {i:dict2[i] for i in dict1.keys()}

keys = dict1.keys()
values = zip(dict1.values(), dict2_sorted.values())
dictionary = dict(zip(keys, values))

与える:

{'m': (2, 1), 'n': (4, 3)}

1
の要素の順序values()は定義されていないため、関連のないキーの値をマージしている可能性があります。
yugr 2018

変更を適用したので、フィードバックをキャプチャできるようになりました
Mahdi Ghelichi 2018

この変更で問題が解決するとは思わない。を使用するsorted(d.items())sorted(d.keys())、予測可能な結果を​​達成する必要があります。
yugr 2018

そうでなければそれを証明する例を挙げていただけますか?dict2_sortedは、Pythonでソートされた辞書です。
Mahdi Ghelichi 2018

それがあなたのマシンの小さな辞書でたまたま機能するという事実は証明ではありません。ここで再現を確認してください。
yugr 2018

3

両方の辞書が同じキーを持っていなくても機能する、使用できる1つのアプローチを次に示します。

d1 = {'a':'test','b':'btest','d':'dreg'}
d2 = {'a':'cool','b':'main','c':'clear'}

d = {}

for key in set(d1.keys() + d2.keys()):
    try:
        d.setdefault(key,[]).append(d1[key])        
    except KeyError:
        pass

    try:
        d.setdefault(key,[]).append(d2[key])          
    except KeyError:
        pass

print d

これにより、以下の入力が生成されます。

{'a': ['test', 'cool'], 'c': ['clear'], 'b': ['btest', 'main'], 'd': ['dreg']}

答えset(d1.keys() + d2.keys()) でに変更できますかset(list(d1.keys()) + list(d2.keys()))(Python 3.xの場合)?それ以外の場合TypeError: unsupported operand type(s) for +: 'dict_keys' and 'dict_keys'は、python3.x
R4444 2018

1

Python3.xアップデート

Eli Benderskyの回答から:

Python 3で削除されたdict.iteritemsは、代わりにdict.itemsを使用します。Python wikiを参照してください:https//wiki.python.org/moin/Python3.0

from collections import defaultdict

dd = defaultdict(list)

for d in (d1, d2):
    for key, value in d.items():
        dd[key].append(value)

1

このメソッドは、2つの辞書のキーが異なっていても、2つの辞書をマージします。

def combine_dict(d1, d2):
    combined = {}
    for k in set(d1.keys()) | set(d2.keys()):
        combined[k] = tuple(d[k] for d in [d1, d2] if k in d)
    return combined

例:

d1 = {
    'a': 1,
    'b': 2,
}
d2` = {
    'b': 'boat',
    'c': 'car',
}
combine_dict(d1, d2)
# Returns: {
#    'a': (1,),
#    'b': (2, 'boat'),
#    'c': ('car',)
# }

1

すべてのキーのリストがあると仮定します(すべての辞書を反復処理してそれらのキーを取得することで、このリストを取得できます)。名前を付けましょうlistKeys。また:

  • listValues マージする単一のキーのすべての値のリストです。
  • allDicts:マージするすべての辞書。
result = {}
for k in listKeys:
    listValues = [] #we will convert it to tuple later, if you want.
    for d in allDicts:
       try:
            fileList.append(d[k]) #try to append more values to a single key
        except:
            pass
    if listValues: #if it is not empty
        result[k] = typle(listValues) #convert to tuple, add to new dictionary with key k

0
def merge(d1, d2, merge):
    result = dict(d1)
    for k,v in d2.iteritems():
        if k in result:
            result[k] = merge(result[k], v)
        else:
            result[k] = v
    return result

d1 = {'a': 1, 'b': 2}
d2 = {'a': 1, 'b': 3, 'c': 2}
print merge(d1, d2, lambda x, y:(x,y))

{'a': (1, 1), 'c': 2, 'b': (2, 3)}

0

2つのリストのソリューションを補足するために、単一のソリューションを処理するためのソリューションを次に示します。リストます。

サンプルリスト(NetworkX関連。読みやすくするためにここで手動でフォーマット):

ec_num_list = [((src, tgt), ec_num['ec_num']) for src, tgt, ec_num in G.edges(data=True)]

print('\nec_num_list:\n{}'.format(ec_num_list))
ec_num_list:
[((82, 433), '1.1.1.1'),
  ((82, 433), '1.1.1.2'),
  ((22, 182), '1.1.1.27'),
  ((22, 3785), '1.2.4.1'),
  ((22, 36), '6.4.1.1'),
  ((145, 36), '1.1.1.37'),
  ((36, 154), '2.3.3.1'),
  ((36, 154), '2.3.3.8'),
  ((36, 72), '4.1.1.32'),
  ...] 

同じエッジ(タプルによって定義される)の値が重複していることに注意してください。それらの「値」を対応する「キー」に照合するには:

from collections import defaultdict
ec_num_collection = defaultdict(list)
for k, v in ec_num_list:
    ec_num_collection[k].append(v)

print('\nec_num_collection:\n{}'.format(ec_num_collection.items()))
ec_num_collection:
[((82, 433), ['1.1.1.1', '1.1.1.2']),   ## << grouped "values"
((22, 182), ['1.1.1.27']),
((22, 3785), ['1.2.4.1']),
((22, 36), ['6.4.1.1']),
((145, 36), ['1.1.1.37']),
((36, 154), ['2.3.3.1', '2.3.3.8']),    ## << grouped "values"
((36, 72), ['4.1.1.32']),
...] 

必要に応じて、そのリストをdictに変換します。

ec_num_collection_dict = {k:v for k, v in zip(ec_num_collection, ec_num_collection)}

print('\nec_num_collection_dict:\n{}'.format(dict(ec_num_collection)))
  ec_num_collection_dict:
  {(82, 433): ['1.1.1.1', '1.1.1.2'],
  (22, 182): ['1.1.1.27'],
  (22, 3785): ['1.2.4.1'],
  (22, 36): ['6.4.1.1'],
  (145, 36): ['1.1.1.37'],
  (36, 154): ['2.3.3.1', '2.3.3.8'],
  (36, 72): ['4.1.1.32'],
  ...}

参考文献


0

ブラブの答えから:

各リストの値を使用してタプルを直接形成することもできます

ds = [d1, d2]
d = {}
for k in d1.keys():
  d[k] = (d1[k], d2[k])

これは、タプルに特定の順序がある場合に役立つことがあります

ds = [d1, d2, d3, d4]
d = {}
for k in d1.keys():
  d[k] = (d3[k], d1[k], d4[k], d2[k]) #if you wanted tuple in order of d3, d1, d4, d2

0

このライブラリは私を助けてくれました。同じ名前で値が異なるネストされたキーのdictリストがあり、他のすべてのソリューションがそれらのネストされたキーをオーバーライドし続けました。

https://pypi.org/project/deepmerge/

from deepmerge import always_merger

def process_parms(args):
    temp_list = []
    for x in args:
        with open(x, 'r') as stream:
            temp_list.append(yaml.safe_load(stream))

    return always_merger.merge(*temp_list)

0

キーがネストされている場合:

d1 = { 'key1': { 'nkey1': 'x1' }, 'key2': { 'nkey2': 'y1' } } 
d2 = { 'key1': { 'nkey1': 'x2' }, 'key2': { 'nkey2': 'y2' } }
ds = [d1, d2]
d = {}
for k in d1.keys():
    for k2 in d1[k].keys():
        d.setdefault(k, {})
        d[k].setdefault(k2, [])
        d[k][k2] = tuple(d[k][k2] for d in ds)

収量:

{'key1': {'nkey1': ('x1', 'x2')}, 'key2': {'nkey2': ('y1', 'y2')}}

-4

コンパクトな可能性

d1={'a':1,'b':2}
d2={'c':3,'d':4}
context={**d1, **d2}
context
{'b': 2, 'c': 3, 'd': 4, 'a': 1}

問題は、dictを同じキーにマージすることです。あなたは必須の答えではありません。
pbd 2017
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.