Python辞書オブジェクトからキーと値のペアのサブセットを抽出しますか?


313

いくつかのキーと値のペア(約16)を持つ大きなディクショナリオブジェクトがありますが、そのうちの3つだけに関心があります。それを達成するための最良の方法(最短/効率的/最もエレガント)は何ですか?

私が知っている最高のものは:

bigdict = {'a':1,'b':2,....,'z':26} 
subdict = {'l':bigdict['l'], 'm':bigdict['m'], 'n':bigdict['n']}

これよりエレガントな方法があると私は確信しています。アイデア?

回答:


430

あなたは試すことができます:

dict((k, bigdict[k]) for k in ('l', 'm', 'n'))

...または Python 3Pythonバージョン2.7以降(2.7でも機能することを指摘してくれたFábioDinizに感謝)

{k: bigdict[k] for k in ('l', 'm', 'n')}

更新:HåvardSが指摘するように、私はあなたがキーが辞書に入れられることを知っていると思います- もしあなたがその仮定をすることができないなら彼の答えを見てください。あるいは、timboがコメントで指摘しているように、欠落しbigdictているキーをにマップするNone場合は、次のようにすることができます。

{k: bigdict.get(k, None) for k in ('l', 'm', 'n')}

Python 3を使用していて、元のdictに実際に存在する新しいdictのキーのみが必要な場合は、ファクトを使用してオブジェクトを表示し、いくつかの集合演算を実装できます。

{k: bigdict[k] for k in bigdict.keys() & {'l', 'm', 'n'}}

5
bigdict含まれていない場合は失敗しますk
–HåvardS 2011

7
それを反対投票するのは少し厳しいです-これらのキーが辞書にあることが知られていることは私にとって文脈からかなり明白に見えました...
Mark Longair

9
{k: bigdict.get(k,None) for k in ('l', 'm', 'n')}新しい辞書のkeyをNoneに設定することにより、指定されたキーがソースディクショナリで欠落している状況に対処します
timbo

9
@MarkLongairユースケースに応じて、{k:bigdict [k] for k in( 'l'、 'm'、 'n')if k in bigdict}の方が良い場合があります。これは、実際に値を持つキーのみを格納するためです。
ブリフォードワイリー2014

6
bigdict.keys() & {'l', 'm', 'n'} ==> bigdict.viewkeys() & {'l', 'm', 'n'} Python2.7の場合
kxr

119

少々短く、少なくとも:

wanted_keys = ['l', 'm', 'n'] # The keys you want
dict((k, bigdict[k]) for k in wanted_keys if k in bigdict)

8
キーをNoneに設定するのではなく、bigdictにない場合にキーを除外する代替動作の場合は+1。
dhj 14年

1
または、dict((k,bigdict.get(k,defaultVal) for k in wanted_keys)すべてのキーが必要な場合。
Thomas Andrews

2
この回答は「t」によって保存されます。
sakurashinken

24
interesting_keys = ('l', 'm', 'n')
subdict = {x: bigdict[x] for x in interesting_keys if x in bigdict}

16

言及されたすべての方法の速度比較のビット:

Python 2.7.11 |Anaconda 2.4.1 (64-bit)| (default, Jan 29 2016, 14:26:21) [MSC v.1500 64 bit (AMD64)] on win32
In[2]: import numpy.random as nprnd
keys = nprnd.randint(1000, size=10000)
bigdict = dict([(_, nprnd.rand()) for _ in range(1000)])

%timeit {key:bigdict[key] for key in keys}
%timeit dict((key, bigdict[key]) for key in keys)
%timeit dict(map(lambda k: (k, bigdict[k]), keys))
%timeit dict(filter(lambda i:i[0] in keys, bigdict.items()))
%timeit {key:value for key, value in bigdict.items() if key in keys}
100 loops, best of 3: 3.09 ms per loop
100 loops, best of 3: 3.72 ms per loop
100 loops, best of 3: 6.63 ms per loop
10 loops, best of 3: 20.3 ms per loop
100 loops, best of 3: 20.6 ms per loop

予想通り、辞書の理解が最良の選択肢です。


最初の3つの操作は、最後の2つの操作とは異なる処理を行うため、にkey存在しない場合はエラーになりますbigdict
naught101

12

この回答は、選択した回答と同様の辞書内包表記を使用していますが、不足している項目を除いては使用できません。

python 2バージョン:

{k:v for k, v in bigDict.iteritems() if k in ('l', 'm', 'n')}

python 3バージョン:

{k:v for k, v in bigDict.items() if k in ('l', 'm', 'n')}

2
...しかし、大きな辞書が巨大な場合でも、完全に繰り返されます(これはO(n)操作です)。逆は、3つのアイテム(それぞれO(1)操作)を取得します。
wouter bolsterlee

1
問題は、たった16個のキーの辞書に関するものです
Meow

6

多分:

subdict=dict([(x,bigdict[x]) for x in ['l', 'm', 'n']])

Python 3は、次のものもサポートしています。

subdict={a:bigdict[a] for a in ['l','m','n']}

次のようにして、辞書に存在するかどうかを確認できます。

subdict=dict([(x,bigdict[x]) for x in ['l', 'm', 'n'] if x in bigdict])

それぞれ。Python 3用

subdict={a:bigdict[a] for a in ['l','m','n'] if a in bigdict}

場合は失敗aではありませんbigdict
HåvardS

3

さて、これは私を数回悩ませてきたものですので、Jayeshに質問していただきありがとうございます。

上記の答えはどれも同じように良い解決策のように見えますが、コード全体でこれを使用している場合は、機能IMHOをラップすることは理にかなっています。また、ここには2つの可能な使用例があります。1つは、すべてのキーワードが元の辞書にあるかどうかに関心がある場合です。そして、あなたがそうしないところ。両方を同等に扱うとよいでしょう。

ですから、私の2ペンスの価値のために、私は辞書のサブクラスを書くことをお勧めします、例えば

class my_dict(dict):
    def subdict(self, keywords, fragile=False):
        d = {}
        for k in keywords:
            try:
                d[k] = self[k]
            except KeyError:
                if fragile:
                    raise
        return d

これでサブディクショナリを引き出すことができます

orig_dict.subdict(keywords)

使用例:

#
## our keywords are letters of the alphabet
keywords = 'abcdefghijklmnopqrstuvwxyz'
#
## our dictionary maps letters to their index
d = my_dict([(k,i) for i,k in enumerate(keywords)])
print('Original dictionary:\n%r\n\n' % (d,))
#
## constructing a sub-dictionary with good keywords
oddkeywords = keywords[::2]
subd = d.subdict(oddkeywords)
print('Dictionary from odd numbered keys:\n%r\n\n' % (subd,))
#
## constructing a sub-dictionary with mixture of good and bad keywords
somebadkeywords = keywords[1::2] + 'A'
try:
    subd2 = d.subdict(somebadkeywords)
    print("We shouldn't see this message")
except KeyError:
    print("subd2 construction fails:")
    print("\toriginal dictionary doesn't contain some keys\n\n")
#
## Trying again with fragile set to false
try:
    subd3 = d.subdict(somebadkeywords, fragile=False)
    print('Dictionary constructed using some bad keys:\n%r\n\n' % (subd3,))
except KeyError:
    print("We shouldn't see this message")

上記のコードをすべて実行すると、次のような出力が表示されます(書式設定はお手数ですが)。

元の辞書:
{'a':0、 'c':2、 'b':1、 'e':4、 'd':3、 'g':6、 'f':5、 'i': 8、 'h':7、 'k':10、 'j':9、 'm':12、 'l':11、 'o':14、 'n':13、 'q':16、 「p」:15、「s」:18、「r」:17、「u」:20、「t」:19、「w」:22、「v」:21、「y」:24、「x ':23、' z ':25}

奇数キーからの辞書:
{'a':0、 'c':2、 'e':4、 'g':6、 'i':8、 'k':10、 'm':12、 ' o ':14、' q ':16、' s ':18、' u ':20、' w ':22、' y ':24}

subd2の構築が失敗する:
元の辞書にいくつかのキーが含まれていない

いくつかの不正なキーを使用して構築された辞書:
{'b':1、 'd':3、 'f':5、 'h':7、 'j':9、 'l':11、 'n':13、 'p':15、 'r':17、 't':19、 'v':21、 'x':23、 'z':25}


1
サブクラス化では、既存のdictオブジェクトをサブクラスタイプに変換する必要があり、コストが高くなる可能性があります。単純な関数を書いてみませんsubdict(orig_dict, keys, …)か?
ムシフィル2015

3

また、使用することができますmap(これは非常にとにかく知ってもらうために便利な機能):

sd = dict(map(lambda k: (k, l.get(k, None)), l))

例:

large_dictionary = {'a1':123, 'a2':45, 'a3':344}
list_of_keys = ['a1', 'a3']
small_dictionary = dict(map(lambda key: (key, large_dictionary.get(key, None)), list_of_keys))

PS:私.get(key, None)は前の答えから借りました:)


1

さらに別のもの(私はMark Longairの答えを好む)

di = {'a':1,'b':2,'c':3}
req = ['a','c','w']
dict([i for i in di.iteritems() if i[0] in di and i[0] in req])

大きな
辞書

0

解決

from operator import itemgetter
from typing import List, Dict, Union


def subdict(d: Union[Dict, List], columns: List[str]) -> Union[Dict, List[Dict]]:
    """Return a dict or list of dicts with subset of 
    columns from the d argument.
    """
    getter = itemgetter(*columns)

    if isinstance(d, list):
        result = []
        for subset in map(getter, d):
            record = dict(zip(columns, subset))
            result.append(record)
        return result
    elif isinstance(d, dict):
        return dict(zip(columns, getter(d)))

    raise ValueError('Unsupported type for `d`')

使用例

# pure dict

d = dict(a=1, b=2, c=3)
print(subdict(d, ['a', 'c']))

>>> In [5]: {'a': 1, 'c': 3}
# list of dicts

d = [
    dict(a=1, b=2, c=3),
    dict(a=2, b=4, c=6),
    dict(a=4, b=8, c=12),
]

print(subdict(d, ['a', 'c']))

>>> In [5]: [{'a': 1, 'c': 3}, {'a': 2, 'c': 6}, {'a': 4, 'c': 12}]
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.