Pythonでネストされた辞書をどのように作成しますか?


149

「データ」と「マッピング」の2つのCSVファイルがあります。

  • : 'マッピング'ファイルには、4つの列がありDevice_NameGDNDevice_Type、とDevice_OS。4つの列すべてにデータが入力されます。
  • 「データ」ファイルにはこれらの同じ列Device_Nameがあり、列が設定され、他の3つの列は空白になっています。
  • 私は自分のPythonコードは両方のファイルを開き、各したいDevice_Nameデータファイルで、そのマッピングGDNDevice_TypeおよびDevice_OSマッピングファイルから値を。

2つの列しか存在しない場合(1つはマップする必要がある)にdictを使用する方法を知っていますが、3つの列をマップする必要がある場合にこれを実行する方法はわかりません。

以下は、私がマッピングを達成しようとしたコードを使用していますDevice_Type

x = dict([])
with open("Pricing Mapping_2013-04-22.csv", "rb") as in_file1:
    file_map = csv.reader(in_file1, delimiter=',')
    for row in file_map:
       typemap = [row[0],row[2]]
       x.append(typemap)

with open("Pricing_Updated_Cleaned.csv", "rb") as in_file2, open("Data Scraper_GDN.csv", "wb") as out_file:
    writer = csv.writer(out_file, delimiter=',')
    for row in csv.reader(in_file2, delimiter=','):
         try:
              row[27] = x[row[11]]
         except KeyError:
              row[27] = ""
         writer.writerow(row)

戻りますAttribute Error

調べた結果、ネストされた辞書を作成する必要があると思いますが、これを行う方法がわかりません。


Device_Name列は両方のファイルのキーです。このキーで、Device_OS、GDN、およびDevice_Typeの値をマッピングファイルからデータファイルにマッピングします。
atams 2013年

次のようなことができるようになりたいrow[27] = x[row[11]]["Device_OS"]ですか?
Janne Karila、2013年


これは、必ずしもネストされた辞書を必要としません。あなたはパンダを使用し、read_csv、Device_Nameインデックスを作成し、インデックスjoin上の2つのデータフレームを直接作成することができますDevice_Name
smci

回答:


307

ネストされた辞書は、辞書内の辞書です。とても簡単なことです。

>>> d = {}
>>> d['dict1'] = {}
>>> d['dict1']['innerkey'] = 'value'
>>> d
{'dict1': {'innerkey': 'value'}}

パッケージdefaultdictからを使用して、collectionsネストされた辞書の作成を容易にすることもできます。

>>> import collections
>>> d = collections.defaultdict(dict)
>>> d['dict1']['innerkey'] = 'value'
>>> d  # currently a defaultdict type
defaultdict(<type 'dict'>, {'dict1': {'innerkey': 'value'}})
>>> dict(d)  # but is exactly like a normal dictionary.
{'dict1': {'innerkey': 'value'}}

必要に応じて、それを入力できます。

私はあなたのコードで次のようなものをお勧めします:

d = {}  # can use defaultdict(dict) instead

for row in file_map:
    # derive row key from something 
    # when using defaultdict, we can skip the next step creating a dictionary on row_key
    d[row_key] = {} 
    for idx, col in enumerate(row):
        d[row_key][idx] = col

あなたのコメントによると:

コードの上にある可能性があります問題を混乱させています。一言で言えば、私は2つのファイルa.csv b.csvを持っています。a.csvには4つの列ijklがあり、b.csvにもこれらの列があります。私はこれらのcsvのキー列の一種です。a.csvではjkl列は空ですが、b.csvに入力されています。キー列として「i」を使用してjk l列の値をb.csvからa.csvファイルにマッピングしたい

私の提案は次のようなものです(defaultdictを使用せずに):

a_file = "path/to/a.csv"
b_file = "path/to/b.csv"

# read from file a.csv
with open(a_file) as f:
    # skip headers
    f.next()
    # get first colum as keys
    keys = (line.split(',')[0] for line in f) 

# create empty dictionary:
d = {}

# read from file b.csv
with open(b_file) as f:
    # gather headers except first key header
    headers = f.next().split(',')[1:]
    # iterate lines
    for line in f:
        # gather the colums
        cols = line.strip().split(',')
        # check to make sure this key should be mapped.
        if cols[0] not in keys:
            continue
        # add key to dict
        d[cols[0]] = dict(
            # inner keys are the header names, values are columns
            (headers[idx], v) for idx, v in enumerate(cols[1:]))

ただし、csvファイルを解析するためのcsvモジュールがあることに注意してください。


コードの上にある可能性があります問題を混乱させています。簡単に言えばa.csv b.csv、2つのファイル、a.csv4つの列i j k lb.csvこれらの列があります。iこれらのcsvのキー列の一種です。j k l列は空ですa.csvが、に入力されていb.csvます。j k lキー列として「i」を使用して列の値をb.csvファイルからa.csvファイルにマッピングしたい。
atams 2013年

64

更新:ネストされた辞書の任意の長さについては、この回答にアクセスしてください

コレクションからdefaultdict関数を使用します。

高性能:データセットが大きい場合、「if key not dict」は非常に高価です。

低メンテナンス:コードを読みやすくし、簡単に拡張できます。

from collections import defaultdict

target_dict = defaultdict(dict)
target_dict[key1][key2] = val

3
from collections import defaultdict target_dict = defaultdict(dict) target_dict['1']['2']私に与えるtarget_dict['1']['2'] KeyError: '2'
2017年

1
取得する前に値を割り当てる必要があります。
Junchen 2018年

24

入れ子の任意のレベルの場合:

In [2]: def nested_dict():
   ...:     return collections.defaultdict(nested_dict)
   ...:

In [3]: a = nested_dict()

In [4]: a
Out[4]: defaultdict(<function __main__.nested_dict>, {})

In [5]: a['a']['b']['c'] = 1

In [6]: a
Out[6]:
defaultdict(<function __main__.nested_dict>,
            {'a': defaultdict(<function __main__.nested_dict>,
                         {'b': defaultdict(<function __main__.nested_dict>,
                                      {'c': 1})})})

2
上記の回答が2行の関数で行うことは、この回答のように、1行のラムダで行うこともできます
Acumenus 2017年

3

defaultdictやのような同様のネストされたdictモジュールをnested_dict使用する場合、存在しないキーを検索すると、誤ってdictに新しいキーエントリが作成され、多くの混乱を引き起こす可能性があることを覚えておくことが重要です。

以下は、nested_dictモジュールを使用したPython3の例です。

import nested_dict as nd
nest = nd.nested_dict()
nest['outer1']['inner1'] = 'v11'
nest['outer1']['inner2'] = 'v12'
print('original nested dict: \n', nest)
try:
    nest['outer1']['wrong_key1']
except KeyError as e:
    print('exception missing key', e)
print('nested dict after lookup with missing key.  no exception raised:\n', nest)

# Instead, convert back to normal dict...
nest_d = nest.to_dict(nest)
try:
    print('converted to normal dict. Trying to lookup Wrong_key2')
    nest_d['outer1']['wrong_key2']
except KeyError as e:
    print('exception missing key', e)
else:
    print(' no exception raised:\n')

# ...or use dict.keys to check if key in nested dict
print('checking with dict.keys')
print(list(nest['outer1'].keys()))
if 'wrong_key3' in list(nest.keys()):

    print('found wrong_key3')
else:
    print(' did not find wrong_key3')

出力は次のとおりです。

original nested dict:   {"outer1": {"inner2": "v12", "inner1": "v11"}}

nested dict after lookup with missing key.  no exception raised:  
{"outer1": {"wrong_key1": {}, "inner2": "v12", "inner1": "v11"}} 

converted to normal dict. 
Trying to lookup Wrong_key2 

exception missing key 'wrong_key2' 

checking with dict.keys 

['wrong_key1', 'inner2', 'inner1']  
did not find wrong_key3
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.