defaultdict
「標準ディクショナリには、値を取得し、値が存在しない場合にデフォルトを確立するためのメソッドsetdefault()が含まれています。対照的defaultdict
に、コンテナが初期化されるときに、呼び出し側にデフォルト(返される値)を指定させます。」
で定義されたダグ・ヘルマンでの例でPythonの標準ライブラリ
defaultdictの使い方
defaultdictのインポート
>>> from collections import defaultdict
defaultdictを初期化する
渡して初期化する
最初の引数として呼び出し可能(必須)
>>> d_int = defaultdict(int)
>>> d_list = defaultdict(list)
>>> def foo():
... return 'default value'
...
>>> d_foo = defaultdict(foo)
>>> d_int
defaultdict(<type 'int'>, {})
>>> d_list
defaultdict(<type 'list'>, {})
>>> d_foo
defaultdict(<function foo at 0x7f34a0a69578>, {})
** 2番目の引数としてkwargs(オプション)
>>> d_int = defaultdict(int, a=10, b=12, c=13)
>>> d_int
defaultdict(<type 'int'>, {'a': 10, 'c': 13, 'b': 12})
または
>>> kwargs = {'a':10,'b':12,'c':13}
>>> d_int = defaultdict(int, **kwargs)
>>> d_int
defaultdict(<type 'int'>, {'a': 10, 'c': 13, 'b': 12})
仕組み
標準ディクショナリの子クラスなので、同じ機能をすべて実行できます。
しかし、不明なキーを渡す場合、エラーではなくデフォルト値を返します。例:
>>> d_int['a']
10
>>> d_int['d']
0
>>> d_int
defaultdict(<type 'int'>, {'a': 10, 'c': 13, 'b': 12, 'd': 0})
デフォルト値を変更したい場合は、default_factoryを上書きします。
>>> d_int.default_factory = lambda: 1
>>> d_int['e']
1
>>> d_int
defaultdict(<function <lambda> at 0x7f34a0a91578>, {'a': 10, 'c': 13, 'b': 12, 'e': 1, 'd': 0})
または
>>> def foo():
... return 2
>>> d_int.default_factory = foo
>>> d_int['f']
2
>>> d_int
defaultdict(<function foo at 0x7f34a0a0a140>, {'a': 10, 'c': 13, 'b': 12, 'e': 1, 'd': 0, 'f': 2})
質問の例
例1
intがdefault_factoryとして渡されているため、不明なキーはデフォルトで0を返します。
文字列がループで渡されると、dのアルファベットの数が増えます。
>>> s = 'mississippi'
>>> d = defaultdict(int)
>>> d.default_factory
<type 'int'>
>>> for k in s:
... d[k] += 1
>>> d.items()
[('i', 4), ('p', 2), ('s', 4), ('m', 1)]
>>> d
defaultdict(<type 'int'>, {'i': 4, 'p': 2, 's': 4, 'm': 1})
例2
リストがdefault_factoryとして渡されているため、不明な(存在しない)キーはデフォルトで[](つまり、リスト)を返します。
タプルのリストがループで渡されると、d [color]に値が追加されます
>>> s = [('yellow', 1), ('blue', 2), ('yellow', 3), ('blue', 4), ('red', 1)]
>>> d = defaultdict(list)
>>> d.default_factory
<type 'list'>
>>> for k, v in s:
... d[k].append(v)
>>> d.items()
[('blue', [2, 4]), ('red', [1]), ('yellow', [1, 3])]
>>> d
defaultdict(<type 'list'>, {'blue': [2, 4], 'red': [1], 'yellow': [1, 3]})
default_factory = None
が完了した後でdefaultdictを設定して読み取り専用で使用することを忘れないでください。この質問を参照してください。