Pythonで複数の辞書のキーに対する集合演算（共通、和、差、対称差）

Modified: 2023-11-06 | Tags: Python, 辞書

Pythonで辞書（dict型オブジェクト）のメソッドkeys()とitems()を使うと、キーkeyおよびキーと値のタプル(key, value)に対して集合演算が可能。

キーと値のタプルから辞書を生成できるので、例えば、複数の辞書に共通する要素（キーと値）からなる辞書を生成したりできる。

辞書オブジェクトのkeys()メソッドとitems()メソッド
複数の辞書に共通のキーを抽出（共通部分）
複数の辞書に含まれるキーをすべて抽出（和集合）
複数の辞書のいずれかにのみ含まれるキーを抽出（差集合、対称差集合）

辞書オブジェクトのkeys()メソッドとitems()メソッド

辞書オブジェクトにはkeys()メソッドとitems()メソッドがある。

関連記事: Pythonの辞書（dict）のforループ処理（keys, values, items）

keys()はキーkeyの、items()はキーと値のタプル(key, value)のビューを返す。

d1 = {'a': 1, 'b': 2, 'c': 3}
d2 = {'b': 2, 'c': 4, 'd': 5}

print(d1.keys())
# dict_keys(['a', 'b', 'c'])

print(type(d1.keys()))
# <class 'dict_keys'>

print(d1.items())
# dict_items([('a', 1), ('b', 2), ('c', 3)])

print(type(d1.items()))
# <class 'dict_items'>

source: dict_keys_items_set.py

それぞれdict_keys型、dict_items型だが、set型のような集合演算をサポートしている。

関連記事: Python, set型で集合演算（和集合、積集合や部分集合の判定など）

辞書オブジェクトには値valueのビューを返すvalues()メソッドもあるが、値は重複する場合があるので集合演算はサポートされていない。

組み込み型 - 辞書ビューオブジェクト — Python 3.12.0 ドキュメント

以下、keys()メソッドとitems()メソッドを利用した集合演算の例を示す。

複数の辞書に共通のキーを抽出（共通部分）

複数の辞書に共通しているキーはkeys()メソッドと&演算子で抽出できる。

d1 = {'a': 1, 'b': 2, 'c': 3}
d2 = {'b': 2, 'c': 4, 'd': 5}

intersection_keys = d1.keys() & d2.keys()
print(intersection_keys)
# {'c', 'b'}

source: dict_keys_items_set.py

集合演算の結果はset型。以降の例でも同じ。

print(type(intersection_keys))
# <class 'set'>

source: dict_keys_items_set.py

items()メソッドの場合、キーと値が両方とも共通のものが抽出される。キーのみ、あるいは、値のみが共通のものは除外される。

intersection_items = d1.items() & d2.items()
print(intersection_items)
# {('b', 2)}

source: dict_keys_items_set.py

辞書オブジェクトのコンストラクタdict()にタプル(key, value)の集合（items()メソッドの集合演算結果）を渡すと辞書を生成できる。

intersection_dict = dict(d1.items() & d2.items())
print(intersection_dict)
# {'b': 2}

print(type(intersection_dict))
# <class 'dict'>

source: dict_keys_items_set.py

複数の辞書に含まれるキーをすべて抽出（和集合）

複数の辞書に含まれるすべてのキー、つまり、複数の辞書のいずれかに少なくとも一つ含まれるキー（和集合）は|演算子で抽出できる。

d1 = {'a': 1, 'b': 2, 'c': 3}
d2 = {'b': 2, 'c': 4, 'd': 5}

union_keys = d1.keys() | d2.keys()
print(union_keys)
# {'d', 'c', 'a', 'b'}

source: dict_keys_items_set.py

items()メソッドの場合は以下の通り。キーが共通でも値が異なる要素は別々に抽出される。

union_items = d1.items() | d2.items()
print(union_items)
# {('b', 2), ('a', 1), ('c', 4), ('d', 5), ('c', 3)}

source: dict_keys_items_set.py

この例のようにキーが共通で値が異なる要素があると、その集合から辞書を生成する場合にどちらか一方のみが残る。どちらの値が残るかは指定できない。

union_dict = dict(d1.items() | d2.items())
print(union_dict)
# {'b': 2, 'a': 1, 'c': 3, 'd': 5}

source: dict_keys_items_set.py

なお、Python 3.9以降、|演算子で2つの辞書をマージできるようになった。この処理では、共通のキーがある場合は右側の辞書の値が残る。

関連記事: Pythonで辞書同士を結合（連結・マージ）

print(d1 | d2)
# {'a': 1, 'b': 2, 'c': 4, 'd': 5}

print(d2 | d1)
# {'b': 2, 'c': 3, 'd': 5, 'a': 1}

source: dict_keys_items_set.py

複数の辞書のいずれかにのみ含まれるキーを抽出（差集合、対称差集合）

複数の辞書のいずれか一方にのみ含まれるキー（対称差集合）は^演算子で抽出できる。

d1 = {'a': 1, 'b': 2, 'c': 3}
d2 = {'b': 2, 'c': 4, 'd': 5}

symmetric_difference_keys = d1.keys() ^ d2.keys()
print(symmetric_difference_keys)
# {'d', 'a'}

source: dict_keys_items_set.py

items()メソッドの場合は以下の通り。|演算子（和集合）と同様に、キーが共通でも値が異なる要素は別々に抽出される。

symmetric_difference_items = d1.items() ^ d2.items()
print(symmetric_difference_items)
# {('d', 5), ('a', 1), ('c', 3), ('c', 4)}

source: dict_keys_items_set.py

symmetric_difference_dict = dict(d1.items() ^ d2.items())
print(symmetric_difference_dict)
# {'d': 5, 'a': 1, 'c': 4}

source: dict_keys_items_set.py

-演算子で差集合を取得することもできる。

difference_keys = d1.keys() - d2.keys()
print(difference_keys)
# {'a'}

difference_items = d1.items() - d2.items()
print(difference_items)
# {('a', 1), ('c', 3)}

difference_dict = dict(d1.items() - d2.items())
print(difference_dict)
# {'a': 1, 'c': 3}

source: dict_keys_items_set.py

Pythonで複数の辞書のキーに対する集合演算（共通、和、差、対称差）

辞書オブジェクトのkeys()メソッドとitems()メソッド

複数の辞書に共通のキーを抽出（共通部分）

複数の辞書に含まれるキーをすべて抽出（和集合）

複数の辞書のいずれかにのみ含まれるキーを抽出（差集合、対称差集合）

関連カテゴリー

関連記事