Pythonリスト内包表記の使い方

Modified: 2023-05-03 | Tags: Python, リスト

Pythonでは、リスト内包表記（List comprehensions）を使うと新しいリストを生成する処理をシンプルに書ける。

リスト内包表記の基本型
ifで条件分岐したリスト内包表記
リスト内包表記と三項演算子の組み合わせ（if else的な処理）
リスト内包表記とzip(), enumerate()の組み合わせ
ネストしたリスト内包表記（多重ループ）
集合内包表記（Set comprehensions）
辞書内包表記（Dict comprehensions）
ジェネレータ式（Generator expressions）

for文の基本については以下の記事を参照。

関連記事: Pythonのfor文によるループ処理（range, enumerate, zipなど）

リスト内包表記を活用した具体例は以下の記事を参照。

関連記事: Pythonのリスト（配列）の特定の要素を抽出、置換、変換
関連記事: Pythonで文字列のリスト（配列）と数値のリストを相互に変換
関連記事: Pythonで文字列のリスト（配列）の条件を満たす要素を抽出、置換

リスト内包表記の基本型

リスト内包表記は以下のように書く。

[式 for 任意の変数名 in イテラブルオブジェクト]

リストやタプル、rangeなどのイテラブルオブジェクトの各要素を任意の変数名で取り出し式で評価、その結果を要素とする新たなリストが返される。

等価なfor文とともに例を示す。rangeの要素（連番）を取り出して2乗する。

関連記事: Pythonのrange関数の使い方

squares = [i**2 for i in range(5)]
print(squares)
# [0, 1, 4, 9, 16]

source: list_comprehension.py

squares = []
for i in range(5):
    squares.append(i**2)

print(squares)
# [0, 1, 4, 9, 16]

source: list_comprehension.py

map()でも同様の処理ができるが、リスト内包表記のほうがコードが簡潔・明解で好ましいとされている。

関連記事: Pythonのmap()でリストの要素に関数・処理を適用

ifで条件分岐したリスト内包表記

ifで条件分岐することも可能。以下のように後置でifを記述する。

[式 for 任意の変数名 in イテラブルオブジェクト if 条件式]

条件式がTrueとなるイテラブルオブジェクトの要素のみ式で評価され、その結果が要素となる新たなリストが返される。Falseとなる要素は要素は無視される。

条件式の中でも任意の変数名が使える。

等価なfor文とともに例を示す。rangeの要素（連番）から奇数のみを取り出す。

odds = [i for i in range(10) if i % 2 == 1]
print(odds)
# [1, 3, 5, 7, 9]

source: list_comprehension.py

odds = []
for i in range(10):
    if i % 2 == 1:
        odds.append(i)

print(odds)
# [1, 3, 5, 7, 9]

source: list_comprehension.py

filter()でも同様の処理ができるが、こちらもリスト内包表記のほうがコードが簡潔・明解で好ましいとされている。

関連記事: Pythonのfilter()でリストから条件を満たす要素を抽出・削除

リスト内包表記と三項演算子の組み合わせ（`if else`的な処理）

上の例では、条件を満たす要素のみが処理され、条件を満たさない要素は新たなリストから除外される。

条件によって処理を切り替えたい、if elseのように条件を満たさない要素には別の処理を行いたい場合は三項演算子を使う。

Pythonでは三項演算子は以下のように書ける。

真のときの値 if 条件式 else 偽のときの値

関連記事: Pythonの三項演算子（条件演算子）でif文を一行で書く

これを以下のようにリスト内包表記の式の部分に使う。

[真のときの値 if 条件式 else 偽のときの値 for 任意の変数名 in イテラブルオブジェクト]

等価なfor文とともに例を示す。rangeの要素（連番）を取り出し、奇数は'odd'、偶数は'even'に置き換える。

odd_even = ['odd' if i % 2 == 1 else 'even' for i in range(10)]
print(odd_even)
# ['even', 'odd', 'even', 'odd', 'even', 'odd', 'even', 'odd', 'even', 'odd']

source: list_comprehension.py

odd_even = []
for i in range(10):
    if i % 2 == 1:
        odd_even.append('odd')
    else:
        odd_even.append('even')

print(odd_even)
# ['even', 'odd', 'even', 'odd', 'even', 'odd', 'even', 'odd', 'even', 'odd']

source: list_comprehension.py

真のときの値, 偽のときの値に任意の変数名を使った式を記述することもできる。

条件を満たす場合は何らかの処理を行い、満たさない場合は元のイテラブルオブジェクトの値そのままというようなことも可能。

odd10 = [i * 10 if i % 2 == 1 else i for i in range(10)]
print(odd10)
# [0, 10, 2, 30, 4, 50, 6, 70, 8, 90]

source: list_comprehension.py

リスト内包表記とzip(), enumerate()の組み合わせ

for文でよく使われる便利な関数に、複数のイテラブルをまとめるzip()やインデックスとともに値を返すenumerate()がある。

関連記事: Python, zip関数の使い方: 複数のリストの要素をまとめて取得
関連記事: Python, enumerateの使い方: リストの要素とインデックスを取得

zip()やenumerate()をリスト内包表記で使うことももちろん可能。特殊な文法というわけではなく、for文との対応を考えれば難しくない。

zip()の例。

l_str1 = ['a', 'b', 'c']
l_str2 = ['x', 'y', 'z']

l_zip = [(s1, s2) for s1, s2 in zip(l_str1, l_str2)]
print(l_zip)
# [('a', 'x'), ('b', 'y'), ('c', 'z')]

source: list_comprehension.py

l_zip = []
for s1, s2 in zip(l_str1, l_str2):
    l_zip.append((s1, s2))

print(l_zip)
# [('a', 'x'), ('b', 'y'), ('c', 'z')]

source: list_comprehension.py

enumerate()の例。

l_enu = [(i, s) for i, s in enumerate(l_str1)]
print(l_enu)
# [(0, 'a'), (1, 'b'), (2, 'c')]

source: list_comprehension.py

l_enu = []
for i, s in enumerate(l_str1):
    l_enu.append((i, s))

print(l_enu)
# [(0, 'a'), (1, 'b'), (2, 'c')]

source: list_comprehension.py

ifを使う場合もこれまで通りの考え方。

l_zip_if = [(s1, s2) for s1, s2 in zip(l_str1, l_str2) if s1 != 'b']
print(l_zip_if)
# [('a', 'x'), ('c', 'z')]

source: list_comprehension.py

それぞれの要素を使って新たな要素を算出することもできる。

l_int1 = [1, 2, 3]
l_int2 = [10, 20, 30]

l_sub = [i2 - i1 for i1, i2 in zip(l_int1, l_int2)]
print(l_sub)
# [9, 18, 27]

source: list_comprehension.py

ネストしたリスト内包表記（多重ループ）

forループをネストするように、リスト内包表記もネストできる。

[式 for 変数名1 in イテラブルオブジェクト1
    for 変数名2 in イテラブルオブジェクト2
        for 変数名3 in イテラブルオブジェクト3 ... ]

便宜上、改行とインデントを加えているが、文法としては必須ではない。一行で続けて書いても構わない。

等価なfor文とともに例を示す。

matrix = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]

flat = [x for row in matrix for x in row]
print(flat)
# [1, 2, 3, 4, 5, 6, 7, 8, 9]

source: list_comprehension.py

flat = []
for row in matrix:
    for x in row:
        flat.append(x)

print(flat)
# [1, 2, 3, 4, 5, 6, 7, 8, 9]

source: list_comprehension.py

複数の変数を使うことも可能。

cells = [(row, col) for row in range(3) for col in range(2)]
print(cells)
# [(0, 0), (0, 1), (1, 0), (1, 1), (2, 0), (2, 1)]

source: list_comprehension.py

条件分岐もできる。

cells = [(row, col) for row in range(3)
         for col in range(2) if col == row]
print(cells)
# [(0, 0), (1, 1)]

source: list_comprehension.py

それぞれのイテラブルオブジェクトに対して条件分岐することもできる。

cells = [(row, col) for row in range(3) if row % 2 == 0
         for col in range(2) if col % 2 == 0]
print(cells)
# [(0, 0), (2, 0)]

source: list_comprehension.py

集合内包表記（Set comprehensions）

リスト内包表記の角括弧[]を波括弧{}に変更すると、集合（set型オブジェクト）が生成される。

{式 for 任意の変数名 in イテラブルオブジェクト}

s = {i**2 for i in range(5)}

print(s)
# {0, 1, 4, 9, 16}

source: set.py

集合についての詳細は以下の記事を参照。

関連記事: Python, set型で集合演算（和集合、積集合や部分集合の判定など）

辞書内包表記（Dict comprehensions）

辞書（dict型オブジェクト）も内包表記で生成できる。

{}で囲み、式の部分でキーと値の2つをキー: 値のように指定する。

{キー: 値 for 任意の変数名 in イテラブルオブジェクト}

キーと値には任意の式を指定可能。

l = ['Alice', 'Bob', 'Charlie']

d = {s: len(s) for s in l}
print(d)
# {'Alice': 5, 'Bob': 3, 'Charlie': 7}

source: dict_create.py

キーと値それぞれのリストから新たな辞書を作成する場合はzip()関数を使う。

関連記事: Python, zip関数の使い方: 複数のリストの要素をまとめて取得

keys = ['k1', 'k2', 'k3']
values = [1, 2, 3]

d = {k: v for k, v in zip(keys, values)}
print(d)
# {'k1': 1, 'k2': 2, 'k3': 3}

source: dict_create.py

辞書を生成するそのほかの方法については以下の記事を参照。

関連記事: Pythonで辞書を作成するdict()と波括弧、辞書内包表記

ジェネレータ式（Generator expressions）

リスト内包表記の角括弧[]を丸括弧()にした場合はタプルではなくジェネレータを返す。これをジェネレータ式（generator expressions）という。

6. 式 (expression) - ジェネレータ式 — Python 3.11.3 ドキュメント

リスト内包表記の例。

l = [i**2 for i in range(5)]

print(l)
# [0, 1, 4, 9, 16]

print(type(l))
# <class 'list'>

source: generator_expressions.py

ジェネレータ式の例。ジェネレータはそのままprint()しても中身は出力されないがfor文でまわすと中身が取得できる。

g = (i**2 for i in range(5))

print(g)
# <generator object <genexpr> at 0x10af944f8>

print(type(g))
# <class 'generator'>

for i in g:
    print(i)
# 0
# 1
# 4
# 9
# 16

source: generator_expressions.py

ジェネレータ式でもリスト内包表記と同様にifによる条件分岐やネストが可能。

g_cells = ((row, col) for row in range(0, 3)
           for col in range(0, 2) if col == row)

print(type(g_cells))
# <class 'generator'>

for i in g_cells:
    print(i)
# (0, 0)
# (1, 1)

source: generator_expressions.py

例えば要素数が多いリストをリスト内包表記で生成してfor文でまわすような場合、リスト内包表記を使うと最初に全要素を含むリストを生成するが、ジェネレータ式を使うとループが繰り返されるごとに要素が一つずつ生成されるので、メモリの使用量を抑えることができる。

ジェネレータ式を関数の唯一の引数とする場合は丸括弧()を省略できる。

print(sum([i**2 for i in range(5)]))
# 30

print(sum((i**2 for i in range(5))))
# 30

print(sum(i**2 for i in range(5)))
# 30

source: generator_expressions.py

処理速度に関しては、すべての要素を処理する場合はリスト内包表記のほうがジェネレーター式よりも速いことが多いようである。

python - List comprehension vs generator expression's weird timeit results? - Stack Overflow

ただし、例えばall()やany()で判定する場合はFalseまたはTrueが存在する時点で結果が確定するため、リスト内包表記よりもジェネレーター式を使うほうが処理速度が速くなる場合がある。

関連記事: Pythonの組み込み関数all(), any()の使い方

タプル内包表記はないが、ジェネレータ式をtuple()の引数とすると内包表記の書き方でタプルを生成できる。

t = tuple(i**2 for i in range(5))

print(t)
# (0, 1, 4, 9, 16)

print(type(t))
# <class 'tuple'>

source: generator_expressions.py

Pythonリスト内包表記の使い方

リスト内包表記の基本型

ifで条件分岐したリスト内包表記

リスト内包表記と三項演算子の組み合わせ（if else的な処理）

リスト内包表記とzip(), enumerate()の組み合わせ

ネストしたリスト内包表記（多重ループ）

集合内包表記（Set comprehensions）

辞書内包表記（Dict comprehensions）

ジェネレータ式（Generator expressions）

関連カテゴリー

関連記事

リスト内包表記と三項演算子の組み合わせ（`if else`的な処理）