Pythonのsorted()やmax()などで引数keyを指定

Modified: 2023-07-09 | Tags: Python

Pythonの組み込み関数sorted()やmax(), min()、リストのsort()メソッドなどでは、引数keyに呼び出し可能オブジェクトを指定できる。これにより、要素に何らかの処理を行った結果を元にソートしたり最大値・最小値を取得したりできる。

ソート HOW TO - Key 関数 — Python 3.11.4 ドキュメント

組み込み関数を引数keyに指定
ラムダ式（無名関数）や自作の関数を引数keyに指定
operator.itemgetter()を引数keyに指定
operator.attrgetter()を引数keyに指定
operator.methodcaller()を引数keyに指定
ラムダ式とoperator.itemgetter()との処理速度比較

operatorモジュールについては以下の記事も参照。

関連記事: Pythonのoperatorモジュールの使い方（itemgetterなど）

引数keyを使った具体例は以下の記事を参照。

組み込み関数を引数keyに指定

引数keyを使う簡単な例として、組み込み関数を指定する。

デフォルトでは、sorted()ではリストなどのイテラブルオブジェクトの要素がそのまま比較されてソートされる。

l = [1, -3, 2]

print(sorted(l))
# [-3, 1, 2]

source: key_usage.py

例えば、絶対値を返す組み込み関数abs()をkeyに指定すると、絶対値で比較されてソートされる。呼び出し可能オブジェクトを引数に指定する場合、括弧()はいらないので注意。

関連記事: Pythonで絶対値を取得するabs(), math.fabs()

print(sorted(l, key=abs))
# [1, 2, -3]

source: key_usage.py

keyに指定する関数は比較の際に使われるのみで、結果の要素は元の値のまま。要素に関数を適用して変換したい場合はリスト内包表記を使う。

関連記事: Pythonリスト内包表記の使い方

l_abs = [abs(i) for i in l]
print(l_abs)
# [1, 3, 2]

print(sorted(l_abs))
# [1, 2, 3]

source: key_usage.py

リストのsort()メソッドでも同様に引数keyを指定できる。

l.sort(key=abs)
print(l)
# [1, 2, -3]

source: key_usage.py

sort()は元のリストを更新する破壊的処理なので注意。昇順・降順を指定する引数reverseなど、sorted()とsort()の詳細については以下の記事を参照。

関連記事: Pythonでリストをソートするsortとsortedの違い

最大値・最小値を返す組み込み関数max(), min()でも同様に引数keyを指定できる。

l = [1, -3, 2]

print(max(l))
# 2

print(max(l, key=abs))
# -3

print(min(l))
# -3

print(min(l, key=abs))
# 1

source: key_usage.py

なお、keyはキーワード専用引数なので、必ずkey=xxxという形で指定する必要がある。

関連記事: Pythonで関数を定義・呼び出し（def, return）

以降、sorted()を例とするが、sort()やmax(), min()でも考え方は同じ。

別の例として、文字列のリストの場合を示す。デフォルトでは文字コード順（アルファベット順）にソートされるが、文字数を返す組み込み関数len()をkeyに指定することで、文字数の順番にソートできる。

l_str = ['bbb', 'c', 'aa']

print(sorted(l_str))
# ['aa', 'bbb', 'c']

print(sorted(l_str, key=len))
# ['c', 'aa', 'bbb']

source: key_usage.py

ラムダ式（無名関数）や自作の関数を引数keyに指定

組み込み関数だけでなくラムダ式（無名関数）やdefで定義した自作の関数を引数keyに指定することも可能。組み込み関数ではできない複雑な処理を適用できる。

リストを要素とするリスト（リストのリスト、二次元リスト）を例とする。

リスト同士を比較する場合、最初の等しくない要素が比較される（＝先頭の要素から順に比較される）。

関連記事: Pythonでリストを比較
関連記事: Pythonで2次元配列（リストのリスト）をソート

l_2d = [[2, 10], [1, -30], [-3, 20]]

print(sorted(l_2d))
# [[-3, 20], [1, -30], [2, 10]]

source: key_usage.py

ここで、最大値を返す組み込み関数max()を引数keyに指定すると、各リストの最大値を基準に並べ替えられる。

print(sorted(l_2d, key=max))
# [[1, -30], [2, 10], [-3, 20]]

source: key_usage.py

さらに、各リストの絶対値の最大値を基準にソートしたい場合、ラムダ式を使う。

関連記事: Pythonのlambda（ラムダ式、無名関数）の使い方

print(sorted(l_2d, key=lambda x: max([abs(i) for i in x])))
# [[2, 10], [-3, 20], [1, -30]]

source: key_usage.py

なお、リストの要素数が少ない場合は特に気にする必要はないが、ここでmax()の引数としてリスト内包表記のジェネレータ版であるジェネレータ式を使うとメモリ使用量を抑えられる場合がある。

関連記事: Pythonリスト内包表記の使い方
PEP 289 – Generator Expressions | peps.python.org

print(sorted(l_2d, key=lambda x: max(abs(i) for i in x)))
# [[2, 10], [-3, 20], [1, -30]]

source: key_usage.py

ラムダ式ではなくdefで関数を定義して引数keyに指定してもよい。

def max_abs(x):
    return max(abs(i) for i in x)

print(sorted(l_2d, key=max_abs))
# [[2, 10], [-3, 20], [1, -30]]

source: key_usage.py

operator.itemgetter()を引数keyに指定

標準ライブラリoperatorのitemgetter()はリストの要素や辞書の値を取得する呼び出し可能オブジェクトを返す。

関連記事: Pythonのoperatorモジュールの使い方（itemgetterなど）

リストに対するoperator.itemgetter()

以下のように、リストのリストを任意の位置（インデックス）の値に従ってソートできる。

import operator

l_2d = [[2, 10], [1, -30], [-3, 20]]

print(sorted(l_2d, key=operator.itemgetter(1)))
# [[1, -30], [2, 10], [-3, 20]]

Pythonのsorted()やmax()などで引数keyを指定

組み込み関数を引数keyに指定

ラムダ式（無名関数）や自作の関数を引数keyに指定

operator.itemgetter()を引数keyに指定

リストに対するoperator.itemgetter()

辞書に対するoperator.itemgetter()

operator.itemgetter()に複数の引数を指定

operator.attrgetter()を引数keyに指定

operator.methodcaller()を引数keyに指定

ラムダ式とoperator.itemgetter()との処理速度比較

関連カテゴリー

関連記事