Pythonでゼロ埋めなしの数字の文字列リストをソート

Modified: 2023-10-18 | Tags: Python, リスト, 文字列

Pythonでリストなどを昇順・降順にソートする（並べ替える）にはsort()メソッドやsorted()関数を使う。

ここでは、ゼロ埋めされていない数字の文字列のリストをソートする方法について説明する。

sort()とsorted()

sort()はリスト型のメソッドで、元のリスト自体がソートされる。

l = [10, 1, 5]

l.sort()
print(l)
# [1, 5, 10]

sorted()は組み込み関数で、ソートされた新たなリストが生成される。元のリストは変更されない。

l = [10, 1, 5]

print(sorted(l))
# [1, 5, 10]

print(l)
# [10, 1, 5]

デフォルトは昇順。降順にしたい場合は引数reverseをTrueとする。例はsorted()だが、sort()でも同様。

print(sorted(l, reverse=True))
# [10, 5, 1]

タプルや文字列に対するソートなど、より詳しくは以下の記事を参照。

ゼロ埋めされている数字の文字列のリストの場合、特に問題なくソートされる。なお、以降のサンプルコードではsorted()を使うが、sort()でも同様。

l = ['10', '01', '05']

print(sorted(l))
# ['01', '05', '10']

ゼロ埋めされていない数字の文字列のリストの場合、数値としての大小ではなく文字列を辞書の並びにソートするので、以下のような結果になってしまう。例えば'10'は'5'より小さいとみなされる。

l = ['10', '1', '5']

print(sorted(l))
# ['1', '10', '5']

sort()とsorted()では引数keyに関数を指定することで、その関数を適用した結果に対してソートが行われる。

引数keyに文字列を数値に変換するint()やfloat()を指定することで、数値の大小で並べ替えられる。

関数を引数に指定するときは()を書くとエラーになるので注意。

l = ['10', '1', '5']

print(sorted(l, key=int))
# ['1', '5', '10']

print(sorted(l, key=float))
# ['1', '5', '10']

整数の文字列はint()でもfloat()でも変換可能だが、小数に対してはfloat()を使う必要がある。

l = ['10.0', '1.0', '5.0']

print(sorted(l, key=float))
# ['1.0', '5.0', '10.0']

sort()でも同様に引数keyを指定できる。

l = ['10', '1', '5']

l.sort(key=int)
print(l)
# ['1', '5', '10']

これまでの結果からも分かるように、keyに指定した関数はあくまでもソートの比較のためだけに適用され、結果は元のまま。上の例では文字列のままで、整数int型や浮動小数点数float型になったりはしない。

int型やfloat型の結果がほしい場合は、リスト内包表記で変換したリストをソートすればよい。

l = ['10', '1', '5']

print([int(s) for s in l])
# [10, 1, 5]

print(sorted([int(s) for s in l]))
# [1, 5, 10]

数字だけの文字列は引数keyにint()やfloat()を指定するだけでよいが、以下のように文字列中に数値が埋め込まれている場合は注意が必要。

l = ['file10.txt', 'file1.txt', 'file5.txt']