結果を小文字化せずに、大文字と小文字を区別しないリストの並べ替え?


133

私はこのような文字列のリストを持っています:

['Aden', 'abel']

大文字と小文字を区別せずにアイテムを並べ替えます。だから私は取得したい:

['abel', 'Aden']

しかし、大文字と小文字の前に現れるので、sorted()or list.sort()で逆になります。

どうすればケースを無視できますか?すべてのリストアイテムを小文字化するソリューションを見てきましたが、リストアイテムの大文字と小文字を変更したくありません。


このチュートリアルは非常に役立ちます:docs.python.org/3/howto/sorting.html#sortinghowto
ady

回答:


192

Python 3.3以降では、str.casefoldケースレスマッチング用に特別に設計されたメソッドがあります。

sorted_list = sorted(unsorted_list, key=str.casefold)

Python 2ではlower()次を使用します。

sorted_list = sorted(unsorted_list, key=lambda s: s.lower())

どちらにもlowerメソッドがあるため、通常の文字列とUnicode文字列の両方で機能します。

Python 2では、2つの型の値を相互に比較できるため、通常の文字列とUnicode文字列の混合で機能します。ただし、Python 3はそのようには機能しません。バイト文字列とUnicode文字列を比較することはできないため、Python 3では正気なことを行い、1つのタイプの文字列のリストのみをソートする必要があります。

>>> lst = ['Aden', u'abe1']
>>> sorted(lst)
['Aden', u'abe1']
>>> sorted(lst, key=lambda s: s.lower())
[u'abe1', 'Aden']

11
(Python 3)str.lowerとして一般的な関数を使用するsorted(lst, key=str.lower)か、または(Python 2)としてモジュールのlowerメソッドをstring使用することにより、ラムダ関数のラウンドトリップを回避できますsorted(lst, key=string.lower)str.lowerPython 2で文字列を使用することもできますが、オブジェクトを使用する必要unicode.lowerがありunicodeますが、string.lower両方を受け入れます(ただし、これは、実際には「正常な」操作モードではありません)。
Daniel Andersson

これは、['a'、 'A'、 'B'、 'b'、にソートされる['Z'、 'B'、 'a'、 'b'、 'A']のようなリストでは機能しません。 'Z']。大文字の「B」は小文字の「b」の前に表示されます。これは、Pythonのsort()とSorted()が文字列が一致したときに元の順序を維持するためです。この場合、大文字の「B」は、casefoldを使用するときに小文字の「b」と一致すると見なされます。これは、比較するために大文字と小文字を変換する場合に常に発生します。sorted(spam、key = str.lower)、sorted(spam、key = str.upper)、sorted(spam、key = str.casefold)。
PJシン

代わりにこのソリューションを試してください:stackoverflow.com/a/1098160/10668287。['Aden'、 'aden']は['aden'、 'Aden']として正しくソートされます。
PJシン

46
>>> x = ['Aden', 'abel']
>>> sorted(x, key=str.lower) # Or unicode.lower if all items are unicode
['abel', 'Aden']

Python 3 strではユニコードですが、Python 2では、このより一般的なアプローチを使用して、strとの両方で機能しunicodeます。

>>> sorted(x, key=lambda s: s.lower())
['abel', 'Aden']

ありがとうございました。私はこれについて前に述べたはずですが、Unicode文字列(Py2)でこのメソッドを使用することに問題があると聞きました。それについて何か知っていますか?

それらはすべてユニコードです。ありがとう!もう1つの質問、このようなリストでそれを行う方法:[['Aden'], ['abel']]

各リストには1つのアイテムしかありませんか?:その場合は少しだけに、それを修正sorted(x,key=lambda i:i[0].lower())
jamylak

まあ、それは他のいくつかのものも持っているかもしれませんが、ソートには使用すべきではありません。

1
気にしないでください、それは私が間違っていたようです、ソートは文字列とユニコードの両方の組み合わせで機能します、タプルもソートに含まれている前の質問と混同されました。
jamylak 2012



3

python3ではあなたが使うことができます

list1.sort(key=lambda x: x.lower()) #Case In-sensitive             
list1.sort() #Case Sensitive

1

私はPython 3.3のためにこのようにしました:

 def sortCaseIns(lst):
    lst2 = [[x for x in range(0, 2)] for y in range(0, len(lst))]
    for i in range(0, len(lst)):
        lst2[i][0] = lst[i].lower()
        lst2[i][1] = lst[i]
    lst2.sort()
    for i in range(0, len(lst)):
        lst[i] = lst2[i][1]

次に、この関数を呼び出すだけです。

sortCaseIns(yourListToSort)

0

大文字と小文字を区別しないソートは、文字列の並べ替えの場所での Pythonの2 OR 3で、(Pythonの2.7.17とPython 3.6.9でテスト):

>>> x = ["aa", "A", "bb", "B", "cc", "C"]
>>> x.sort()
>>> x
['A', 'B', 'C', 'aa', 'bb', 'cc']
>>> x.sort(key=str.lower)           # <===== there it is!
>>> x
['A', 'aa', 'B', 'bb', 'C', 'cc']

キーはkey=str.lowerです。コマンドだけでこれらのコマンドがどのように見えるかを示します。簡単にコピーして貼り付けることができるので、テストできます。

x = ["aa", "A", "bb", "B", "cc", "C"]
x.sort()
x
x.sort(key=str.lower)
x

ただし、文字列が(のようにu'some string')Unicode文字列の場合、Python 2のみ(この場合はPython 3でx.sort(key=str.lower)はない)で、上記のコマンドは失敗し、次のエラーが出力されます。

TypeError: descriptor 'lower' requires a 'str' object but received a 'unicode'

このエラーが発生した場合は、Unicodeソートを処理するPython 3にアップグレードするか、次のようにリスト内包表記を使用して、最初にUnicode文字列をASCII文字列に変換します。

# for Python2, ensure all elements are ASCII (NOT unicode) strings first
x = [str(element) for element in x]  
# for Python2, this sort will only work on ASCII (NOT unicode) strings
x.sort(key=str.lower)

参照:

  1. https://docs.python.org/3/library/stdtypes.html#list.sort
  2. Unicode文字列をPythonの文字列に変換する(追加の記号を含む)
  3. https://www.programiz.com/python-programming/list-comprehension

-3

これを試して

def cSort(inlist, minisort=True):
    sortlist = []
    newlist = []
    sortdict = {}
    for entry in inlist:
        try:
            lentry = entry.lower()
        except AttributeError:
            sortlist.append(lentry)
        else:
            try:
                sortdict[lentry].append(entry)
            except KeyError:
                sortdict[lentry] = [entry]
                sortlist.append(lentry)

    sortlist.sort()
    for entry in sortlist:
        try:
            thislist = sortdict[entry]
            if minisort: thislist.sort()
            newlist = newlist + thislist
        except KeyError:
            newlist.append(entry)
    return newlist

lst = ['Aden', 'abel']
print cSort(lst)

出力

['abel', 'Aden']


9
この解決策は、ワンライナーで十分な場合、やり過ぎであり、読み取ることができません。これは、Python以外の言語ではより受け入れやすいかもしれません。
IceArdor 2014
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.