私はこのような文字列のリストを持っています:
['Aden', 'abel']
大文字と小文字を区別せずにアイテムを並べ替えます。だから私は取得したい:
['abel', 'Aden']
しかし、大文字と小文字の前に現れるので、sorted()
or list.sort()
で逆になります。
どうすればケースを無視できますか?すべてのリストアイテムを小文字化するソリューションを見てきましたが、リストアイテムの大文字と小文字を変更したくありません。
私はこのような文字列のリストを持っています:
['Aden', 'abel']
大文字と小文字を区別せずにアイテムを並べ替えます。だから私は取得したい:
['abel', 'Aden']
しかし、大文字と小文字の前に現れるので、sorted()
or list.sort()
で逆になります。
どうすればケースを無視できますか?すべてのリストアイテムを小文字化するソリューションを見てきましたが、リストアイテムの大文字と小文字を変更したくありません。
回答:
Python 3.3以降では、str.casefold
ケースレスマッチング用に特別に設計されたメソッドがあります。
sorted_list = sorted(unsorted_list, key=str.casefold)
Python 2ではlower()
次を使用します。
sorted_list = sorted(unsorted_list, key=lambda s: s.lower())
どちらにもlower
メソッドがあるため、通常の文字列とUnicode文字列の両方で機能します。
Python 2では、2つの型の値を相互に比較できるため、通常の文字列とUnicode文字列の混合で機能します。ただし、Python 3はそのようには機能しません。バイト文字列とUnicode文字列を比較することはできないため、Python 3では正気なことを行い、1つのタイプの文字列のリストのみをソートする必要があります。
>>> lst = ['Aden', u'abe1']
>>> sorted(lst)
['Aden', u'abe1']
>>> sorted(lst, key=lambda s: s.lower())
[u'abe1', 'Aden']
str.lower
として一般的な関数を使用するsorted(lst, key=str.lower)
か、または(Python 2)としてモジュールのlower
メソッドをstring
使用することにより、ラムダ関数のラウンドトリップを回避できますsorted(lst, key=string.lower)
。str.lower
Python 2で文字列を使用することもできますが、オブジェクトを使用する必要unicode.lower
がありunicode
ますが、string.lower
両方を受け入れます(ただし、これは、実際には「正常な」操作モードではありません)。
>>> x = ['Aden', 'abel']
>>> sorted(x, key=str.lower) # Or unicode.lower if all items are unicode
['abel', 'Aden']
Python 3 str
ではユニコードですが、Python 2では、このより一般的なアプローチを使用して、str
との両方で機能しunicode
ます。
>>> sorted(x, key=lambda s: s.lower())
['abel', 'Aden']
sorted(x,key=lambda i:i[0].lower())
これを試して、リストをインプレースでソートすることもできます。
>>> x = ['Aden', 'abel']
>>> x.sort(key=lambda y: y.lower())
>>> x
['abel', 'Aden']
これはPython 3で機能し、結果の小文字化(!)は含まれません。
values.sort(key=str.lower)
私はPython 3.3のためにこのようにしました:
def sortCaseIns(lst):
lst2 = [[x for x in range(0, 2)] for y in range(0, len(lst))]
for i in range(0, len(lst)):
lst2[i][0] = lst[i].lower()
lst2[i][1] = lst[i]
lst2.sort()
for i in range(0, len(lst)):
lst[i] = lst2[i][1]
次に、この関数を呼び出すだけです。
sortCaseIns(yourListToSort)
大文字と小文字を区別しないソートは、文字列の並べ替えの場所での Pythonの2 OR 3で、(Pythonの2.7.17とPython 3.6.9でテスト):
>>> x = ["aa", "A", "bb", "B", "cc", "C"]
>>> x.sort()
>>> x
['A', 'B', 'C', 'aa', 'bb', 'cc']
>>> x.sort(key=str.lower) # <===== there it is!
>>> x
['A', 'aa', 'B', 'bb', 'C', 'cc']
キーはkey=str.lower
です。コマンドだけでこれらのコマンドがどのように見えるかを示します。簡単にコピーして貼り付けることができるので、テストできます。
x = ["aa", "A", "bb", "B", "cc", "C"]
x.sort()
x
x.sort(key=str.lower)
x
ただし、文字列が(のようにu'some string'
)Unicode文字列の場合、Python 2のみ(この場合はPython 3でx.sort(key=str.lower)
はない)で、上記のコマンドは失敗し、次のエラーが出力されます。
TypeError: descriptor 'lower' requires a 'str' object but received a 'unicode'
このエラーが発生した場合は、Unicodeソートを処理するPython 3にアップグレードするか、次のようにリスト内包表記を使用して、最初にUnicode文字列をASCII文字列に変換します。
# for Python2, ensure all elements are ASCII (NOT unicode) strings first
x = [str(element) for element in x]
# for Python2, this sort will only work on ASCII (NOT unicode) strings
x.sort(key=str.lower)
これを試して
def cSort(inlist, minisort=True):
sortlist = []
newlist = []
sortdict = {}
for entry in inlist:
try:
lentry = entry.lower()
except AttributeError:
sortlist.append(lentry)
else:
try:
sortdict[lentry].append(entry)
except KeyError:
sortdict[lentry] = [entry]
sortlist.append(lentry)
sortlist.sort()
for entry in sortlist:
try:
thislist = sortdict[entry]
if minisort: thislist.sort()
newlist = newlist + thislist
except KeyError:
newlist.append(entry)
return newlist
lst = ['Aden', 'abel']
print cSort(lst)
出力
['abel', 'Aden']