私はこれに遭遇しました:
item = someSortOfSelection()
if item in myList:
doMySpecialFunction(item)
しかし、リストで認識されなかったかのように(文字列のリストの場合)、すべてのアイテムで機能しない場合があります。
これはリスト内のアイテムを見つける最も「パイソン的な」方法if x in l:
ですか?
私はこれに遭遇しました:
item = someSortOfSelection()
if item in myList:
doMySpecialFunction(item)
しかし、リストで認識されなかったかのように(文字列のリストの場合)、すべてのアイテムで機能しない場合があります。
これはリスト内のアイテムを見つける最も「パイソン的な」方法if x in l:
ですか?
回答:
最初の質問については、そのコードは完全に問題なくitem
、内部の要素の1つと等しい場合に機能するはずmyList
です。たぶん、アイテムの1つと正確に一致しない文字列を見つけようとするか、不正確さに悩まされている浮動小数点値を使用している可能性があります。
2番目の質問については、実際にリストで「検索」する方法はいくつかあります。
これはあなたが説明するユースケースです:何かがリストの中にあるかどうかのチェック。ご存知のように、そのためにin
演算子を使用できます。
3 in [1, 2, 3] # => True
つまり、特定の条件を満たすシーケンス内のすべての要素を見つけることです。そのために、リスト内包表記またはジェネレータ式を使用できます。
matches = [x for x in lst if fulfills_some_condition(x)]
matches = (x for x in lst if x > 6)
後者は、あなたがそれを繰り返したときにのみ構築される一種の怠惰なリストとして想像できるジェネレータを返します。ちなみに、最初のものはまったく同じです
matches = filter(fulfills_some_condition, lst)
Python 2の場合。ここでは、高次関数が機能しているのがわかります。Python 3ではfilter
、リストは返されませんが、ジェネレーターのようなオブジェクトが返されます。
条件に一致する最初のものだけが必要な場合(ただし、それがまだ何であるかはわかりません)、forループを使用することで問題はありません(おそらくelse
あまり知られていない節も使用します)。あなたも使うことができます
next(x for x in lst if ...)
最初の一致を返すか、StopIteration
見つからない場合はaを発生させます。別の方法として、
next((x for x in lst if ...), [default value])
リストのindex
場合、特定の要素がリストのどこにあるかを知りたい場合に役立つメソッドもあります。
[1,2,3].index(2) # => 1
[1,2,3].index(4) # => ValueError
ただし、重複がある場合は、.index
常に最低のインデックスを返すことに注意してください:......
[1,2,3,2].index(2) # => 1
重複があり、すべてのインデックスが必要な場合は、enumerate()
代わりに使用できます。
[i for i,x in enumerate([1,2,3,2]) if x==2] # => [1, 3]
if x in list
はないと不満を言うのではありません。彼らは、特定の条件に一致するリスト内の何かの最初の発生を見つける明確な方法がないという事実に不満を述べています。しかし、私の回答で述べたように、next()
そのために(ab)使用できます。
[list comprehension...][0]
アプローチよりもパイソンのような感じ
index()
呼び出されたクワーグがあったら、それは素晴らしいでしょう。例:。key
key
max()
index(list, key=is_prime)
1つの要素を検索None
する場合、またはでデフォルトを使用next
するStopIteration
場合、項目がリストに見つからなかった場合は発生しません。
first_or_default = next((x for x in lst if ...), None)
next
最初のパラメーターとしてイテレーターを取り、リスト/タプルはイテレーターではありません。したがって、first_or_default = next(iter([x for x in lst if ...]), None)
(x for x in lst if ...)
リストの上に発電機であるlst
(あるイテレータ)。その場合はnext(iter([x for x in lst if ...]), None)
、リストを作成する必要がありますが[x for x in lst if ...]
、これははるかにコストのかかる操作になります。
if
ラムダにカプセル化するだけで、find(fn,list)
ジェネレータコードを難読化する代わりに、通常は記述できます。
Niklas B.からの回答はかなり包括的ですが、リストからアイテムを見つけたい場合は、インデックスを取得すると便利なことがあります。
next((i for i, x in enumerate(lst) if [condition on x]), [default value])
最初の出現を見つける
そのためのレシピがありますitertools
:
def first_true(iterable, default=False, pred=None):
"""Returns the first true value in the iterable.
If no true value is found, returns *default*
If *pred* is not None, returns the first item
for which pred(item) is true.
"""
# first_true([a,b,c], x) --> a or b or c or x
# first_true([a,b], x, f) --> a if f(a) else b if f(b) else x
return next(filter(pred, iterable), default)
たとえば、次のコードはリストの最初の奇数を見つけます。
>>> first_true([2,3,4,5], None, lambda x: x%2==1)
3
別の代替方法:を使用してアイテムがリストにあるかどうかを確認できますがif item in list:
、これは注文O(n)です。アイテムの大きなリストを扱っていて、何かがリストのメンバーであるかどうかを知る必要がある場合は、最初にリストをセットに変換し、一定時間のセット検索を利用できます。
my_set = set(my_list)
if item in my_set: # much faster on average than using a list
# do something
すべてのケースで正しいソリューションになるわけではありませんが、場合によっては、これによりパフォーマンスが向上することがあります。
でセットを作成することset(my_list)
もO(n)であることに注意してください。これを1度だけ行う必要がある場合は、この方法で行う方が速くはありません。ただし、メンバーシップを繰り返し確認する必要がある場合は、最初のセットの作成後、すべてのルックアップでO(1)になります。
文字列のリストを操作するときに、2つの可能な検索の1つを使用することができます。
リスト要素がアイテムと等しい場合( 'example'は['one'、 'example'、 'two']にあります):
if item in your_list: some_function_on_true()
'ex' in ['one'、 'ex'、 'two'] => True
['one'、 'ex'、 'two']の 'ex_1' => False
リスト要素がアイテムのような場合( 'ex'は['one、' example '、' two ']または' example_1 'は[' one '、' example '、' two ']にあります):
matches = [el for el in your_list if item in el]
または
matches = [el for el in your_list if el in item]
次にlen(matches)
、必要に応じてチェックするか読んでください。
list.index(x)
リストでxが見つかった場合にxのインデックスを返す#ValueError
か、xが見つからなかった場合にメッセージを返すwhich を使用する代わりに、リストlist.count(x)
でxの出現回数を返す(xが実際にリストにあることの検証)またはそれを使用できます。それ以外の場合は0を返します(xがない場合)。涼しい事はcount()
、それはあなたのコードを壊すか、xが見つからなかったときのために例外をスローする必要はないということです
値が収集物に一度存在するかどうかを確認する場合は、「in」演算子を使用するのが適切です。ただし、複数回チェックする場合は、bisectモジュールの使用をお勧めします。bisectモジュールを使用すると、データをソートする必要があることに注意してください。したがって、データを1回ソートすると、bisectを使用できます。私のマシンでbisectモジュールを使用すると、「in」演算子を使用するよりも約12倍高速です。
Python 3.8以上の構文を使用したコードの例を次に示します。
import bisect
from timeit import timeit
def bisect_search(container, value):
return (
(index := bisect.bisect_left(container, value)) < len(container)
and container[index] == value
)
data = list(range(1000))
# value to search
true_value = 666
false_value = 66666
# times to test
ttt = 1000
print(f"{bisect_search(data, true_value)=} {bisect_search(data, false_value)=}")
t1 = timeit(lambda: true_value in data, number=ttt)
t2 = timeit(lambda: bisect_search(data, true_value), number=ttt)
print("Performance:", f"{t1=:.4f}, {t2=:.4f}, diffs {t1/t2=:.2f}")
出力:
bisect_search(data, true_value)=True bisect_search(data, false_value)=False
Performance: t1=0.0220, t2=0.0019, diffs t1/t2=11.71
文字列のリストの項目に追加の/不要なホワイトスペースがないことを確認します。それが、アイテムが見つからないことの説明を妨げている可能性がある理由です。
myList
。