文字列がリストの文字列のいずれかで終了しているかどうかを確認します


220

次のコードを書くPythonの方法は何ですか?

extensions = ['.mp3','.avi']
file_name = 'test.mp3'

for extension in extensions:
    if file_name.endswith(extension):
        #do stuff

forループの明示的な宣言を回避してif条件に書き込むことができるという漠然とした記憶があります。これは本当ですか?


2
この質問はよく答えられていますが、おそらく著者はもともとを考えていましたif any((file_name.endswith(ext) for ext in extensions))
サフト

回答:


450

広く知られているわけではありませんが、str.endswithはタプルも受け入れます。ループする必要はありません。

>>> 'test.mp3'.endswith(('.mp3', '.avi'))
True

10
それがリストを受け入れないがタプルを使う理由を知っていますか?好奇心旺盛
ilyail3

2
@falsetru回答のリンクは明示的にその質問に回答するものではありません。タプル受け入れることができると述べているだけで、リストを受け入れることができない理由は述べていません。どちらもシーケンスであるため、タプルは不変であるのに対して、リストが変更可能であるという潜在的な違いしかありません。私は間違っているかもしれませんが、それが明示的に述べられている他の理由はわかりません。
KymikoLoco 2017年

4
文字列が文字で終わるかどうかを確認する場合:import string; str.endswith(tuple(string.ascii_lowercase))
Alex Willison

3
単なるメモ、endswithpython 2.5以降のタプルのみを受け入れます
Akash Singh 2018

1
知らなかった!それは最高です!
fool4jesus


6

ファイルから拡張子を取得し、それが拡張子のセットに含まれているかどうかを確認します。

>>> import os
>>> extensions = set(['.mp3','.avi'])
>>> file_name = 'test.mp3'
>>> extension = os.path.splitext(file_name)[1]
>>> extension in extensions
True

セットでのルックアップの時間の複雑さがO(1)(docs)であるため、セットを使用します。


8
効率性について言及しているように、かなり短いタプルの場合、.endswith()インターンされたタプルを使用すると、セットルックアップよりも高速になります
Jon Clements

@JonClements回答と質問についてすばらしいメモを作成するには、特別なSOゴールドコメントバッジが必要だと思います:)
alecxe

いや、私は「Stalking alecxe」バッジに行くつもりです;)
Jon Clements

2
また、2.7以降では、セットの数学構文を使用できます{'.mp3','.avi'}。これにより、余分な型変換が回避され、バックグラウンドによっては読みやすくなる場合があります(ただし、辞書との混同が生じる可能性があり、空を作成するために使用することはできませんセット)。
パーキンス

@JonClementsいつか私はあなたと同じくらい賢くなるでしょう:)
alecxe 2013

3

正規表現と文字列(str)メソッドの2つの方法があります。

通常、文字列メソッドの方が高速です(〜2x)。

import re, timeit
p = re.compile('.*(.mp3|.avi)$', re.IGNORECASE)
file_name = 'test.mp3'
print(bool(t.match(file_name))
%timeit bool(t.match(file_name)

ループあたり792 ns±1.83 ns(7回の実行の平均±標準偏差、それぞれ1000000ループ)

file_name = 'test.mp3'
extensions = ('.mp3','.avi')
print(file_name.lower().endswith(extensions))
%timeit file_name.lower().endswith(extensions)

ループあたり274 ns±4.22 ns(7つの実行の平均±標準偏差、それぞれ1000000ループ)



1

私はこれに出くわしましたが、何か他のものを探していました。

osパッケージ内のメソッドを使用することをお勧めします。これは、奇妙なケースを補って、より一般的にすることができるためです。

次のようなことができます:

import os

the_file = 'aaaa/bbbb/ccc.ddd'

extensions_list = ['ddd', 'eee', 'fff']

if os.path.splitext(the_file)[-1] in extensions_list:
    # Do your thing.

0

別の可能性は、INステートメントを使用することです。

extensions = ['.mp3','.avi']
file_name  = 'test.mp3'
if "." in file_name and file_name[file_name.rindex("."):] in extensions:
    print(True)

@ Rainald62、その場合でindexなければなりませんrindex
NeverHopeless

0

一致する文字列のリストを返す別の方法は

sample = "alexis has the control"
matched_strings = filter(sample.endswith, ["trol", "ol", "troll"])
print matched_strings
['trol', 'ol']
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.