回答:
os.listdir()
を使用するよりもわずかに効率的ですglob.glob
。ファイル名が通常のファイルであり(ディレクトリやその他のエンティティではない)かどうかをテストするには、次を使用しますos.path.isfile()
。
import os, os.path
# simple version for working with CWD
print len([name for name in os.listdir('.') if os.path.isfile(name)])
# path joining version for other paths
DIR = '/tmp'
print len([name for name in os.listdir(DIR) if os.path.isfile(os.path.join(DIR, name))])
os.path.join(DIR, name)
以上を使用する利点は何DIR + '/' + name
ですか?後者は前者よりも短く、IMOはより明確です。おそらく、後者が失敗するいくつかのOS:esはありますか?
import os
path, dirs, files = next(os.walk("/usr/lib"))
file_count = len(files)
すべての種類のファイルについて、含まれるサブディレクトリ:
import os
list = os.listdir(dir) # dir is your directory path
number_files = len(list)
print number_files
ファイルのみ(サブディレクトリを避ける):
import os
onlyfiles = next(os.walk(dir))[2] #dir is your directory path as string
print len(onlyfiles)
ここでfnmatchが非常に便利になります。
import fnmatch
print len(fnmatch.filter(os.listdir(dirpath), '*.txt'))
os.path.isfile()
受け入れられた回答のように各ファイルをテストするよりもはるかに高速です(10,000ファイルのディレクトリでの私のテストの約半分の時間)。また、よりもはるかに高速ですglob.glob()
。
ディレクトリ内のすべてのファイル(サブディレクトリ内のファイルを含む)をカウントする場合、最もPython的な方法は次のとおりです。
import os
file_count = sum(len(files) for _, _, files in os.walk(r'C:\Dropbox'))
print(file_count)
ファイル数を明示的に追加するよりも速い合計を使用します(タイミングは保留中)
_
に機能しfor
ます)。ループで使用できることはわかっています。os.walk
私も知っています。しかし、sum
関数内のアンダースコアで何が起こっているのかわからないので、詳しく説明してください。ありがとう!
誰も言及しなかったことに驚いていos.scandir
ます:
def count_files(dir):
return len([1 for x in list(os.scandir(dir)) if x.is_file()])
これはos.listdir
任意のディレクトリを使用して機能します。
import os
directory = 'mydirpath'
number_of_files = len([item for item in os.listdir(directory) if os.path.isfile(os.path.join(directory, item))])
これはジェネレーターで単純化でき、次のようにして少し速くできます:
import os
isfile = os.path.isfile
join = os.path.join
directory = 'mydirpath'
number_of_files = sum(1 for item in os.listdir(directory) if isfile(join(directory, item)))
def count_em(valid_path):
x = 0
for root, dirs, files in os.walk(valid_path):
for f in files:
x = x+1
print "There are", x, "files in this directory."
return x
この投稿からの引用
files
はリストです。2. OPは再帰的なカウントを探していません
ここに私が便利だと思った簡単な1行のコマンドがあります:
print int(os.popen("ls | wc -l").read())
ls
は、一般的には避けられますが(これは、しばしば問題を引き起こす可能性があります)、これはシェルでの悪い「迅速かつ汚い」メソッドではありません。ls -1
ただし、を使用する必要があるため、ファイルごとに1行が保証されます。
簡単です:
print(len([iq for iq in os.scandir('PATH')]))
それは単にディレクトリ内のファイルの数を数えるだけで、リスト内包手法を使用して特定のディレクトリを反復処理し、すべてのファイルを返します。"len(returned list)"はファイル数を返します。
import os
total_con=os.listdir('<directory path>')
files=[]
for f_n in total_con:
if os.path.isfile(f_n):
files.append(f_n)
print len(files)
オペレーティングシステムの標準シェルを使用する場合は、純粋なpythonicの方法を使用するよりもはるかに速く結果を得ることができます。
Windowsの例:
import os
import subprocess
def get_num_files(path):
cmd = 'DIR \"%s\" /A-D /B /S | FIND /C /V ""' % path
return int(subprocess.check_output(cmd, shell=True))
私は次のglob.iglob
ようなディレクトリ構造に使用しました
data
└───train
│ └───subfolder1
│ | │ file111.png
│ | │ file112.png
│ | │ ...
│ |
│ └───subfolder2
│ │ file121.png
│ │ file122.png
│ │ ...
└───test
│ file221.png
│ file222.png
次のオプションはどちらも4を返します(期待どおり、つまりサブフォルダー自体はカウントされません)。
len(list(glob.iglob("data/train/*/*.png", recursive=True)))
sum(1 for i in glob.iglob("data/train/*/*.png"))
私はこれを行い、これはフォルダー内のファイル数(Attack_Data)を返しました...これは正常に動作します。
import os
def fcount(path):
#Counts the number of files in a directory
count = 0
for f in os.listdir(path):
if os.path.isfile(os.path.join(path, f)):
count += 1
return count
path = r"C:\Users\EE EKORO\Desktop\Attack_Data" #Read files in folder
print (fcount(path))