Pythonのディレクトリツリーリスト


回答:


615

これは、ディレクトリツリー内のすべてのファイルとディレクトリをトラバースする方法です。

import os

for dirname, dirnames, filenames in os.walk('.'):
    # print path to all subdirectories first.
    for subdirname in dirnames:
        print(os.path.join(dirname, subdirname))

    # print path to all filenames.
    for filename in filenames:
        print(os.path.join(dirname, filename))

    # Advanced usage:
    # editing the 'dirnames' list will stop os.walk() from recursing into there.
    if '.git' in dirnames:
        # don't go into any .git directories.
        dirnames.remove('.git')

19
そして、このコードをPythonシェルから(そのまま)実行する場合、Ctrl + Cがシェルへの出力を停止することを思い出してください。;)
ゲイリー(

41
この意志再帰的にリストのファイルとディレクトリ
RDS

dirnamesリストを編集して、一部のパスを再帰しないようにすることもできます。
Bugloaf

8
@Clément "トップダウンがTrueの場合、呼び出し元はdirnamesリストをインプレースで(おそらくdelまたはslice割り当てを使用して)変更でき、walk()は名前がdirnamesに残っているサブディレクトリにのみ再帰します。これは、検索、訪問の特定の順序を課す、またはwalk()を再開する前に呼び出し元が作成または名前を変更するディレクトリについてwalk()に通知することもできます。 " docs.python.org/2/library/os.html#os.walk
bugloaf

一部のディレクトリを無視する最も簡単な方法は、最初にそれらをディレクトリ名に追加しないことですfor subdirname in dirnames: if subdirname != '.git'
smci '22

537

使用できます

os.listdir(path)

参照およびその他のos関数については、以下をご覧ください。


1
元の質問はあいまいで、再帰的なソリューションが必要かどうかわからないほどです。「ディレクトリ内のすべてのファイル」は、再帰的に解釈される可能性があります。
トミー

3
@トミー、「ディレクトリ」は明確に定義されたデータ構造であり、「ls -R」ではなく「ls」を指します。また、ほとんどすべてのUNIXツールは、デフォルトでは再帰的に機能しません。質問者が何を意味するのかはわかりませんが、彼が書いたことは明らかでした。
Torsten Bronger 16

os.scandirただし、Python 3のドキュメントでは代わりに使用するように指示されています。これは、多くの場合、システムコールを防止して、無料のスピードアップを提供するためです(IPCとIOの両方が遅い)。
Jappie Kerk 2017

5
listdirはディレクトリ内の唯一のファイル名を提供します。フルパスを取得するために利用できる方法はありますか?
greperror 2017

1
@greperrorフルパスを取得するには、os.path.abspathを使用できます。また、特定のパスがファイルであるかどうかを確認するには、os.path.isfileまたはを使用しますos.path.isdir
Aleksandar

111

これは私がよく使うヘルパー関数です:

import os

def listdir_fullpath(d):
    return [os.path.join(d, f) for f in os.listdir(d)]

3
発電機が良いでしょう。
Robert Siemer 2015

1
@RobertSiemerは使用方法によって異なります。多くの場合、リストの方が優れていますが、ジェネレーターはリストに変換できるため、より用途が広いと思います。それは、あなたが探しているのか、汎用性か、もう少し合理化されたものかによって異なります。
James Mchugh、

3
10年になりますが、os.listdir()がリストを返し、私がそれを模倣していたので、私はこのようにしたと思います。
ギルタイ2018

82
import os

for filename in os.listdir("C:\\temp"):
    print  filename

16
r'C:\temp'はより明確で、"C:\\temp"Rawstrings よりも優先されます。バックスラッシュのエスケープよりも好ましいです。
smci 2012

13

グロビング機能が必要な場合は、そのためのモジュールもあります。例えば:

import glob
glob.glob('./[0-9].*')

次のようなものを返します:

['./1.gif', './2.txt']

こちらのドキュメントをご覧ください


10

これを試して:

import os
for top, dirs, files in os.walk('./'):
    for nm in files:       
        print os.path.join(top, nm)

1行で:[top + os.sep + f for top、dirs、files in os.walk( './')for f for files]
J. Peterson

9

パスを指定せずに現在の作業ディレクトリにあるファイルの場合

Python 2.7:

import os
os.listdir(os.getcwd())

Python 3.x:

import os
os.listdir()

python 3.xについてコメントしてくれたStam Kalyに感謝


5
os.listdir()デフォルトで現在のディレクトリの要素をリストします!したがって、os.getcwd():) の必要はありません
Stam Kaly 2017年

どうすればいいですか?引数なしで>>> os.listdir()を使用すると、次のエラーメッセージが表示されます。TypeError:listdir()は引数を1つだけ受け取ります(0を指定)
Dave Engineer

2
あなたは2.7で実行していると思います。これは3.xに追加されました
Stam Kaly 2017年


3

私は必要なすべてのオプションを使用して長いバージョンを作成しました:http : //sam.nipl.net/code/python/find.py

ここにも合うと思います:

#!/usr/bin/env python

import os
import sys

def ls(dir, hidden=False, relative=True):
    nodes = []
    for nm in os.listdir(dir):
        if not hidden and nm.startswith('.'):
            continue
        if not relative:
            nm = os.path.join(dir, nm)
        nodes.append(nm)
    nodes.sort()
    return nodes

def find(root, files=True, dirs=False, hidden=False, relative=True, topdown=True):
    root = os.path.join(root, '')  # add slash if not there
    for parent, ldirs, lfiles in os.walk(root, topdown=topdown):
        if relative:
            parent = parent[len(root):]
        if dirs and parent:
            yield os.path.join(parent, '')
        if not hidden:
            lfiles   = [nm for nm in lfiles if not nm.startswith('.')]
            ldirs[:] = [nm for nm in ldirs  if not nm.startswith('.')]  # in place
        if files:
            lfiles.sort()
            for nm in lfiles:
                nm = os.path.join(parent, nm)
                yield nm

def test(root):
    print "* directory listing, with hidden files:"
    print ls(root, hidden=True)
    print
    print "* recursive listing, with dirs, but no hidden files:"
    for f in find(root, dirs=True):
        print f
    print

if __name__ == "__main__":
    test(*sys.argv[1:])

3

これは別のオプションです。

os.scandir(path='.')

pathで指定されたディレクトリ内のエントリ(およびファイル属性情報)に対応するos.DirEntryオブジェクトのイテレータを返します。

例:

with os.scandir(path) as it:
    for entry in it:
        if not entry.name.startswith('.'):
            print(entry.name)

listdir()の代わりにscandir()を使用すると、オペレーティングシステムがディレクトリのスキャン時に提供する場合、os.DirEntryオブジェクトがこの情報を公開するため、ファイルタイプまたはファイル属性情報も必要とするコードのパフォーマンスを大幅に向上させることができます。すべてのos.DirEntryメソッドはシステムコールを実行できますが、is_dir()およびis_file()は通常、シンボリックリンクのシステムコールのみを必要とします。os.DirEntry.stat()は、Unixでは常にシステムコールを必要としますが、Windowsではシンボリックリンクに対してのみ必要です。

Pythonドキュメント


3

一方でos.listdir()、頻繁にあなたがそれらの名前を持っていたら、もっとやりたい、ファイルおよびディレクトリ名のリストを生成するための罰金です-とのpython3で、pathlibは、それらの他の家事が簡単になります。私と同じくらいあなたがそれが好きかどうか見てみましょう。

dirの内容を一覧表示するには、Pathオブジェクトを作成し、イテレータを取得します。

In [16]: Path('/etc').iterdir()
Out[16]: <generator object Path.iterdir at 0x110853fc0>

名前のリストだけが必要な場合:

In [17]: [x.name for x in Path('/etc').iterdir()]
Out[17]:
['emond.d',
 'ntp-restrict.conf',
 'periodic',

dirsだけが必要な場合:

In [18]: [x.name for x in Path('/etc').iterdir() if x.is_dir()]
Out[18]:
['emond.d',
 'periodic',
 'mach_init.d',

そのツリー内のすべてのconfファイルの名前が必要な場合:

In [20]: [x.name for x in Path('/etc').glob('**/*.conf')]
Out[20]:
['ntp-restrict.conf',
 'dnsextd.conf',
 'syslog.conf',

ツリーにconfファイルのリストが必要な場合> = 1K:

In [23]: [x.name for x in Path('/etc').glob('**/*.conf') if x.stat().st_size > 1024]
Out[23]:
['dnsextd.conf',
 'pf.conf',
 'autofs.conf',

相対パスの解決が簡単になります:

In [32]: Path('../Operational Metrics.md').resolve()
Out[32]: PosixPath('/Users/starver/code/xxxx/Operational Metrics.md')

パスを使用したナビゲーションは、非常に明確です(ただし、予想外です)。

In [10]: p = Path('.')

In [11]: core = p / 'web' / 'core'

In [13]: [x for x in core.iterdir() if x.is_file()]
Out[13]:
[PosixPath('web/core/metrics.py'),
 PosixPath('web/core/services.py'),
 PosixPath('web/core/querysets.py'),

1

ファイルだけを再帰的にリストするための素晴らしい1つのライナー。私はこれを私のsetup.py package_dataディレクティブで使用しました:

import os

[os.path.join(x[0],y) for x in os.walk('<some_directory>') for y in x[2]]

質問に対する答えではないことは知っていますが、役に立つかもしれません


1

Python 2の場合

#!/bin/python2

import os

def scan_dir(path):
    print map(os.path.abspath, os.listdir(pwd))

Python 3の場合

フィルターとマップについては、list()でラップする必要があります

#!/bin/python3

import os

def scan_dir(path):
    print(list(map(os.path.abspath, os.listdir(pwd))))

ここでの推奨事項は、マップとフィルターの使用をジェネレーター式またはリスト内包表記に置き換えることです。

#!/bin/python

import os

def scan_dir(path):
    print([os.path.abspath(f) for f in os.listdir(path)])

1

以下は1行のPythonicバージョンです。

import os
dir = 'given_directory_name'
filenames = [os.path.join(os.path.dirname(os.path.abspath(__file__)),dir,i) for i in os.listdir(dir)]

このコードは、指定されたディレクトリ名のすべてのファイルとディレクトリの完全パスをリストします。


Salehに感謝しますが、コードは完全に機能せず、機能するコードは次のように変更されました。 'dir =' given_directory_name 'filenames = [os.path.abspath(os.path.join(dir、i))for i in os.listdir(dir)] '
HassanSh__3571619

1

私はこれが古い質問であることを知っています。これは、liunxマシンを使用している場合に出会ったきちんとした方法です。

import subprocess
print(subprocess.check_output(["ls", "/"]).decode("utf8"))

0
#import modules
import os

_CURRENT_DIR = '.'


def rec_tree_traverse(curr_dir, indent):
    "recurcive function to traverse the directory"
    #print "[traverse_tree]"

    try :
        dfList = [os.path.join(curr_dir, f_or_d) for f_or_d in os.listdir(curr_dir)]
    except:
        print "wrong path name/directory name"
        return

    for file_or_dir in dfList:

        if os.path.isdir(file_or_dir):
            #print "dir  : ",
            print indent, file_or_dir,"\\"
            rec_tree_traverse(file_or_dir, indent*2)

        if os.path.isfile(file_or_dir):
            #print "file : ",
            print indent, file_or_dir

    #end if for loop
#end of traverse_tree()

def main():

    base_dir = _CURRENT_DIR

    rec_tree_traverse(base_dir," ")

    raw_input("enter any key to exit....")
#end of main()


if __name__ == '__main__':
    main()

5
この質問にはすでに完全に適切な回答があり、再度回答する必要はありません
マイクペニントン

0

FYI拡張子またはextファイルのインポートOSのフィルターを追加する

path = '.'
for dirname, dirnames, filenames in os.walk(path):
    # print path to all filenames with extension py.
    for filename in filenames:
        fname_path = os.path.join(dirname, filename)
        fext = os.path.splitext(fname_path)[1]
        if fext == '.py':
            print fname_path
        else:
            continue

0

考えれば、これを投入します。ワイルドカード検索を実行するための単純で汚い方法です。

import re
import os

[a for a in os.listdir(".") if re.search("^.*\.py$",a)]

0

以下のコードは、ディレクトリとディレクトリ内のファイルをリストします

def print_directory_contents(sPath):
        import os                                       
        for sChild in os.listdir(sPath):                
            sChildPath = os.path.join(sPath,sChild)
            if os.path.isdir(sChildPath):
                print_directory_contents(sChildPath)
            else:
                print(sChildPath)

0

私と一緒に働いたのは、上記のサレの回答からの修正版のようなものです。

コードは次のとおりです。

"dir = 'given_directory_name' filenames = [os.path.abspath(os.path.join(dir、i))for i in os.listdir(dir)]"

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.