Pythonでディレクトリリストを作成日でソートするにはどうすればよいですか?


129

日付でソートされた、ディレクトリ内のすべてのファイルのリストを取得する最良の方法は何ですか[作成済み| 修正済み]、Pythonを使用して、Windowsマシンで?

回答:


79

更新dirpathのエントリをPython 3の変更日で並べ替えます。

import os
from pathlib import Path

paths = sorted(Path(dirpath).iterdir(), key=os.path.getmtime)

(可視性を高めるためにここに@Pygirlの回答を入力してください)

既にファイル名のリストがある場合は、filesWindowsで作成時間順に並べ替えます。

files.sort(key=os.path.getctime)

たとえば、@ Jayの回答にglob示されているように使用して取得できるファイルのリスト。


古い答えは ここでの、より詳細なバージョンだ@Greg Hewgillの答え。質問の要件に最も準拠しています。作成日と変更日を区別します(少なくともWindowsでは)。

#!/usr/bin/env python
from stat import S_ISREG, ST_CTIME, ST_MODE
import os, sys, time

# path to the directory (relative or absolute)
dirpath = sys.argv[1] if len(sys.argv) == 2 else r'.'

# get all entries in the directory w/ stats
entries = (os.path.join(dirpath, fn) for fn in os.listdir(dirpath))
entries = ((os.stat(path), path) for path in entries)

# leave only regular files, insert creation date
entries = ((stat[ST_CTIME], path)
           for stat, path in entries if S_ISREG(stat[ST_MODE]))
#NOTE: on Windows `ST_CTIME` is a creation date 
#  but on Unix it could be something else
#NOTE: use `ST_MTIME` to sort by a modification date

for cdate, path in sorted(entries):
    print time.ctime(cdate), os.path.basename(path)

例:

$ python stat_creation_date.py
Thu Feb 11 13:31:07 2009 stat_creation_date.py

1
これは完全に機能しました。2つのディレクトリcdateを互いに比較しようとしています。2つのcdate間の秒数を比較する方法はありますか?
フェデラー2012年

@malcmcmul:cdateエポック以降の秒数の浮動小数点数。
jfs

4
これは機能しますが、最も簡潔なソリューションは、stackoverflow.com
a / 4500607/68534にあります

@jmoz:あなたは次のように意味ですかこれ。リンクしたソリューションは間違っています。通常のファイルはフィルタリングされません。注:このソリューションではstat、dir.entryごとに1回呼び出します。
jfs 2015

許してください、Sabastianによって提供されたリンクはさらに簡潔です!ありがとうございました。
jmoz 2015

148

ディレクトリ内の最後に更新されたファイルを特定するために、Pythonスクリプトでこれを以前に実行しました。

import glob
import os

search_dir = "/mydir/"
# remove anything from the list that is not a file (directories, symlinks)
# thanks to J.F. Sebastion for pointing out that the requirement was a list 
# of files (presumably not including directories)  
files = list(filter(os.path.isfile, glob.glob(search_dir + "*")))
files.sort(key=lambda x: os.path.getmtime(x))

ファイルmtimeに基づいて、探していることを実行できます。

編集:必要に応じてglob.glob()の代わりにos.listdir()を使用することもできます-元のコードでglobを使用した理由は、globを使用して特定のセットのファイルのみを検索したかったためですファイル拡張子のうち、glob()の方が適していました。listdirを使用すると、次のようになります。

import os

search_dir = "/mydir/"
os.chdir(search_dir)
files = filter(os.path.isfile, os.listdir(search_dir))
files = [os.path.join(search_dir, f) for f in files] # add path to each file
files.sort(key=lambda x: os.path.getmtime(x))

glob()は便利ですが、ピリオドで始まるファイルをスキップすることに注意してください。* nixシステムはそのようなファイルを隠しファイルとして扱う(したがって、リストからそれらを省略します)が、Windowsでは通常のファイルです。
efotinis 2008年

これらのソリューションはリストからdirsを除外しません。
コンスタンティン

os.listdirソリューションにos.path.joinがありません:files.sort(lambda x、y:cmp(os.path.getmtime(os.path.join(search_dir、x))、os.path.getmtime(os .path.join(search_dir、y))))
Peter Hoffmann

files.sort(key=lambda fn: os.path.getmtime(os.path.join(search_dir, fn)))
jfs 2009

22
単に動作するfiles.sort(key=os.path.getmtime)はずです(なしlambda)。
jfs 2009

31

os.path.getmtimeエポックからの秒数を示す関数があり、よりも高速でなければなりませんos.stat

import os 

os.chdir(directory)
sorted(filter(os.path.isfile, os.listdir('.')), key=os.path.getmtime)

23

これが私のバージョンです:

def getfiles(dirpath):
    a = [s for s in os.listdir(dirpath)
         if os.path.isfile(os.path.join(dirpath, s))]
    a.sort(key=lambda s: os.path.getmtime(os.path.join(dirpath, s)))
    return a

まず、ファイル名のリストを作成します。isfile()はディレクトリをスキップするために使用されます。ディレクトリを含める必要がある場合は省略できます。次に、変更日をキーとして使用して、リストをインプレースで並べ替えます。


古いものから新しいものへと並べ替えました。最新の5つのファイルが欲しかったとき、次のことを行わなければなりませんでしたa[-5:]
Daniel Butler

20

ここにワンライナーがあります:

import os
import time
from pprint import pprint

pprint([(x[0], time.ctime(x[1].st_ctime)) for x in sorted([(fn, os.stat(fn)) for fn in os.listdir(".")], key = lambda x: x[1].st_ctime)])

これはos.listdir()を呼び出してファイル名のリストを取得し、それぞれに対してos.stat()を呼び出して作成時間を取得し、作成時間に対してソートします。

このメソッドは、ファイルごとに1回だけos.stat()を呼び出すことに注意してください。これは、ソートの比較ごとに呼び出すよりも効率的です。


それは仕事を解決しますが、それはほとんどpythonicではありません(免責事項:コードをテストしませんでした)。
Adriano

このソリューションはリストからdirsを除外しません。
コンスタンティン

@Constantin:それは本当ですが、簡単に[... if stat.S_ISREG(x)]がそれを処理します。
グレッグHewgill

16

ディレクトリを変更せずに:

import os    

path = '/path/to/files/'
name_list = os.listdir(path)
full_list = [os.path.join(path,i) for i in name_list]
time_sorted_list = sorted(full_list, key=os.path.getmtime)

print time_sorted_list

# if you want just the filenames sorted, simply remove the dir from each
sorted_filename_list = [ os.path.basename(i) for i in time_sorted_list]
print sorted_filename_list

12

Python 3.5以降

from pathlib import Path
sorted(Path('.').iterdir(), key=lambda f: f.stat().st_mtime)

3
作成日はf.stat().st_ctime代わりに使用してください。
alanjds

11

特定の拡張子が付いたファイルを日付順に読みたい場合(Python 3)は、フィルターなしのglobを使用した私の答えです。

dataset_path='/mydir/'   
files = glob.glob(dataset_path+"/morepath/*.extension")   
files.sort(key=os.path.getmtime)

5
# *** the shortest and best way ***
# getmtime --> sort by modified time
# getctime --> sort by created time

import glob,os

lst_files = glob.glob("*.txt")
lst_files.sort(key=os.path.getmtime)
print("\n".join(lst_files))

コンテキストを提供してください
Claire

「最高」は主観的です。それが最善の方法であると考える理由を説明した方がよいでしょう。
ブライアンオークリー

「最高」が必要な場合は、本当に遅いため、globは使用しないでください。
user136036

4
sorted(filter(os.path.isfile, os.listdir('.')), 
    key=lambda p: os.stat(p).st_mtime)

os.walk('.').next()[-1]でフィルタリングする代わりにを使用することもできますos.path.isfileが、リストに無効なシンボリックリンクがos.stat残り、失敗します。


4
from pathlib import Path
import os

sorted(Path('./').iterdir(), key=lambda t: t.stat().st_mtime)

または

sorted(Path('./').iterdir(), key=os.path.getmtime)

または

sorted(os.scandir('./'), key=lambda t: t.stat().st_mtime)

ここで、m時間は変更された時間です。


1

これは学ぶための基本的なステップです:

import os, stat, sys
import time

dirpath = sys.argv[1] if len(sys.argv) == 2 else r'.'

listdir = os.listdir(dirpath)

for i in listdir:
    os.chdir(dirpath)
    data_001 = os.path.realpath(i)
    listdir_stat1 = os.stat(data_001)
    listdir_stat2 = ((os.stat(data_001), data_001))
    print time.ctime(listdir_stat1.st_ctime), data_001

1

ファイルが存在しないファイルへのシンボリックリンクである場合、Alex Coventryの回答は例外を生成します。次のコードはその回答を修正します。

import time
import datetime
sorted(filter(os.path.isfile, os.listdir('.')), 
    key=lambda p: os.path.exists(p) and os.stat(p).st_mtime or time.mktime(datetime.now().timetuple())

ファイルが存在しない場合はnow()が使用され、シンボリックリンクはリストの最後に移動します。


0

これは、拡張を検索するだけでなく、並べ替えオプションを提供する単純な2行です。

def get_sorted_files(src_dir, regex_ext='*', sort_reverse=False): 
    files_to_evaluate = [os.path.join(src_dir, f) for f in os.listdir(src_dir) if re.search(r'.*\.({})$'.format(regex_ext), f)]
    files_to_evaluate.sort(key=os.path.getmtime, reverse=sort_reverse)
    return files_to_evaluate

0

os.scandir(の2倍の速度pathlib)で完全を期すために:

import os
sorted(os.scandir('/tmp/test'), key=lambda d: d.stat().st_mtime)

0

これは私のバージョンでした:

import os

folder_path = r'D:\Movies\extra\new\dramas' # your path
os.chdir(folder_path) # make the path active
x = sorted(os.listdir(), key=os.path.getctime)  # sorted using creation time

folder = 0

for folder in range(len(x)):
    print(x[folder]) # print all the foldername inside the folder_path
    folder = +1

私のコードでは、ファイルは古いものから新しいものへとソートされています。最新のファイル名またはフォルダを最初に取得するには、ファイルリストにreverse = Trueを追加する必要があります(私の場合はxでした)。したがって、x = Sorted(os.listdir()、key = os.path.getctime、reverse = True)
haqrafiul

-6

多分あなたはシェルコマンドを使うべきです。Unix / Linuxでは、sortでパイプされたfindは、おそらくあなたが望むことを行うことができるでしょう。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.