単純な文字列からtimedeltaオブジェクトを作成する方法


96

文字列として渡されるtimedelta入力を必要とする関数を書いています。ユーザーは「32m」や「2h32m」、さらには「4:13」や「5hr34m56s」のようなものを入力する必要があります...このようなことをすでに実装しているライブラリまたは何かがありますか?


人のためだけのtimedeltaオブジェクト構築するために探してd日、h時間、m分、s(インポート後に1行を使用して、秒datetime): datetime.timedelta(days = d, hours = h, minutes=m, seconds=s)
zthomas.nc 2017

回答:


72

最初の形式(5hr34m56s)では、正規表現を使用して解析する必要があります

これがリベースのソリューションです:

import re
from datetime import timedelta


regex = re.compile(r'((?P<hours>\d+?)hr)?((?P<minutes>\d+?)m)?((?P<seconds>\d+?)s)?')


def parse_time(time_str):
    parts = regex.match(time_str)
    if not parts:
        return
    parts = parts.groupdict()
    time_params = {}
    for (name, param) in parts.iteritems():
        if param:
            time_params[name] = int(param)
    return timedelta(**time_params)


>>> from parse_time import parse_time
>>> parse_time('12hr')
datetime.timedelta(0, 43200)
>>> parse_time('12hr5m10s')
datetime.timedelta(0, 43510)
>>> parse_time('12hr10s')
datetime.timedelta(0, 43210)
>>> parse_time('10s')
datetime.timedelta(0, 10)
>>> 

4
私は、あなたが投げたものを何でも取り、それでもtimedeltaへの変換を処理できるような関数を考えていました。
priestc

2
私は
リベースの

4
dateutil.parser.parseが期間を解析する方法がわかりません。常にdatetimeを返すようです。何が欠けていますか?
Nickolay 2014年

7
dateutil.parser.parsetimedeltaオブジェクトを解析しません。これはを返し、のdatetimeような文字列の例外をトリガーします'28:32:11.10'
Spak

95

私にとって最もエレガントなソリューションは、dateutilなどの外部ライブラリに頼ったり、入力を手動で解析したりせずに、datetimeの強力なstrptime文字列解析方法を使用することです。

from datetime import datetime, timedelta
# we specify the input and the format...
t = datetime.strptime("05:20:25","%H:%M:%S")
# ...and use datetime's hour, min and sec properties to build a timedelta
delta = timedelta(hours=t.hour, minutes=t.minute, seconds=t.second)

この後、通常どおりtimedeltaオブジェクトを使用できます。それを秒に変換して、正しいことを行ったことを確認します。

print(delta)
assert(5*60*60+20*60+25 == delta.total_seconds())

33
このアプローチは、タイムスパンが24時間未満の場合にのみ機能し(datetime.strptime("32:20:25","%H:%M:%S")機能しない)、正確な入力形式を知っている必要があることに注意してください。
verdesmarald、2012年

これもまた、OPの質問に答える部分だけです。関数が複数のフォーマットを処理する必要がある場合-追加のフォーマット検査(1コロンまたは2?)が必要です。
ダニーステープル

3
@verdesmaraldでは、Python 3.5の時点で、外部ライブラリを使用せず、タイムスパンが24時間未満であると想定せずに、エレガントなソリューションはありますか?
最大

1
パラメータの名前付きパラメータを手動で指定する必要timedeltaがあるのはかなり面倒ですが、これを回避するために思いつくことができる最善の方法は次のとおりdelta = t - datetime.combine(t.date(), time.min)です。
カイルストランド

2
この方法の深刻な問題は、日を含めてから%dをstrptimeに送信すると、日付に有効な日が1以上の日だけなので、0日目を入力できないことです。
user1581390

75

昨日は少し時間があったので、@ virhilo回答をPythonモジュールに開発し、@ priestcで要求されたものをすべて含む時間式フォーマットをいくつか追加しました

ソースコードはそれを望む人のためにgithub(MITライセンス)にあります。PyPIにもあります:

pip install pytimeparse

時間を秒数で返します。

>>> from pytimeparse.timeparse import timeparse
>>> timeparse('32m')
1920
>>> timeparse('2h32m')
9120
>>> timeparse('4:13')
253
>>> timeparse('5hr34m56s')
20096
>>> timeparse('1.2 minutes')
72

Java / Scalaに相当するものはありますか?
luca.giovagnoli

驚くばかり!
どうも

@ luca.giovagnoli Scalaでは、Durationクラスを使用できます。期間は、 ''15秒のような文字列から4分などを構築することができます
コンラッド・マリク

14

私は一度だけ入力して、それをさまざまな日付に追加したかったので、これは私にとってうまくいきました:

from datetime import datetime as dtt

time_only = dtt.strptime('15:30', "%H:%M") - dtt.strptime("00:00", "%H:%M")

dtt.strptime(myduration, "%H:%M:%S") - dtt(1900, 1, 1)また動作します...
576i

8

私が変更したvirhiloの素敵な答えをいくつかのアップグレードに:

  • 文字列が有効な時間文字列であるというアサーションを追加しました
  • 「hr」時間インジケータを「h」に置き換えます
  • 「d」を許可-日のインジケータ
  • 整数以外の時間を許可します(例:3m0.25s3分、0.25秒)

import re
from datetime import timedelta


regex = re.compile(r'^((?P<days>[\.\d]+?)d)?((?P<hours>[\.\d]+?)h)?((?P<minutes>[\.\d]+?)m)?((?P<seconds>[\.\d]+?)s)?$')


def parse_time(time_str):
    """
    Parse a time string e.g. (2h13m) into a timedelta object.

    Modified from virhilo's answer at https://stackoverflow.com/a/4628148/851699

    :param time_str: A string identifying a duration.  (eg. 2h13m)
    :return datetime.timedelta: A datetime.timedelta object
    """
    parts = regex.match(time_str)
    assert parts is not None, "Could not parse any time information from '{}'.  Examples of valid strings: '8h', '2d8h5m20s', '2m4s'".format(time_str)
    time_params = {name: float(param) for name, param in parts.groupdict().items() if param}
    return timedelta(**time_params)

1
すごい!要素の間に「*」を追加して、「1d 3h 5m」も許可する
Marcel Waldvogel

@MarcelWaldvogelいいですね。新しい正規表現のテキストをコピーした場合、回答を追加します
Peter

@virhiloとPeter:コードの私のわずかな進化はここにあります:github.com/zeitgitter/zeitgitterd/blob/master/zeitgitter/…。私はあなたのコードを使用しても問題ないと思います。ライセンスの設定はありますか?MIT、Apache、GPL、…?
Marcel Waldvogel

1
マルセル、私に訴訟を起こすためにあなたの住所を送ってくれませんか?JKはどんなライセンスでも大丈夫です。
Peter

これが新しい正規表現です。違いは "*"です:regex = re.compile(r '^((?P <days> [\。\ d] +?)d)?*' r '((?P <hours> [\ 。\ d] +?)h)?* 'r'((?P <minutes> [\。\ d] +?)m)?* 'r'((?P <seconds> [\。\ d] +?)s)?$ ')
Marcel Waldvogel

3

Python 3を使用している場合、私が使用したHari Shankarのソリューションの更新バージョンは次のとおりです。

from datetime import timedelta
import re

regex = re.compile(r'(?P<hours>\d+?)/'
                   r'(?P<minutes>\d+?)/'
                   r'(?P<seconds>\d+?)$')

def parse_time(time_str):
    parts = regex.match(time_str)
    if not parts:
        return
    parts = parts.groupdict()
    print(parts)
    time_params = {}
    for name, param in parts.items():
        if param:
            time_params[name] = int(param)
    return timedelta(**time_params)

3

Djangoにはユーティリティ関数が付属していますparse_duration()ドキュメントから:

文字列を解析してを返しますdatetime.timedelta

"DD HH:MM:SS.uuuuuu"ISO 8601で指定された形式または形式(例:P4DT1H15M20Sと同等4 1:15:20)またはPostgreSQLの日時間間隔形式(例:)のデータが必要3 days 04:05:06です。


弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.