DataFrame列タイプを文字列から日時、dd / mm / yyyy形式に変換します


回答:


473

最も簡単な方法はto_datetime次のとおりです。

df['col'] = pd.to_datetime(df['col'])

それはまたdayfirstヨーロッパの時代に対する議論を提供します(しかしこれは厳密ではないことに注意してください)。

ここでそれは動作しています:

In [11]: pd.to_datetime(pd.Series(['05/23/2005']))
Out[11]:
0   2005-05-23 00:00:00
dtype: datetime64[ns]

特定のフォーマットを渡すことができます

In [12]: pd.to_datetime(pd.Series(['05/23/2005']), format="%m/%d/%Y")
Out[12]:
0   2005-05-23
dtype: datetime64[ns]

リプレイありがとうございます。フォーマットを定義できますか?'%d /%m /%Y'のように?非常に感謝
近地点


1
配列を渡す@shootingstarsは動作するDatetimeIndex(df['col']).to_pydatetime()はずです。
アンディヘイデン

1
Nvm、私はあまりにも早くコメントしました。検索でSettingWithCopyWarning十分な資料が得られる
Sundeep、2017

2
@daneshjai二重波括弧は、列をシリーズとして取得する単一波括弧と比較して、DataFrame(列が1つだけ)を作成します。
アンディヘイデン

36

日付列が「2017-01-01」形式の文字列の場合、pandas astypeを使用して日付時刻に変換できます。

df['date'] = df['date'].astype('datetime64[ns]')

または、ナノ秒ではなく日の精度が必要な場合は、datetime64 [D]を使用します

print(type(df_launath['date'].iloc[0]))

収量

<class 'pandas._libs.tslib.Timestamp'> pandas.to_datetimeを使用する場合と同じ

'%Y-%m-%d'のような他の形式でも試すことができますが、少なくともこれでうまくいきます。



2

日付の形式が混在している場合は、設定infer_datetime_format=Trueを忘れずに行ってください

df['date'] = pd.to_datetime(df['date'], infer_datetime_format=True)

ソース:pd.to_datetime

または、カスタマイズされたアプローチが必要な場合:

def autoconvert_datetime(value):
    formats = ['%m/%d/%Y', '%m-%d-%y']  # formats to try
    result_format = '%d-%m-%Y'  # output format
    for dt_format in formats:
        try:
            dt_obj = datetime.strptime(value, dt_format)
            return dt_obj.strftime(result_format)
        except Exception as e:  # throws exception when format doesn't match
            pass
    return value  # let it be if it doesn't match

df['date'] = df['date'].apply(autoconvert_datetime)
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.