文字ベクトルをPOSIXct / POSIXltに変換するためのas.POSIXct / as.POSIXltとstrptimeの違い


93

ここでは、文字ベクトルを日時クラスに変換する方法について尋ねるいくつかの質問に従ってきました。strptimeメソッドとas.POSIXct / as.POSIXltメソッドの2つのメソッドがよく見られます。2つの関数を確認しましたが、違いが何なのか不明です。

strptime

function (x, format, tz = "") 
{
    y <- .Internal(strptime(as.character(x), format, tz))
    names(y$year) <- names(x)
    y
}
<bytecode: 0x045fcea8>
<environment: namespace:base>

as.POSIXct

function (x, tz = "", ...) 
UseMethod("as.POSIXct")
<bytecode: 0x069efeb8>
<environment: namespace:base>

as.POSIXlt

function (x, tz = "", ...) 
UseMethod("as.POSIXlt")
<bytecode: 0x03ac029c>
<environment: namespace:base>

パフォーマンスの違いがあるかどうかを確認するためにマイクロベンチマークを実行します。

library(microbenchmark)
Dates <- sample(c(dates = format(seq(ISOdate(2010,1,1), by='day', length=365), format='%d-%m-%Y')), 5000, replace = TRUE)
df <- microbenchmark(strptime(Dates, "%d-%m-%Y"), as.POSIXlt(Dates, format = "%d-%m-%Y"), times = 1000)

Unit: milliseconds
                                    expr      min       lq   median       uq      max
1 as.POSIXlt(Dates, format = "%d-%m-%Y") 32.38596 33.81324 34.78487 35.52183 61.80171
2            strptime(Dates, "%d-%m-%Y") 31.73224 33.22964 34.20407 34.88167 52.12422

strptimeは少し速いようです。だから何を与える?なぜ2つの類似した機能があるのですか、それとも私が見逃した違いがありますか?


4
文字ベクトルの呼び出し時as.POSIXctおよび呼び出し時に呼び出されるコードを確認する場合は、それぞれとを参照してください。as.POSIXltas.POSIXct.defaultas.POSIXlt.character
ジョシュアウルリッヒ

回答:


153

まあ、関数は異なることをします。

最初に、日付/時刻の2つの内部実装があります。はPOSIXct、UNIXエポックからの秒数(+その他のデータ)POSIXltを格納し、は、日、月、年、時、分、秒などのリストを格納します。

strptime(さまざまなフォーマットの)文字ベクトルをフォーマットに直接変換する関数POSIXltです。

as.POSIXltさまざまなデータ型をに変換しPOSIXltます。それはインテリジェントになり、賢明なことをしようとします-文字の場合、それはラッパーとして機能しますstrptime

as.POSIXctさまざまなデータ型をに変換しPOSIXctます。また、インテリジェントになり、賢明なことを行います。キャラクターの場合、strptime最初に実行され、次にからPOSIXltへの変換が行われPOSIXctます。

これは、意味になりstrptimeため、高速ですがstrptime、その他は入力タイプから使用する方法を決定しようとしながら、唯一の文字入力を処理します。また、予期しないデータが渡されるとエラーが発生するだけでなく、意図したものとは異なるインテリジェントな処理を実行するのではなく、少し安全なはずです。


素晴らしい答え。モデリングまたはデータの視覚化の目的でデータをコンパイルするためのベストプラクティスはどれですか。
dre

22

POSIXt型には、POSIXctとPOSIXltの2つがあります。「ct」はカレンダー時間を表すことができ、原点からの秒数を格納します。「lt」または現地時間は、日付を時間属性のリスト(「hour」や「mon」など)として保持します。これらの例を試してください:

date.hour=strptime("2011-03-27 01:30:00", "%Y-%m-%d %H:%M:%S")

date=c("26/10/2016")

time=c("19:51:30")

day<-paste(date,"T", time)

day.time1=as.POSIXct(day,format="%d/%m/%Y T %H:%M:%S",tz="Europe/Paris")

day.time1

day.time1$year

day.time2=as.POSIXlt(day,format="%d/%m/%Y T %H:%M:%S",tz="Europe/Paris")

day.time2

day.time2$year
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.