予測者が直面している重要な問題の1つは、特定の系列 を予測できるかどうかです。
Peter Cattによる「予測可能性の先験的指標としてのエントロピー」というタイトルの記事を偶然見つけました。この記事では、近似エントロピー(ApEn)を使用して 、所定の時系列を予測できる相対的な指標を決定しています。
記事は言う、
「ApEn値が小さいほど、一連のデータの後に類似データが続く可能性が高いことを示します(規則性)。逆に、ApEnの値が大きいほど、類似データが繰り返される可能性が低いことを示します(不規則性)。したがって、値が大きいほど、不規則性が高くなります。 、ランダム性、システムの複雑さ。」
そして、ApEnを計算するための数式が続きます。これは、相対的な意味で予測可能性を評価するために使用できる数値を提供するため、興味深いアプローチです。近似エントロピーの意味がわかりません。詳しく読んでいます。
呼ばれるパッケージがありpracmaにR
それはあなたがAPENを計算することができますが。説明のために、3つの異なる時系列を使用してApEn数を計算しました。
- シリーズ1:有名なAirPassenger時系列-非常に確定的であり、簡単に予測できるはずです。
- 系列2:太陽黒点の時系列-非常に明確に定義されていますが、系列1よりも予測しにくいはずです。
- シリーズ3:乱数このシリーズを予測する方法はありません。
したがって、ApEnを計算する場合、シリーズ1はシリーズ2よりも少なく、シリーズ3は非常に少ないはずです。
以下は、3つのシリーズすべてのApEnを計算するRスニペットです。
library("pracma")
> series1 <- approx_entropy(AirPassengers)
> series1
[1] 0.5157758
> series2 <- approx_entropy(sunspot.year)
> series2
[1] 0.762243
> series3 <- approx_entropy(rnorm(1:30))
> series3
[1] 0.1529609
これは私が期待したものではありません。ランダムシリーズは、明確に定義されたAirPassengerシリーズよりも数が少ないです。乱数を100に増やしても、明確に定義されたシリーズ2 / Sunspot.yealryシリーズよりも少ない次の結果が得られます。
> series3 <- approx_entropy(rnorm(1:100))
> series3
[1] 0.747275
以下は私の質問です:
- ApEn(
m
およびr
)の計算には2つのパラメータがありますか?それらを決定する方法。R
上記のコードでデフォルトを使用しました。 - ApEnが乱数に対して、sunspot.yearlyなどの明確に定義された系列よりも低いことを誤って示しているので、私は間違って何をしていますか。
- シリーズの季節性をなくす/トレンドを取り除き、次にApEnを推定する必要があります。ただし、著者はApEnを直接シリーズに適用しています。
- シリーズが予測可能かどうかを判断する他の方法はありますか?