時系列のこの予測が「かなり悪い」のはなぜですか?


15

ニューラルネットワークの使用方法を学習しようとしています。私はこのチュートリアルを読んでいました

値を用いて、時系列にニューラルネットワークを適合した後にでの値を予測するために著者は青い線は、時系列であり、以下のプロットを取得し、緑色列データに予測され、赤色でありますテストデータの予測(テストトレイン分割を使用)tt+1p1

「トレーニングデータセットとテストデータセットの両方を適合させるという、モデルの仕事がかなり貧弱だったことがわかります。基本的に、出力と同じ入力値を予測しました。」

次に、著者は、およびを使用して値を予測することにしました。そうすることで取得tt1t2t+1

p2

「グラフを見ると、予測にさらに構造が見られる」と言います。

私の質問

最初の「貧しい」のはなぜですか?私にはほとんど完璧に見えますが、すべての単一の変化を完全に予測します!

同様に、なぜ2番目の方が優れているのでしょうか?「構造」はどこにありますか?私にとっては、最初のものよりもずっと貧しいようです。

一般に、時系列の予測はいつ良いのか、いつ悪いのか?


3
一般的なコメントとして、ほとんどのMLメソッドは断面分析用であり、時系列に適用する調整が必要です。主な理由は、データの自己相関ですが、MLでは、ほとんどの一般的な方法でデータが独立していると想定されることがよくあります。
アクサカル

11
すべての変化を予測するという素晴らしい仕事をしています...それが起こった直後です!
ホッブズ

@hobbs、t + 1を予測するためにt、t-1、t-2などを使用しようとはしていません。過去にいくつの用語を使用するのが最適か知っているのかと思いまして。使用しすぎると、過剰適合になりませんか?
-Euler_Salter

残差をプロットすると、より明るくなります。
加藤レオ17年

回答:


23

それは一種の錯覚です。目はグラフを見て、赤と青のグラフがそれぞれの隣にあることを確認します。問題は、それらが水平に隣接していることですが、重要なのは垂直です距離。目は、デカルトグラフの2次元空間内の曲線間の距離を最も簡単に見ることができますが、重要なのは、特定のt値内の1次元距離です。たとえば、ポイントA1 =(10,100)、A2 =(10.1、90)、A3 =(9.8,85)、P1 =(10.1,100.1)、およびP2 =(9.8、88)があるとします。目は自然にP1とA1を比較します。これは最も近いポイントであるため、P2はA2と比較されます。P2はA3よりもP1がA1に近いため、P1はより良い予測のように見えます。しかし、P1とA1を比較するときは、A1が以前に見たものをどれだけうまく繰り返すことができるかを見ているだけです。A1に関して、P1は予測ではありません。適切な比較はP1 v。A2とP2 v。A3の間であり、この比較ではP2はP1よりも優れています。tに対してy_actualとy_predをプロットすることに加えて、tに対して(y_pred-y_actual)のグラフがあれば、より明確になります。


2
あなたはそれで素晴らしい仕事をしている間、他の人は「見栄えの良い」予測が実際に貧弱である理由さえ言及していないので、これはより良い答えです!
リチャードハーディ

17

最初の「貧しい」のはなぜですか?私にはほとんど完璧に見えますが、すべての単一の変化を完全に予測します!

これは、いわゆる「シフト」予測です。チャート1をより詳しく見ると、予測力は、最後に見た値をほぼ正確にコピーすることだけにあることがわかります。つまり、モデルはこれ以上何も学習せず、時系列をランダムウォークとして扱います。問題は、ニューラルネットワークにフィードするデータを使用するという事実にあるのではないかと思います。これらのデータは非定常であり、すべてのトラブルを引き起こします。


8
予測では、これは「単純な」予測と呼ばれます。つまり、最後に観測された予測を使用します
Aksakal

ありがとうございました!@Aksakal予測に使用する以前の値の数を知っていますか?
Euler_Salter

定常性に焦点を当てます。この時系列では、いくつかの定常的な遅延が非常に良いはずです。100を超える非定常遅延。
アレクセイバーナコフ

時系列では、ACFとPACFを使用して遅延構造を適切に推測する方法があり、このフォーラムを参照して、その方法について多くの投稿がありました
-Aksakal

@AlexeyBurnakovだから、静止するように変換する必要があるということですか?
-Euler_Salter
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.