ニューラルネットワークのエンコード日付/時刻(循環データ)


12

ニューラルネットワークのイベントの日付と時刻をエンコードする方法

連続した時系列はありませんが、日付と時刻のあるイベントがいくつかあります。ある種の興味を分析します。この関心は、朝と夕方で異なり、平日と夏と冬の間、およびクリスマスとイースターの前などにも異なります。そして、イベント自体は、時間の経過とともに強い不均一な分布を示します(夜よりも日中の方が多く、平日にもっと多く、週末にもっと多くの種類があります)。

私はそれを年間の週数、曜日1〜7、時間帯としてエンコードしてみました。しかし、まばらなオートエンコーダーをいじってみると、私のデータはニューラルネットワークにとって意味がなく、大きな隠れ層があっても、入力の近くには何も再現できないという印象がありました。カテゴリー0-1としても、正規化された値としても。

しかし、ニューラルネットワークの時間のエンコーディングを検索すると、ほとんどの場合、時系列に関する情報が得られます。そのため、森によって少し目隠しされていますが、木を探しています。

もちろん、私はデータを見て、それをだいたいの独裁的なものに大まかに分類することができました。しかし、ディープラーニングの概念は、すべての手作りの手動による特徴抽出を一掃するようです。また、分類により、自然に連続する入力変数に大きなジャンプが挿入されます。

私の頭の中での「自然なエンコーディング」は、「夜」、「朝」、「平日」などのいくつかのカテゴリのあいまいなメンバーシップのようなものです。

全体をより興味深いものにするために、dependend変数にもこれらの日付/時刻データが含まれていますが、それは別の問題です。

編集:どういうわけかデータの循環的な種類に関連して、次のような最近の質問があります

この時刻データセットで妥当な統計検定はどれですか。

回答:


7

私は同様の問題の答えを探していて、このスレッドに出くわしました。正弦波エンコードのアイデアについては、次のブログ記事をご覧ください。

周期的連続機能のエンコード-24時間

イアンの答えは私のニーズに完全に対応していたので、将来の記憶のためにここに投稿することを考えました。


私はこれがどのように使用できるか疑問に思うstackoverflow.com/questions/59653862/...時間がフィーチャーされている特別なとき- 。
user4581

1

あなたは、時間を大きな行列、つまり365 x 24として表現して、年の日と時間を表現し、これを1 x 8760のベクトルに「展開」することができます。時間はこのベクトル内の位置に対応し、この位置の値はその時間の値です。


2
そのようなエンコーディングを試して成功しましたか?このエンコーディングでニューラルネットが日曜日の朝の正確な位置を「学習」するとしたら、私は驚くでしょう。しかし、素朴なことを驚かせることはニューラルネットの長所の1つなので、スコッチに賭けないでください。;-)
flaschenpost

これは、さまざまな年の同じ時間に周期的にイベントを検出したい場合に役立ちますが、相関は非常に弱いようです。ほとんどの時系列データで、毎週同じ時間、または毎日同じ時間の相関の可能性が高くなっています。
thekingoftruth 2016年

1

すでにデータ内に存在することがわかっている(または信じている)関係を使用して、時系列から複数の入力特徴を作成することをお勧めします。たとえば、ターゲットの出力が異なると述べたとします。

朝と夕方、平日と夏と冬、...

では、これらの「サイクル」のそれぞれを説明する一連の機能を作成してみませんか。これは、すべてを説明する単一の機能ではなく、ミクロとマクロの両方のバリエーションを理解するのに役立ちます。

例えば...

1..241..16812,36,60...


ええ、これも私の最初のアイデアでした。しかし、時間の循環の概念(23:59の後に00:00が続く)は非表示になり、私を悩ませているもう1つのことは、一見整数の間にあるジャンプです-09:55のイベントは10:05に非常に似ています。しかし、朝の06:10は06:55と大きく異なります。時間の中心(光学系など?)を検索し、それらの中心までの距離を測定して与えることを想像できます。つまり、午前4時30分は最も深い夜ですが、午前5時30分は「朝」の方が多いですが、完全に夜とは異なります。
flaschenpost

1
その場合は、正弦波または余弦、あるいは実際には両方としてエンコードしてみることができます。
CatsLoveJazz 2016年
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.