パネルデータの機械学習アルゴリズム


12

この質問では- 構造化/階層的/マルチレベル予測子を考慮に入れる決定木を構築する方法はありますか?-彼らは木のパネルデータメソッドに言及しています。

ベクターマシンとニューラルネットワークをサポートするための特定のパネルデータメソッドはありますか?もしそうなら、アルゴリズムとそれを実装するRパッケージ(利用可能な場合)のいくつかの論文を引用できますか?


1
これに何を使うことにしたのかしら。同様の問題を解決しようとしています。
user0 2017年

回答:


1

LSTM(Long Short Term Memory)が関連しているかもしれません。このタイプのモデルは、複数の時点で複数の機能を処理でき、パネルデータに適合します。ここ LSTMの概念に非常に素晴らしい説明があり、そしてここで LSTMのRのバージョンを実装したパッケージです。


0

パネルデータがある場合、時系列分類/回帰やパネル予測など、解決を試みることができるさまざまなタスクがあります。そして、各タスクには、それを解決するための数多くのアプローチがあります。

機械学習手法を使用してパネル予測を解決する場合、いくつかのアプローチがあります。

入力データ(X)、ユニット(国、個人など)をiidサンプルとして扱うと、次のことができます。

  • 時系列をビニングし、各ビンを個別の列として扱い、時間順を無視して、すべてのユニットに同じビンを使用します。もちろん、ビンサイズは、単に観測された時系列測定値にするか、アップサンプリングしてより大きなビンに集約することができます。表形式のデータには標準の機械学習アルゴリズムを使用し、
  • または各ユニットの時系列から特徴を抽出し、抽出された各特徴を個別の列として使用し、再び標準の表アルゴリズムと組み合わせて、
  • または、連続時系列データまたはカテゴリカル時系列データのどちらを観察するかに応じて、特殊な時系列回帰/分類アルゴリズムを使用します。これには、時系列を時系列と比較する特別なカーネルを備えたサポートベクターマシンが含まれます。

出力データ(y)に関して、将来複数の時点を予測したい場合は、

  • 常に同じ入力データを使用して、予測する先の各ステップに推定量を当てはめる、
  • または、最初のステップの予測に単一の推定量を当てはめ、最初のステップの予測を使用して入力データを適時にロールし、観測された入力データに追加して2番目のステップの予測などを行います。

上記のアプローチはすべて、基本的にパネル予測の問題を時系列回帰または表形式回帰の問題に減らします。データが時系列または表形式の回帰形式になったら、ユーザーのために任意の時不変機能を追加することもできます。

もちろん、パネル予測の問題を解決する他のオプションもあります。たとえば、パネルデータに適応したARIMAなどの従来の予測方法や、シーケンス間予測を直接行うことを可能にするディープラーニング方法を使用するなどです。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.