パネルデータがある場合、時系列分類/回帰やパネル予測など、解決を試みることができるさまざまなタスクがあります。そして、各タスクには、それを解決するための数多くのアプローチがあります。
機械学習手法を使用してパネル予測を解決する場合、いくつかのアプローチがあります。
入力データ(X)、ユニット(国、個人など)をiidサンプルとして扱うと、次のことができます。
- 時系列をビニングし、各ビンを個別の列として扱い、時間順を無視して、すべてのユニットに同じビンを使用します。もちろん、ビンサイズは、単に観測された時系列測定値にするか、アップサンプリングしてより大きなビンに集約することができます。表形式のデータには標準の機械学習アルゴリズムを使用し、
- または各ユニットの時系列から特徴を抽出し、抽出された各特徴を個別の列として使用し、再び標準の表アルゴリズムと組み合わせて、
- または、連続時系列データまたはカテゴリカル時系列データのどちらを観察するかに応じて、特殊な時系列回帰/分類アルゴリズムを使用します。これには、時系列を時系列と比較する特別なカーネルを備えたサポートベクターマシンが含まれます。
出力データ(y)に関して、将来複数の時点を予測したい場合は、
- 常に同じ入力データを使用して、予測する先の各ステップに推定量を当てはめる、
- または、最初のステップの予測に単一の推定量を当てはめ、最初のステップの予測を使用して入力データを適時にロールし、観測された入力データに追加して2番目のステップの予測などを行います。
上記のアプローチはすべて、基本的にパネル予測の問題を時系列回帰または表形式回帰の問題に減らします。データが時系列または表形式の回帰形式になったら、ユーザーのために任意の時不変機能を追加することもできます。
もちろん、パネル予測の問題を解決する他のオプションもあります。たとえば、パネルデータに適応したARIMAなどの従来の予測方法や、シーケンス間予測を直接行うことを可能にするディープラーニング方法を使用するなどです。