予測モデルの応答変数が異なる場合に予測を組み合わせる方法は?


9

前書き

予測の組み合わせでは、人気のあるソリューションの1つは、いくつかの情報基準の適用に基づいています。モデルに対して推定された赤池基準を例にとると、からの差を計算でき、RP_j = e ^ {(AIC ^ *-AIC_j)/ 2}は次のように解釈できますモデルjの真の確率。重みは次のように定義されますCjjCjC=jCjRPj=eCCj/2j

wj=RPjΣjRPj

問題

私が克服しようとしている問題は、モデルが異なるように変換された応答(内因性)変数で推定されることです。たとえば、一部のモデルは年間成長率に基づいており、別のモデルは四半期ごとの成長率に基づいています。したがって、抽出されたCj値は直接比較できません。

試したソリューション

重要なのはCの違いだけなので、応答変数の変換に不変なベースモデルのC(たとえばlm(y~-1)、パラメーターなしでモデルを抽出しようとした)を使用して、j番目のモデルとベースモデルC。ただし、ここでは弱点が残っているようです。違い、応答変数の変換によって影響を受けます。

おわりに

「すべてのモデルを同じ応答変数で推定する」などのオプションは可能ですが、非常に時間がかかります。問題を解決する方法が他にない場合、苦痛な決定に行く前に、迅速な「解決策」を探したいと思います。

回答:


1

モデルを比較するための最も信頼できる方法の1つは、サンプル外の誤差(MAEなど)を交差検証することだと思います。リンゴとリンゴを直接比較するには、各モデルの外生変数の変換を解除する必要があります。


私はさらに時間がかかるアプローチのために残されていることを別の方法は、ベイツとグレンジャー(1969)に類似した重みを推定するために、ジャック・knifedエラーを使用することで、クレメンツとハーヴェイのような関連作品は組み合わせを予測し、包み込む(2007)。予測誤差ベースのアプローチの弱点は、情報(モデル)ベースのアプローチよりも平均的に劣ることです。ベイジアン平均化はトリッキーなので、有益な事前分布を持つBMAであると考えることができるより単純な方法を適用しようとしました。
Dmitrij Celov

最適なモデルを比較して選択したり、最適な予測の組み合わせ方法を検索したりしていないことに注意してください。異なる方法で変換された応答変数に基づくモデルのAICを比較するだけで問題が発生します
Dmitrij Celov

1
@Dmitrij Celov:では、なぜAICを比較するのですか?AICは、1対1の交差検証と漸近的に同等であることを覚えておいてください。したがって、どちらのメトリックの比較も類似していると思います。stats.stackexchange.com/a/587/2817
Zach

@DmitrijCelov:「予測誤差ベースのアプローチの弱点は、情報(モデル)ベースのアプローチよりも平均的に劣ることです。」どの点で劣っていますか?これについての引用や説明はありますか?直感は、このステートメントが間違っていると私に伝えますが、直感はしばしば間違っています...
Zach

G.Kapitanious et alのワーキングペーパー「予測の組み合わせ」と、イングランド銀行の一連の統計的予測手法の続きで、p。23「情報を組み合わせると予測を組み合わせると、一般に最適な予測が得られない」と書かれています。漸近的等価性は、マクロ経済データの少量のサンプルに含めたいものではありませんが、単純な方法の方が複雑な場合よりもパフォーマンスが優れている場合があります。単純に相互検証が2番目に優れたソリューションです。ジャックナイフは1週間以内、AICは1時間以内で製造されます。(私たちはチャットに行くかもしれません)
ドミトリ・セロフ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.