ネイト・シルバーが黄土について言ったことの説明


23

私が最近尋ね質問で、私はそれが黄土で外挿するのは大きな「ノー」だと言われました。しかし、Nate SilverのFiveThirtyEight.comに関する最新の記事では、選挙の予測に黄土を使用することについて議論しました。

彼はレスで積極的な予測と保守的な予測の詳細を議論していましたが、私はレスで将来の予測を行うことの妥当性について興味がありますか?

また、私はこの議論と、黄土と同様の利点があるかもしれない他の選択肢があることに興味があります。


x変数が時間の場合、黄土を使用して将来(データの範囲外)を予測するのは危険です。しかし、それは、より一般的に予測を行うために黄土を使用できないという意味ではありません。
Glen_b -Reinstateモニカ

好奇心から@Glen_b「もっと一般的に」私が予測できるものは何でしょうか?
a.powell

7
政党Aに投票する傾向がある人々の割合と失業率の間の非線形関係を想像してください(他の予測因子とともに-個々の州への影響など)。さらに、新しい失業率が利用可能になったと想像してください。トレーニングセットで経験した値の範囲内ですが、必ずしもそのセットで表される値ではありません(たとえば、過去の失業率は5〜12%であり、現在は8.3%の数字があり、安定していると予測されます)。次に、5-12%の失業率を超えることなく、黄土を使用して投票Aの割合を予測できます。
Glen_b -Reinstateモニカ

1
@Glen_bありがとう。これは、予測にどのように使用できるかを示す素晴らしい例です。
a.powell

回答:


28

低または低の問題は、多項式補間を使用することです。予測では、多項式のテールに不規則な振る舞いがあることがよく知られています。補間するとき、区分的3次多項式は、傾向の優れた柔軟なモデリングを提供しますが、観測されたデータの範囲を超えて外挿すると爆発します。時系列の後半のデータを観察した場合、適切に適合させるためにスプラインに別のブレークポイントを含める必要があります。

ただし、予測モデルは、文献の他の場所で十分に検討されています。カルマンフィルターや粒子フィルターなどのフィルタリングプロセスは、優れた予測を提供します。基本的に、良い予測モデルは、時間をモデルのパラメーターとして扱わず、予測を通知するために以前のモデル状態が使用されるマルコフ連鎖に基づくものです。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.