問題の数学モデルを定式化することは、統計の最も主観的な側面の1つですが、最も重要な側面の1つでもあります。この重要だが見過ごされがちなトピックに対処するための最良のリファレンスは何ですか?そして、どの有名な統計学者が「データがモデルを導くのか」という線に沿って何か言った。
問題の数学モデルを定式化することは、統計の最も主観的な側面の1つですが、最も重要な側面の1つでもあります。この重要だが見過ごされがちなトピックに対処するための最良のリファレンスは何ですか?そして、どの有名な統計学者が「データがモデルを導くのか」という線に沿って何か言った。
回答:
私の意見では、フランクハレルの「回帰モデリング戦略」は良い参考資料です。実際、これはおそらく私のお気に入りの統計書です。
私はこれまで本の半分未満しか研究していませんでしたが、たとえば、線形性、欠損データの複数の代入、およびブートストラップモデルの検証を回避するために、予測子をスプラインとして表すことで、多くの良いものを手に入れました。おそらく、この本の私のお気に入りは、重要な目標は、現在のデータだけを保持する結果ではなく、新しいデータで複製される結果を取得することであるという一般的なテーマです。
追加の利点は、フランクハレルのRパッケージrmsです。これにより、本で説明されている多くのことを簡単に実行できるようになり、彼はこことR-helpで質問に答える用意があります。
後者の声明は、シムズの批評の精神にあるようです((1980)Macroeconomics and Reality、Econometrica、1月、1〜48ページ)。
...経済的関係を推定するための理論なしの方法としてのVARモデルの使用を提唱しているため、構造モデルの「信じられないほどの識別制限」に代わるものです[wikiから]
しかし、おそらくS.Johansen(共和分分析の先駆者の1人)も同じ精神に従うことができます。私が教えられたことから、モデル構築シーケンスは次のようになります:
これがお役に立てば幸いです。
参照「データモデルを案内させるには」に起因することができ、ジョージEPボックスとGwilym M.ジェンキンス。彼らの古典的な教科書、時系列分析の第2章:予測と制御(1976)では、次のように述べられています。
自己相関関数とスペクトルのサンプル推定値の取得は、非構造的なアプローチであり、ヒストグラムによる経験的分布関数の表現に類似しています。ヒストグラムがデータの分布分析の最初のステップを提供できるのと同じように、これらは定常シリーズのデータを「自分自身に語らせる」両方の方法であり、時系列の分析の最初のステップを提供します。後続の分析の基礎となるいくつかのパラメトリックモデル。
Box&Jenkinsによって提唱されているように、データに話をさせるこのモデリング手順は、 ARIMAモデリングに関する文献全体で明らかに言及されています。たとえば、暫定的なARIMAモデルを特定することに関して、Pankratz(1983)は次のように述べています。
使用するデータについては、使用するモデルについて固定された先入観を持たないことに注意してください。代わりに、推定された自己相関関数と部分自己相関関数の形で、利用可能なデータを「話しかけ」させます。
したがって、「データガイドをモデルに任せる」という考え方は、時系列分析で広く使われている機能であると言えます。
ただし、同様の概念は他の(サブ)研究分野にも見られます。たとえば、@ Dmitrij Celovは、Christopher Simsの進路変更に関する記事Macroeconomics and Reality(1980)を正しく参照しています。
マクロ経済学の伝統的なアプローチは、マクロ理論を構築するためのガイドとして経済理論を使用することでした。多くの場合、モデルは数百の方程式で構成され、一部の係数の符号を事前に決定するなどの制限がモデルに課されます。Sims(1980)は、これをアプリオリな知識を使ってマクロ経済モデルを構築することが重要でした。
大規模なマクロ経済モデルが動的であるという事実は、偽の「アプリオリ」制限の豊富な原因です。
@Dmitrij Celovがすでに述べたように、Sims(1980)が提唱した代替アプローチは、(本質的に)変数自体の遅延値と他の変数の遅延値に基づくベクトル自己回帰方程式を指定することでした。
私は「データにそれ自体を語らせる」という概念のファンですが、この方法論を研究のすべての領域に完全に拡張できるかどうかはあまりわかりません。たとえば、特定の国の男性と女性の賃金率の違いを説明するために労働経済学の研究を行うことを検討してください。そのようなモデルで一連のリグレッサを選択することは、おそらく人的資本理論によって導かれるでしょう。他の状況では、一連のリグレッサは、私たちに何を興味があり、常識が私たちに伝えているかに基づいて選択できます。Verbeek(2008)さんのコメント:
統計的変数ではなく経済的引数に基づいて、潜在的に関連する変数のセットを選択することをお勧めします。それが別の方法で提案されることもありますが、統計的論拠は確実性論ではありません。
本当に大きなトピックなので、ここで表面をスクラッチすることしかできませんが、モデリングで遭遇した最良のリファレンスはGranger(1991)です。あなたの経歴が経済学でないなら、本のタイトルがあなたを先延ばしにさせないでください。ディスカッションの大部分は経済シリーズのモデル化のコンテキストで行われますが、他の分野の人がそれから多くを得て、それが役に立つと確信していると思います。
この本には、次のようなさまざまなモデリング手法に関する優れた議論が含まれています。
グレンジャー(1991)は実際には論文のコレクションであることは注目に値します。そのため、本のコピーを取得するのではなく、目次を調べて自分で記事を見つけることもできます。(以下のリンクを参照してください。)
これがお役に立てば幸いです!
参照: