モデリングに関する一般的なアドバイス

9

問題の数学モデルを定式化することは、統計の最も主観的な側面の1つですが、最も重要な側面の1つでもあります。この重要だが見過ごされがちなトピックに対処するための最良のリファレンスは何ですか？そして、どの有名な統計学者が「データがモデルを導くのか」という線に沿って何か言った。

modeling references

— charles.y.zheng
ソース

8

私の意見では、フランクハレルの「回帰モデリング戦略」は良い参考資料です。実際、これはおそらく私のお気に入りの統計書です。

私はこれまで本の半分未満しか研究していませんでしたが、たとえば、線形性、欠損データの複数の代入、およびブートストラップモデルの検証を回避するために、予測子をスプラインとして表すことで、多くの良いものを手に入れました。おそらく、この本の私のお気に入りは、重要な目標は、現在のデータだけを保持する結果ではなく、新しいデータで複製される結果を取得することであるという一般的なテーマです。

追加の利点は、フランクハレルのRパッケージrmsです。これにより、本で説明されている多くのことを簡単に実行できるようになり、彼はこことR-helpで質問に答える用意があります。

— mark999
ソース

3

（+1）EW Steyerbergによる臨床予測モデル（特に臨床転帰に関心のある人向け）は、優れた教科書です。

— 11

@chl提案をありがとう。私はその本を聞いたことがなかったので、それを見てみたいと思います。

— mark999 2011

2

@ user152509私の知る限り、電子コピーを配布することは違法です。書籍を購入できない場合、または図書館から入手できない場合は、Googleブックスで書籍の一部を見ることができます。ヴァンダービルト生物統計局のWebページに関連リソースがあります。

— mark999 2011

6

後者の声明は、シムズの批評の精神にあるようです（（1980）Macroeconomics and Reality、Econometrica、1月、1〜48ページ）。

...経済的関係を推定するための理論なしの方法としてのVARモデルの使用を提唱しているため、構造モデルの「信じられないほどの識別制限」に代わるものです[wikiから]

しかし、おそらくS.Johansen（共和分分析の先駆者の1人）も同じ精神に従うことができます。私が教えられたことから、モデル構築シーケンスは次のようになります：

モデルの主な目的を明確にする：予測、構造的関係（シミュレーション）、因果関係、潜在的要因など。
抽象モデルは、アプリケーションで完全にカバーするには「現実すぎる」可能性がある現実の世界ですが、何が起こっているかについての感覚（または理解）を与えます
口頭モデルは、いくつかの理論をもたらすか、またはあなたの理解をテストされるステートメントと仮説に翻訳します。このステップでは、経験的（時には様式化されたと呼ばれる）事実が収集されます
数学モデルでは、方程式（差分、微分）の形式で理論を定式化できるようになりました。このようなモデルは、多くの場合、決定論的である必要があります（このステップを後者とマージして、たとえば確率微分方程式を検討することができます）。したがって、必要です。 ..
確率論的部分を追加した計量経済（統計）モデル、応用統計の理論と方法、確率理論、ミクロ計量経済学とマクロ計量経済学。

これがお役に立てば幸いです。

— ドミトリ・セロフ
ソース

1

「シム」や「ヨハンセン」の参照はありますか？ありがとう！

— charles.y.zheng 2011

2

参照「データモデルを案内させるには」に起因することができ、ジョージEPボックスとGwilym M.ジェンキンス。彼らの古典的な教科書、時系列分析の第2章：予測と制御（1976）では、次のように述べられています。

自己相関関数とスペクトルのサンプル推定値の取得は、非構造的なアプローチであり、ヒストグラムによる経験的分布関数の表現に類似しています。ヒストグラムがデータの分布分析の最初のステップを提供できるのと同じように、これらは定常シリーズのデータを「自分自身に語らせる」両方の方法であり、時系列の分析の最初のステップを提供します。後続の分析の基礎となるいくつかのパラメトリックモデル。

Box＆Jenkinsによって提唱されているように、データに話をさせるこのモデリング手順は、 ARIMAモデリングに関する文献全体で明らかに言及されています。たとえば、暫定的なARIMAモデルを特定することに関して、Pankratz（1983）は次のように述べています。

使用するデータについては、使用するモデルについて固定された先入観を持たないことに注意してください。代わりに、推定された自己相関関数と部分自己相関関数の形で、利用可能なデータを「話しかけ」させます。

したがって、「データガイドをモデルに任せる」という考え方は、時系列分析で広く使われている機能であると言えます。

ただし、同様の概念は他の（サブ）研究分野にも見られます。たとえば、@ Dmitrij Celovは、Christopher Simsの進路変更に関する記事Macroeconomics and Reality（1980）を正しく参照しています。

マクロ経済学の伝統的なアプローチは、マクロ理論を構築するためのガイドとして経済理論を使用することでした。多くの場合、モデルは数百の方程式で構成され、一部の係数の符号を事前に決定するなどの制限がモデルに課されます。Sims（1980）は、これをアプリオリな知識を使ってマクロ経済モデルを構築することが重要でした。

大規模なマクロ経済モデルが動的であるという事実は、偽の「アプリオリ」制限の豊富な原因です。

@Dmitrij Celovがすでに述べたように、Sims（1980）が提唱した代替アプローチは、（本質的に）変数自体の遅延値と他の変数の遅延値に基づくベクトル自己回帰方程式を指定することでした。

私は「データにそれ自体を語らせる」という概念のファンですが、この方法論を研究のすべての領域に完全に拡張できるかどうかはあまりわかりません。たとえば、特定の国の男性と女性の賃金率の違いを説明するために労働経済学の研究を行うことを検討してください。そのようなモデルで一連のリグレッサを選択することは、おそらく人的資本理論によって導かれるでしょう。他の状況では、一連のリグレッサは、私たちに何を興味があり、常識が私たちに伝えているかに基づいて選択できます。Verbeek（2008）さんのコメント：

統計的変数ではなく経済的引数に基づいて、潜在的に関連する変数のセットを選択することをお勧めします。それが別の方法で提案されることもありますが、統計的論拠は確実性論ではありません。

本当に大きなトピックなので、ここで表面をスクラッチすることしかできませんが、モデリングで遭遇した最良のリファレンスはGranger（1991）です。あなたの経歴が経済学でないなら、本のタイトルがあなたを先延ばしにさせないでください。ディスカッションの大部分は経済シリーズのモデル化のコンテキストで行われますが、他の分野の人がそれから多くを得て、それが役に立つと確信していると思います。

この本には、次のようなさまざまなモデリング手法に関する優れた議論が含まれています。

David Hendryが提唱した、一般から特定へのアプローチ（またはLSE手法）。
特定から一般へのアプローチ。
エドワードリーマーの方法論（通常、「感度（または極限）分析」および「ベイジアン」という用語に関連付けられています）。
偶然にも、クリストファーシムズのアプローチもカバーされています。

グレンジャー（1991）は実際には論文のコレクションであることは注目に値します。そのため、本のコピーを取得するのではなく、目次を調べて自分で記事を見つけることもできます。（以下のリンクを参照してください。）

これがお役に立てば幸いです！

参照：

Box、GE、およびJenkins、GM（1976）。時系列分析：予測と制御。時系列分析におけるHolden-Dayシリーズ。
グレンジャー、CW（編集）。（1991）。経済シリーズのモデリング：計量経済学的方法論の読み。オックスフォード大学出版局。
Pankratz、A.（1983）単変量Box–Jenkinsモデルによる予測：概念と事例。ニューヨーク：John Wiley＆Sons。
シムズ、カリフォルニア（1980）。マクロ経済学と現実。Econometrica、48（1）、1-48。
Verbeek、M.（2008）。現代計量経済学へのガイド。ワイリー。

— グレイム・ウォルシュ
ソース