データの平均化とフィッティング、データのフィッティングと平均化の違い


10

ある場合は、線を複数の個別の「実験」にフィッティングした後、フィッティングを平均化するか、個別の実験からのデータを平均化してから、平均データをフィッティングします。詳しく説明します。

以下に示す曲線を生成するコンピュータシミュレーションを実行します。量を抽出し、プロットの線形領域に当てはめることにより(長い時間)、それを "A"と呼びます。値は単に線形領域の勾配です。もちろん、この線形回帰に関連するエラーがあります。

通常、これらのシミュレーションをさまざまな初期条件で100回ほど実行して、「A」の平均値を計算します。(下のプロットの)生データを平均して10のグループにまとめ、「A」に適合させ、それらの10の「A」を平均するほうがよいと言われています。

これにメリットがあるのか​​、それとも100個の "A"値をフィッティングして平均するよりも良いのか、私には直観がありません。

データ


私は確かに私は理解していることはないです:あなたは、異なる時点でAを測定し、その後、あなたは推定?そして、あなたはこれを数回行うと、あなたはすべての平均取るβ 1をA=β0+β1tβ1

申し訳ありません。上のプロットは、単一のシミュレーションの結果です(実験と呼びましょう)。最初の非線形領域は破棄されます。次に、直線部分に直線を当てはめ、勾配 "A"を取得します。したがって、シミュレーション全体で「A」の単一の推定値が得られます。もちろん、私の質問は、多くのプロットを平均してからAを計算することが、一連のプロットに対して単にAを計算して平均することとは異なるかどうかに関係しています。それが明確になることを願っています。
pragmatist1

1
これが違いを生む理由がわかりませんか?(線形回帰の仮定が満たされている場合)

実験がそれぞれ小さいため、フィッティングは決してうまくいかず、収束せず、ばかばかしく急な推定を与えないと思いますか?これは、最初の(または階層モデル)を組み合わせると役立つ可能性があります。
ビョルン

1
また、すべてのデータを一緒に当てはめることもできますが、線形混合モデルアプローチのように、実験を区別するためのある種のコンポーネント(実験ごとに異なる切片、または異なる勾配さえ)を含めることができます。このようにして、全体的な勾配を概算できますが、「バッチ」効果や実験間の差異を識別できます
bdeonovic

回答:


2

tit

  • 時系列平均の断面変動。
  • 断面変動の時系列平均。

一般的な答えはノーです。

セットアップ:

t

Tn(Xt,yt)

Y=[y1y2yn]X=[X1X2Xn]

はめあいの平均:

1Ttbt=1Tt(XtXt)1Xtyt=1TtSt1(1nixt,iyt,i)where St=1nixt,ixt,i

平均の適合:

これは一般に、時系列平均の断面変動に基づく推定(つまり、推定量の間)とは異なります。

(1nix¯ix¯i)11nix¯iy¯i

x¯i=1Ttxt,i

プールされたOLSの見積もり:

b^=(XX)1XY=(1nTtXtXt)1(1nTtXtyi)
bt=(XtXt)1Xtyi
=(1nTtXtXt)1(1nTtXtXtbt)

S=1nTiXXSt=1nXtXtE[xx]t

b^=1Tt(S1St)bt

bt

特殊なケース:右側の変数は時間不変で会社固有です

iXt1=Xt2t1t2S=Stt

b^=1Ttbt

楽しいコメント:

これはFamaとMacbethの事例であり、企業が市場(または他の因子負荷)との共分散によって予想されるリターンがどのように変化するかを推定するときに、断面推定を平均するこの手法を適用して一貫した標準誤差を取得した場合です。

Fama-Macbethの手順は、エラー条件が断面的に相関しているが時間に依存しない場合に、パネルコンテキストで一貫した標準エラーを取得する直感的な方法です。同様の結果をもたらすより現代的な手法は、時間どおりにクラスタリングすることです。


1

(注:私にはコメントするのに十分な評判がないので、これを回答として投稿しています。)

y¯[x]=y[x]yxy1[x1]=y2[x1]=2y1[x2]=1y1[x2]=3y¯[x1]=y¯[x2]=2x1x2

ほとんどの科学ソフトウェアプラットフォームには、真の「オンライン」最小二乗適合(再帰的最小二乗と呼ばれる)を計算/更新するツールが必要です。したがって、すべてのデータを使用できます(これが望ましい場合)。


1
fcopが投稿した回答が削除されました。あなたはあなたの答えを少し修正したいと思うかもしれません
Glen_b-モニカを復活させる'30
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.