平均とサンプルサイズに関するOLS


8

与えられたモデル:

y=β0+β1f+u

ここで、はダミーで、女性の場合は、それ以外の場合はです。yは高さ(cm)です。サンプルサイズは、合計でです。さらにおよび。パラメータの推定値を計算します。f=10nfemale=nmale=100200y¯male=175y¯female=165

私の試み:

よく知られた公式を使用する:

β^=(XX)1Xy
取得:
[200100100100]1[170200165200]

最初に(\ boldsymbol {X} '\ boldsymbol {X})^ {-1}の要素。Xは1のまとまりな(XX)1ので、サンプルには100の女性があり、合計で200の男性と女性があります。ため\ boldsymbol {X} '\ boldsymbol {Y} 、最初の要素は、170の『総平均』であり、第二は、女性の高さのちょうどサンプル平均です。私は「ダウンスケール」(\ boldsymbol {X} '\ boldsymbol {X})^ {-1}していないため、両方とも200でスケーリングされています。XXy(XX)1

正しいですか?私が尋ねるのは、(乗算するときの)解がいくつかの(非常に)奇数になるためです。

回答:


7

アプローチは正しいですが、わずかな数値エラーがあります:ではなく女性しかありません。男性と女性の平均身長は、以下を介して合計に変換できます100200

Sum of male heights=100×175

そして

Sum of female heights=100×165.

したがって、すべての高さの合計は

Sum of all heights=100×175+100×165=200×170,

質問に示されているように。その結果、正規方程式は

(200100100100)(β^0β^1)=(200170100165)

(右側にではない )、ソリューションあり165200

(β^0,β^1)=(175,10).

なんというばかげた間違い...
Repmat

1
ばかげているとは思いません。それは当然のことです。問題が明らかになる前に、私は数分間質問を見つめなければなりませんでした...。
whuber

1

かなり混乱しています。何をしない意味ですか?これらは残差ですか?もしそうなら、それからu

XX =[200100100100]

以来

X=yβ=[y1β1y2β1...ynfβ1ynf+1β1ynf+2β1...ynnf+nmβ1y1β2y2β2...ynfβ2ynf+1β2ynf+2β2...ynnf+nmβ2]T

=

[11...111...100...011...1]T

いくつかの考え:

方程式を考えると、は175で、 = -10になります。だから男性と女性の部分のためにあなたは得ます:β1β2

fm=175(+)10×0+u=175+u

ff=175(+)10×1+u=165+u

使えるので

β=(XX)1XTy

Moore-Penrose Pseudoinverseを使用してを解きます。β

((XX)1XT)+β=((XX)1XT)+[17510]=y

今含まれています。y

y[165f1165f2...165f100175m1175m2...175m100]T

それが役に立てば幸い!


5
統計学者は通常、モデルの説明されていない部分にエラーという名前で使用しますが、計量経済学者はエラー、(一時的な)衝撃または妨害についてよく話します。それは単なる慣習的な表記法です。ϵu
ムゲン

1
@nali、これに少し追加できますか?あなたの数を考えると、システムのソリューションは意味をなさない。そして、はいuは残差です。
Repmat

@Repmat:私が最初に持っていたいくつかの考えを更新しました。それが役に立てば幸い。
nali 2015

@Repmat:多分あなたは私を誤解した。X '* yは[170 82.5] ^ Tではありません
nali
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.