変量効果はカテゴリ変数にのみ適用できますか?


9

この質問は愚かに聞こえるかもしれませんが... ランダムな効果はカテゴリ変数(個人ID、人口IDなど)にのみ適用できることは正しいです。たとえば、はカテゴリ変数です。xi

yiβxi

βxiNorm(μ,δ2)

しかし、原則から、ランダム効果は連続変数(高さ、質量など)に適用できませんと言います。zi

yiα+βzi

それでは、制約できない係数が1つしかないからです。論理的に聞こえるかもしれませんが、なぜそれが統計文献に記載されていないのでしょうか。ありがとう!β

EDIT:しかし、どのような場合、私制約よう〜?それはランダム効果ですか?しかし、これはに課した制約とは異なります -ここでは変数を制約しますが、前の例では係数を制約しました!それは私にとって大きな混乱のように見えます...とにかく、は既知の値であるため、この制約を置くことはあまり意味がありません。ziziNorm(μ,δ2)βxizi


1
興味深い関連質問:stats.stackexchange.com/q/61531/5509
好奇心が

回答:


5

これは良い基本的な質問です。

変量効果の解釈は非常にドメイン固有であり、モデリングの選択(統計モデル、またはベイズまたは頻度論者である)に依存します。非常によい議論については、245ページ、Gelman and Hill(2007)を参照してください。ベイジアンの場合、すべてがランダムであり(パラメーターに真の固定値が設定されていても、それらはランダムとしてモデル化されます)、頻繁に使用する場合は、パラメーター値を選択して、他の方法ではランダムとしてモデル化される固定効果にすることができます(Casellaを参照)。 2008、例3.2で修正またはランダム化されるブロックに関する議論。

編集(コメント後)

観察後、データを確定します。連続している場合は、連続としてモデル化する必要があります。カテゴリー変数は、カテゴリー変数として、時には連続変数として(通常の変数設定のように)モデル化できます。パラメータは不明であり、固定またはランダムとしてモデル化される場合があります。パラメータは基本的に応答を予測子に関連付けます。個々の予測子の勾配(または線形モデルの係数)を応答ごとに変化させる場合は、ランダムにモデル化し、そうでない場合は固定としてモデル化します。同様に、グループに関して切片を変化させる場合は、ランダムにモデル化する必要があります。それ以外の場合は修正する必要があります。


1
回答ありがとうございます。うーん....簡単な質問をして、どういうわけか単純または一般的な答えを期待しました:) 2番目の段落で、ベイジアンではすべてがランダムであると述べています。過度に複雑にしないでください:)モデルレベルで意図的に尋ねました。頻出主義者やベイジアンについては忘れてください-原則に興味があります- ランダム効果が通常使用される変数のタイプはどれですか?
好奇心が

3番目の段落では、時系列を使用して特別なアプリケーションを配置しましたが、よくわかりませんが、シリアル相関について話すと、AFAIK時系列は通常、離散的(連続的ではありません)です。答えて、シェアしてください。繰り返しますが、回答ありがとうございます!
好奇心が

ランダム性は未知のものです。あなたが観察したとき、それらは知られています!あなたが知っている唯一のことはあなたのデータです。未知数はパラメータであり、ランダムまたは固定としてモデル化される場合があります。(混乱して申し訳ありません。同意しますが、私は不必要に物事を複雑にしました。)
suncoolsu

あなたの答えを単純化してくれてありがとう。だから私の質問の根源に来る-これは答えがyesであることを意味します、つまりランダム効果はパラメーター(データではなく)とモデル化できる唯一のパラメーターにのみ適用されるため、変量効果はカテゴリー変数にのみ適用されます複数のレベルを持つもの、つまりカテゴリ変数のレベルはランダムですか?そして、連続変数のパラメーター値は1つしかないので、連続変数のパラメーターはランダムとしてモデル化できませんか?ありがとう!
好奇心が

特定の設定では、答えはYESです。しかし、一般的には答えはノーだと思います。連続変数はグループによって異なるためです。たとえば、市の居住者の収入は村より高くなければなりません(これによると、これは場所の2つの別個のカテゴリ変数である可能性があります)。
suncoolsu 2011

3

あなたの質問はすでに解決されているかもしれませんが、実際には教科書に書かれています。

変量効果は、そのレベルがそれ自体に関心がある固定効果とは対照的に、レベルがより大きな母集団からのサンプルとして表示されるカテゴリ変数です。

232ページ:アラン・グラフェンとロージー・ヘイルズ(2002)「生命科学の現代統計」、オックスフォード大学出版局。


2
これはすべて本当ですが、これが質問に答えるとは思いません。
Patrick Coulombe、2015年

1
@PatrickCoulombeによる上記のコメントには同意しません。これは質問に対する正確な回答だと思います。+1。
amoeba

1

問題は、ここで2つのことが関係していることだと思います。変量効果の典型的な例は、高校生の間の一連のテストでの平均スコアを含むいくつかの要因に基づいて大学生の成績平均点(GPA)を予測することです。

平均スコアは継続的です。通常、各個人の平均スコアには、変化する切片、または切片と勾配があります。個人は明らかに断定です。

したがって、「カテゴリ変数にのみ適用される」と言った場合、少しあいまいです。平均スコアのランダムな切片のみを検討するとします。この場合、連続量に対するランダムな切片は、実際には、手順によって決定される平均値と標準偏差をもつガウス変数のようなものとしてモデル化される可能性があります。ただし、このランダムな切片は、学生の母集団全体で決定され、各学生はカテゴリ変数によって識別されます。

学生IDの代わりに「連続」変数を使用できます。多分あなたは学生の身長を選ぶことができます。しかし、それは本質的にそれがカテゴリー的であるかのように扱われる必要があります。高さの測定値が非常に正確である場合、すべての生徒に固有の高さを返すため、違いは何もありません。身長の測定値があまり正確でない場合、複数の生徒を各身長でひとまとめにすることになります。(おそらく正しく定義されていない方法でスコアを混合する。)

これは、相互作用の逆のようなものです。相互作用では、2つの変数を乗算し、本質的に両方を連続として扱います。カテゴリー変数は、0/1のダミー変数のセットに分割され、0または1は、相互作用で他の変数に乗算されます。

結論として、「ランダム効果」は、ある意味では、固定値ではなく、分布を持つ(モデル化された)係数にすぎません。


編集するには、メインアカウントでログインしてください。
amoeba
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.