ランダム効果と固定効果の解釈に関して、インターネット上で多くのことを発見しました。ただし、以下をピン留めするソースを取得できませんでした。
変量効果と固定効果の数学的な違いは何ですか?
つまり、モデルの数学的定式化とパラメーターの推定方法を意味します。
ランダム効果と固定効果の解釈に関して、インターネット上で多くのことを発見しました。ただし、以下をピン留めするソースを取得できませんでした。
変量効果と固定効果の数学的な違いは何ですか?
つまり、モデルの数学的定式化とパラメーターの推定方法を意味します。
回答:
ランダム効果のある最も簡単なモデルは、分布観測によって与えられるランダム効果のある一元配置分散分析モデルです:(Y I J | μ 私は)〜IID N(μ I、σ 2 Wは)、
ここで、ランダム効果はです。これらはランダム変数ですが、ANOVAモデルでは固定効果を持つ固定数です。
たとえば、研究所の3人の技術者それぞれが一連の測定値を記録し、は技術者番目の測定値です。、技術者生成したシリーズの「真の平均値」と呼びます。これは少し人工的なパラメータです。は、技術者が膨大な一連の測定値を記録した場合に得られる平均値として見ることができます。、Y 、I 、J、J 、I μ I I μ I I
(たとえば、演算子間のバイアスを評価するために)、、評価に興味がある場合は、固定効果のあるANOVAモデルを使用する必要があります。μ 2 μ 3
モデルを定義する分散および、および合計分散(以下を参照)に関心がある場合、変量効果を持つANOVAモデルを使用する必要があります。分散は1人の技術者によって生成された録音の分散であり(すべての技術者で同じであると想定されます)、は技術者間分散と呼ばれます。理想的には、技術者をランダムに選択する必要があります。 σ 2 B σ 2 B + σ 2 wの σ 2 wの σ 2 B
このモデルは、データサンプルの分散式の分解を反映しています。
合計分散=平均の分散内部分散の平均
これは、ランダム効果のあるANOVAモデルに反映されます。
実際、の分布は、与えられた条件付き分布と分布によって定義されます。1を計算の"無条件"分布場合我々は発見が。(Y I J)μ I μ I 、Y I jはY I J〜N(μ 、σ 2 B + σ 2 wの)
より良い写真については、スライド24とスライド25を参照してください(オーバーレイを理解するにはPDFファイルを保存する必要があります。オンラインバージョンは視聴しないでください)。
基本的に、因子をランダムにモデル化する場合の最も明確な違いは、効果は一般的な正規分布から引き出されると想定されることです。
たとえば、成績に関する何らかのモデルがあり、さまざまな学校からの生徒データを考慮に入れ、ランダムな要因として学校をモデル化する場合、これは学校ごとの平均が正規分布していると仮定することを意味します。これは、2つの変動要因がモデリングされていることを意味します。生徒の学年の学校内変動と学校間変動です。
これにより、部分プーリングと呼ばれるものが生じます。2つの極端な例を考えてみましょう。
両方のレベルで変動性を推定することにより、混合モデルはこれらの2つのアプローチ間の賢明な妥協を行います。特に、学校あたりの生徒数がそれほど多くない場合、モデル2によって推定される個々の学校の効果がモデル1の全体的な平均に向かって縮小することを意味します。
それは、モデルが2人の生徒を含む1つの学校があり、それが学校の人口にとって「正常」なものよりも優れている場合、この効果の一部は選択で幸運だった学校によって説明される可能性が高いからです見た2人の学生のうち。盲目的にこれを行うのではなく、学校内のばらつきの推定に応じて行います。これは、サンプル数の少ない効果レベルが、大規模な学校よりも全体平均に強く引き付けられることも意味します。
重要なことは、ランダム要素のレベルで交換可能性が必要なことです。つまり、この場合、学校は(あなたの知る限り)交換可能であり、あなたがそれらを区別するものは何も知らないことを意味します(何らかのIDを除く)。追加の情報がある場合は、これを追加の要素として含めることができますが、説明されている他の情報を条件として学校が交換可能であれば十分です。
たとえば、ニューヨークに住んでいる30歳の大人は性別を条件に交換可能であると想定するのは理にかなっています。より多くの情報(年齢、民族、教育)がある場合は、その情報も含めることは理にかなっています。
OTH 1つのコントロールグループと3つの大きく異なる疾患グループで研究している場合、特定の疾患は交換できないため、グループをランダムにモデル化することは意味がありません。しかし、多くの人々は収縮効果を非常に好んでいるため、ランダム効果モデルについてはまだ議論していますが、それは別の話です。
私は数学にあまり深く入り込んでいないことに気付きますが、基本的に違いは、ランダム効果モデルは学校のレベルと生徒のレベルの両方で正規分布の誤差を推定したのに対して、固定効果モデルには誤差があります学生のレベル。特に、これは、各学校に共通の分布によって他のレベルに接続されていない独自のレベルがあることを意味します。また、これは、固定モデルでは元のデータに含まれていない学校の生徒への外挿が許可されていないが、ランダム効果モデルではそうであり、生徒レベルと学校レベルの変動の合計である変動があることを意味します。可能性に特に興味があるなら、私たちはそれで働くことができます。
エコランドでは、このような影響は観測されない個人固有の切片(または定数)ですが、パネルデータを使用して推定することができます(同じユニットの繰り返し観測)。固定効果の推定方法により、ユニット固有の切片と独立した説明変数との相関が可能になります。ランダム効果はありません。より柔軟な固定効果を使用するコストは、時不変の変数(性別、宗教、人種など)の係数を推定できないことです。
NBその他のフィールドには独自の用語があり、かなり混乱する可能性があります。
標準ソフトウェアパッケージ(Rなどlmer
)では、基本的な違いは次のとおりです。
ベイジアンの場合(WinBUGSなど)、実際の違いはありません。
@Joke固定効果モデルは、研究(または実験)によって生成された効果サイズが固定されていることを意味します。つまり、介入の測定を繰り返すと同じ効果サイズになります。おそらく、実験の外部条件と内部条件は変更されません。さまざまな条件で多数の試験や研究を行っている場合、効果サイズは異なります。効果サイズのセットの平均と分散のパラメトリック推定は、これらが固定効果であるか、またはランダム効果(スーパーポピュレーションから実現)であると推定することで実現できます。数学的統計の助けを借りて解決できるのは問題だと思います。