混合モデルで因子をランダムとして扱うことの利点は何ですか?


24

いくつかの理由で、モデルファクターをランダムとしてラベル付けすることの利点を受け入れるのに問題があります。私には、ほとんどすべての場合、最適な解決策はすべての要因を固定として扱うことのように見えます。

まず、固定とランダムの区別は非常にarbitrary意的です。標準的な説明では、特定の実験ユニット自体に興味がある場合は固定効果を使用し、実験ユニットによって表される母集団に興味がある場合はランダム効果を使用する必要があります。これは、データと実験デザインが同じままであっても、固定ビューとランダムビューを交互に切り替えられることを意味するため、あまり役に立ちません。また、この定義は、因子がランダムとしてラベル付けされている場合、モデルから引き出された推論は、因子が固定としてラベル付けされている場合よりも母集団により何らかの形で適用できるという幻想を促進します。最後に、ゲルマンは、固定ランダムな区別が混乱していることを示しています 定義レベルでも、固定効果とランダム効果の定義がさらに4つあるためです。

第二に、混合モデルの推定は非常に複雑です。「完全に固定された」モデルとは対照的に、p値を取得する方法はいくつかあります。 。

第三に、ランダムな要因によっていくつの暗黙的なパラメータが導入されるかという不透明な問題があります。次の例は、Burnham&Andersonのモデル選択とマルチモデル推論:実用的な情報理論的アプローチでの私の適応です。バイアスと分散のトレードオフの観点から、ランダム効果の役割は次のように説明できます。処理と主因子効果を持つ一元配置分散分析を検討してくださいは推定可能です。エラー項には分布があります。観測値の数が固定されている場合、バイアス分散のトレードオフは、が上がるにつれて低下します。我々はと言うと仮定K K - 1 N0 σ 2K KKKK1N0σ2KK主効果は分布から引き出されます。対応するモデルは、固定(オーバーフィット)バージョンとインターセプトのみを含むアンダーフィットモデルの中間の複雑さを持ちます。固定モデルの有効なパラメーターの数はN0σK

1ntercept+K1maneffects+1σ=K+1。

ランダムモデルの有効なパラメーターの数は、少なくとも3つです:。さらに、ランダムモデルには、主効果に課せられる分布(この場合は通常)制限によって暗示されるいくつかの「隠された」パラメーターがあります。nterceptσσK

特に、2つのレベルの因子がある場合、そのレベルが特定の母集団からランダムにサンプリングされていることが確実であっても、ランダムと呼ぶことは意味がありません。これは、固定効果バージョンには3つのパラメーターがあり、ランダム効果バージョンには3つ以上のパラメーターがあるためです。この場合、ランダムモデルは固定バージョンよりも複雑になります。明らかに、固定バージョンからランダムバージョンへの切り替えは、より大きなK。ただし、ランダムモデルの「非表示」パラメーターの数は不明であるため、AICなどの情報基準に基づいて固定バージョンとランダムバージョンを比較することはできません。したがって、この例では、ランダム効果の影響(バイアス分散トレードオフの可能性)を示していますが、因子を固定からランダムに再ラベル付けするのが妥当であると言うのが難しいことも示しています。

上記の問題はいずれも「純粋に修正された」モデルには存在しません。したがって、私は尋ねたい:

  1. ランダムな要因が修正されたかのように使用されたときに非常に悪いことが起こった場合、誰でも例を提供できますか?この問題に明示的に対処するシミュレーション研究がいくつかあるはずです。

  2. 固定ラベルからランダムラベルに切り替えるのが理にかなっていることを判断する実証済みの定量的方法はありますか?


よく書かれた質問。私はそれを読んでいくつかのことを学びました。ランダム効果分析は長期的には運命づけられているのだろうか、おそらくもっと簡単なスムージング技術で打ち負かされるのだろうか。#1に答えようとすると、ばらつきが大きく、被験者が多く、被験者内のサンプルサイズが小さい状況になります。その後、被験者内の固定推定値はあちこちにあります。
ベンオゴレク14

回答:


20

1.心理学と言語学の有名な例は、ハーブクラーク(1973;コールマン、1964年に続く)によって記述されています:「固定効果としての言語の誤acy:心理学研究における言語統計の批判」。

クラークは心理学実験について議論する心理言語学者であり、そこでは被験者のサンプルが一連の刺激資料、一般的にはいくつかのコーパスから引き出されたさまざまな単語に反応します。彼は、反復測定ANOVAに基づいてこれらのケースで使用され、クラークによってと呼ばれる標準的な統計手順は、参加者をランダムな要因として扱いますが、(おそらく暗黙的に)刺激資料(または「言語」)を一定。これは、実験条件因子に関する仮説検定の結果を解釈する際に問題につながります。当然、肯定的な結果は、参加者サンプルを引き出した母集団と、引き出した理論母集団の両方について何かを教えてくれると仮定したいです。言語資料。しかし、F1F1、参加者をランダムとして、刺激を固定として扱うことにより、まったく同じ刺激に反応する他の同様の参加者全体の条件因子の効果についてのみ伝えます。導電性参加者と刺激の両方をより適切にランダムとみなされる場合に分析することは、実質的に公称超える1エラーレート入力につながる可能性が通常0.05 - -レベルの範囲は、このような数の変動などの要因に依存して刺激と実験計画。これらの場合、少なくとも古典的なANOVAフレームワークの下で、より適切な分析は、平均二乗の線形結合の比率に基づく準統計と呼ばれるものを使用することです。F1αF

クラークの論文は、当時の心理言語学に大きな影響を与えましたが、より広い心理学の文献で大きな凹みを作ることに失敗しました。(そして、心理言語学の中でさえ、Raaijmakers、Schrijnemakers、およびGremmen、1999によって文書化されているように、クラークのアドバイスは長年にわたって幾分歪められました。)混合効果モデルでは、古典混合モデルANOVAは特殊なケースと見なすことができます。これらの最近の論文には、Baayen、Davidson、およびBates(2008)、Murayama、Sakaki、Yan、およびSmith(2014)、および(ahem)Judd、Westfall、およびKenny(2012)が含まれます。私は忘れているものがあると確信しています。

2.正確ではありません。因子がモデルにランダム効果として含まれているかどうかを取得する方法があります(たとえば、Pinheiro&Bates、2000、pp。83-87を参照してください。ただし、Barr、Levy、Scheepers、Tily、 2013)。そしてもちろん、因子が固定効果として含まれているかどうかを決定するための古典的なモデル比較手法があります(つまり、テスト)。しかし、因子が固定的またはランダムであると考えられるかどうかを判断することは、一般に概念的な質問として残すのが最善であり、研究のデザインとそこから導き出される結論の性質を考慮することによって答えられると思います。F

私の大学院の統計指導者の一人であるゲイリー・マクレランドは、おそらく、統計的推論の基本的な質問は「何と比較するか」だと言っていました。ゲイリーに続いて、上で述べた概念的な質問を次のように組み立てることができると思います。実際の観測結果と比較したい仮想実験結果の参照クラスは何ですか?心理言語学の文脈にとどまり、2つの条件のいずれかに分類される単語のサンプルに応答する被験者のサンプルがある実験計画を検討します(特定の設計は1973年にクラークによって詳細に議論されました)。 2つの可能性:

  1. 各実験に対して、被験者の新しいサンプル、単語の新しいサンプル、生成モデルからのエラーの新しいサンプルを描画する一連の実験。このモデルでは、件名と単語はどちらもランダムな効果です。
  2. 実験ごとに、被験者の新しいサンプルとエラーの新しいサンプルを描画する実験のセットですが、常に同じWordのセットを使用します。このモデルでは、被験者はランダムな効果ですが、単語は固定効果です。

これを完全に具体化するために、モデル1での4つのシミュレートされた実験からの(上記の)4セットの仮想結果からのプロットを以下に示します。(下)モデル2での4つのシミュレーション実験からの4組の仮想結果。各実験は2つの方法で結果を表示します。(左パネル)被験者ごとにグループ化し、被験者ごとに被験者ごとにプロットし、結び付けます。(右側のパネル)単語ごとにグループ化され、各単語の応答の分布を要約したボックスプロットがあります。すべての実験には、10個の単語に応答する10人の被験者が含まれ、すべての実験で、条件の違いがないという「帰無仮説」は関連する母集団に当てはまります。

被験者と単語は両方ともランダム:4つのシミュレートされた実験

both_random

ここでは、各実験で、被験者と単語の応答プロファイルがまったく異なることに注意してください。被験者については、全体的なレスポンダーが低くなる場合があり、レスポンダーが高い場合があり、状態の違いが大きくなる傾向のある被験者と、状態の違いが小さい傾向のある被験者がいます。同様に、言葉についても、低い反応を引き出す傾向のある言葉が得られたり、高い反応を引き出す傾向のある言葉が得られることがあります。

被験者ランダム、単語修正:4つの実験のシミュレーション

subs_random

ここで、4つのシミュレートされた実験全体で被験者は毎回異なって見えますが、Wordの応答プロファイルは基本的に同じに見えます。

モデル1(被験者と単語はランダム)またはモデル2(被験者はランダム、単語は固定)と考えるかどうかの選択は、実際に観察した実験結果に適切な参照クラスを提供し、条件操作の評価に大きな違いをもたらすことができます「働いた。」「可動部品」が多いため、モデル2よりもモデル1の方がデータのチャンスの変動が大きいと予想されます。したがって、導きたい結論が、モデル1の仮定とより一貫性があり、チャンスの変動性が比較的高い場合、モデル2の仮定の下でデータを分析すると、チャンスの変動性は比較的低く、タイプ1エラー条件の差をテストするためのレートは、ある程度(おそらく非常に大きく)膨らまされます。詳細については、以下の参照を参照してください。

参照資料

Baayen、RH、Davidson、DJ、およびBates、DM(2008)。被験者とアイテムの交差ランダム効果による混合効果モデリング。記憶と言語のジャーナル、59(4)、390-412。PDF

Barr、DJ、Levy、R.、Scheepers、C。、およびTily、HJ(2013)。確認仮説検定のランダム効果構造:最大に保ちます。Journal of Memory and Language、68(3)、255-278。PDF

クラーク、HH(1973)。固定効果としての言語の誤acy:心理学的研究における言語統計の批判。言語学習と言語行動のジャーナル、12(4)、335-359。PDF

コールマン、EB(1964)。言語集団への一般化。Psychological Reports、14(1)、219-226。

Judd、CM、Westfall、J。、およびKenny、DA(2012)。社会心理学における刺激をランダムな要因として扱う:広範だが無視された問題に対する新しく包括的な解決策。人格や社会心理学誌、103(1)、54 PDF

村山健一郎、,真紀、ヤン、VX、スミス、GM(2014)。メタメモリの精度に対する従来の参加者別分析のタイプIエラーインフレ:一般化された混合効果モデルの観点。実験心理学のジャーナル:学習、記憶、および認知。PDF

Pinheiro、JC、およびBates、DM(2000)。SおよびS-PLUSの混合効果モデル。スプリンガー。

Raaijmakers、JG、Schrijnemakers、J。、およびGremmen、F。(1999)。「固定効果としての言語の誤acy」に対処する方法:一般的な誤解と代替ソリューション。Journal of Memory and Language、41(3)、416-426。PDF


1
+1これは素晴らしい答えであり、2012年の論文は非常に良い読み物です。
アメーバは、モニカを復活させる14

元の質問はすでにこれにつながる優れた議論にリンクしているので、正確に何を言及していますか?
ジェームズ14

1
ゲルマンリンク
ジェイクウェストフォール14

@ジェームズ私は先に進み、いくつかの写真を含むいくつかの概念的なものを追加しました。どう考えているか教えてください。
ジェイクウェストフォール14

写真をありがとう。最後の段落によると、モデル内のランダムなラベルが付けられるほど、残りの固定効果のp値が高くなります。ただし、追加モデルの場合、PROC MIXEDでデフォルトの「包含」メソッドが使用されると、固定効果のp値は同じになります。特定の例はこの質問にあります:stats.stackexchange.com/q/112640/54099どのように説明できますか?
ジェームズ14

1

いくつかの異なる機械で材料を製造する製造プロセスがあるとします。それらは私が持っている唯一のマシンなので、「マシン」は固定効果です。しかし、私は各マシンで多くの材料を作成し、将来のロットについての予測に興味があります。将来のロットで得られる結果に興味があるので、「ロット番号」をランダムな要素にします。


1
親愛なるエミール:私が尋ねた質問を理解できなかったのではないかと思います。あなたの例は、私自身が質問で提供した「固定vsランダム」の最も一般的な定義を示しています。とにかく、例を使用して、ロット番号が固定要素であるモデルから将来の応答について推論するのが悪い考えである理由を教えてもらえますか?
ジェームズ14

「ロット番号」を固定として扱う場合、推測はすでにテストしたロットにのみ適用されます。他の状況では、同じようなことが起こります。ランダム効果について推論したい場合、それらを固定効果として扱うと、一般的に間違った答えが得られます。多くの混合モデルの状況では、ランダム効果を固定効果として扱うと、実際に固定されている効果に関する誤った答えさえ与えられます。
エミール・フリードマン14

それは逆さまの問題ではありません。不適切な分析を行うと、結果は通常不正確になります。
エミール・フリードマン14

固定/ランダムラベルによって結果がどのように不正確になるかを示すシミュレーションスタディのリファレンスを提供できますか?
ジェームズ14

また、特に分散コンポーネントが存在する場合、MLEは無料で提供されないことに注意してください。3つの因子といくつかの継続的な共変量を含む交差要因計画を設定してみてください。次に、純粋な固定モデルといくつかの混合仕様を推定してみてください。OLSからMLE / REMLへの切り替えを引き起こすランダムなコンポーネントがある限り、収束、ゼロまたは負の分散コンポーネントの取得、またはその他の無意味な結果の問題が発生する可能性が高くなります。
ジェームズ

1

したがって、全体の平均と、因子のサンプルサイズと観測の全体数に基づいた特定の因子の平均との間に平均化効果が存在するように、それらをランダムとして扱います。これにより、加重平均のタイプとその要因による変動の推定値があるため、結果が母集団全体に適用されると言うことができます。そうでない場合、実際には結果は要因レベルにのみ適用されると言うことができます回帰では、加重平均を取得するランダムな因子ではなく、離散的な因子として扱われるため、使用しました。

また、同じサブジェクトのメジャー間の相関関係を説明するために使用できるため、同じサブジェクトのメジャーを繰り返し使用する場合にも役立ちます。


RMに関しては、そもそも私が質問をした理由の1つです。ここで述べたように:stats.stackexchange.com/q/112640/54099件名を固定またはランダムとして扱っても、治療のp値は変わらないので、なぜ気にしますか。
ジェームズ

1つの因子を固定し、1つの乱数を使用した単純な交差計画があり、期待平均二乗を使用する場合、固定因子のp値は、両方を固定として扱う場合の値とは異なります。
エミール・フリードマン14

1

Yj=β1バツj+β2Z+e+μjバツjZβ2ZZ

Yj=β1バツj+e+μjZ

β1β1


(元の回答)

ランダム効果を使用することが本質的に必要な場所の1つは、固定効果のグループ化レベルで不変のパラメーターを含める場合です。

たとえば、患者の転帰に対する医師の特性(教育など)の影響を調査するとします。データセットは、患者のアウトカムと患者/医師の特性が観察された患者レベルです。一人の医師の下で治療される患者は相関している可能性が高いため、これを制御する必要があります。ここに医師の固定効果を挿入することもできますが、その場合、モデルに医師の特徴を含めることはできません。医師レベルの特性に関心がある場合、これは問題です。


モデルステートメントを提供していただけますか?
ジェームズ14

0

推定値の一貫性に関係していると思います。

バツj=a+bj+ea

bj

ネイマンとスコット(1948)は、の一貫性の問題を指摘しています

abj

abj

一貫しています。少なくとも、それは私が理解した方法です...

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.