フォローアップ:混合ANOVA間ANOVAプロットでは、推定SEまたは実際のSEですか?


14

私は現在論文を書き終えており、昨日からこの質問につまずいたので、自分に同じ質問を投げかけることになりました。データからの実際の標準誤差または私のANOVAから推定された標準誤差をグラフに提供する方が良いでしょうか?
昨日からの質問はかなり具体的ではなく、私の質問はかなり具体的であるため、このフォローアップの質問を提示することが適切だと思いました。

詳細:
認知心理学の領域(条件付き推論)で実験を実行し、2つのグループ(帰納的および ductive的指示、つまり被験者間操作)を2つの被験者内操作(問題のタイプと問題の内容、それぞれ2つの因子レベル)。

結果は次のようになります(ANOVA出力からのSE推定値の左パネル、データから推定されたSEの右パネル): 代替テキスト
異なる線は2つの異なるグループ(つまり、被験者間操作)と、被験者の操作はx軸(つまり、2x2因子レベル)にプロットされます。

本文では、ANOVAのそれぞれの結果と、中央の重要なクロスオーバー相互作用の計画的な比較を提供します。SEは、データの変動性に関するヒントを読者に提供するためにあります。SDをプロットすることは一般的ではなく、被験者内および被験者間CIを比較する際に深刻な問題があるため、標準偏差および信頼区間よりもSEの方が好きです(同じことがSEにも当てはまるため、有意差を誤って推測することはそれほど一般的ではありません)それらから)。

私の質問を繰り返します:ANOVAから推定されたSEをプロットする方が良いのですか、それとも生データから推定されたSEをプロットすべきですか?

更新:
推定SEが何であるかをもう少し明確にすべきだと思います。SPSSのANOVA出力はestimated marginal means、対応するSEとCIを提供します。これが左のグラフにプロットされています。これを理解している限り、それらは残差のSDである必要があります。ただし、残差を保存する場合、SDは推定SEに多少なりとも近くありません。したがって、2番目の(潜在的にSPSS固有の)質問は次のとおり
です。これらのSEとは何ですか?


更新2:最終的に気に入ったのでプロットを作成できるR関数を作成することができました(受け入れられた回答を参照)。誰かに時間があれば、あなたがそれを見ることができれば本当に感謝します。ここにあります。


1
予測変数「平均支持」を明確にできますか?これは、参加者が回答に使用した0〜100の尺度ですか、それとも参加者が「はい、私は支持します」(対「いいえ、私は支持しません」)と言った試験の割合の尺度です。後者の場合、このデータを比率として分析することは不適切です。代わりに、二項リンク関数を備えた混合効果モデルを使用して、試行ごとの生データを分析する必要があります。
マイクローレンス

申し訳ありませんが、これを省略すると、応答スケールは0〜100です。
ヘンリック

あなたは多くの0または100を持っていますか?そうでない場合は、100で割ってロジット変換を実行し、極端な範囲の制限を考慮することを検討します。これは、基本的に、バイナリデータがある場合に二項リンク関数によって達成されることですが、ここにあるように比例的なデータしかない場合に役立ちます。あなたが100または0のいずれかの応答をトスする必要があると思いますので、しかし、あなたは、1または0を変換ロジットすることはできません
マイク・ローレンス

おっと、最初のコメントが100%正しくないことに気付いただけです。プロットされた各平均は、0〜100のスケールでの2つの応答の平均を表します。このデータには、100に非常に近い多くの値があり、100に直接ある値もありますが、実際には0および0付近ではごくわずかです。
ヘンリック

1
他のデータ視覚化の人々は、棒グラフは人道に対する犯罪であると主張するかもしれません:Op
マイクローレンス

回答:


9

刺激的な答えと私の質問への議論の結果として、モデルベースのパラメーターに依存しないが、基礎となるデータを提示する以下のプロットを作成しました。

理由は、私が選択する標準エラーの種類に関係なく、標準エラーはモデルベースのパラメーターだからです。それでは、なぜ基礎となるデータを提示し、それによってより多くの情報を送信しませんか?

さらに、ANOVAからSEを選択すると、特定の問題に対して2つの問題が発生します。
最初に(少なくとも私にとって)、SPSSANOVA出力からのSEが実際に何であるかはどういうわけか不明確です(コメントのこの説明も参照してください)。それらは何らかの形でMSEに関連していますが、正確にはわかりません。
第二に、基礎となる仮定が満たされた場合にのみ合理的です。ただし、次のプロットが示すように、分散の均一性の仮定は明らかに違反しています。

箱ひげ図のプロット: 代替テキスト

すべてのデータポイントを含むプロット: 代替テキスト

2つのグループが左または右に少しずれていることに注意してください。左に演left的、右に帰納的です。平均は黒でプロットされ、データまたはボックスプロットは背景がグレーで表示されます。左側のプロットと右側のプロットの違いは、平均がポイントプロットまたはボックスプロットと同じようにずれている場合、または中央に表示されている場合です。
グラフの品質が最適でなく、X軸ラベルが欠落しているためごめんなさい。

残っている問題は、上記のプロットのどれを今選択するかです。私はそれについて考え、私たちの論文の他の著者に尋ねなければなりません。しかし、今、私は「脱臼した手段を持つポイント」を好む。そして、私はまだコメントに非常に興味があります。


更新:プログラミングをいくつか行った後、ようやくR関数を作成して、脱臼した平均点を持つプロットのようなプロットを自動的に作成しました。それをチェックしてください(そして私にコメントを送ってください)


素晴らしいヘンリック。また、「脱臼した手段を備えたポイント」も好みます。被写体を線分にリンクすると、散らかって見える場合があります。残念。分散の均一性については、もう少し楽観的です。分散の問題は、生データで見られるほど悪くない場合があります。ほとんどの場合、グループ内の違いでコントラストを比較することになります。コントラストの分散は、生データの分散よりも均質です。異なる分散の生の測定値を比較する場合(例:MP妥当性と妥当性のあるグループの帰納的と演ductive的)、ノンパラメトリック検定をバックアップとして使用できます。
チラコレオ

1
私は中心が平均である点が好きです。線のより正確な表現があります。ポイントを小さくすることができます。
ジョン

8

この種の実験計画では、推論目的の妥当なエラーバーは1つも見つかりません。これは明確な解決策がない古い問題です。

ここにあなたが持っている見積もりの​​SEを持つことは不可能のようです。このような設計には2つの主な種類のエラーがあります。Sエラーの間と内部エラーです。それらは通常、互いに非常に異なり、比較できません。データを表すのに適した単一のエラーバーはありません。

データからの生のSEまたはSDは、推論よりも記述的な意味で最も重要であると主張するかもしれません。それらは、中心傾向推定値(SE)の品質またはデータのばらつき(SD)のいずれかを示します。ただし、それでも、S内でテストおよび測定しているのはその生の値ではなく、S内の変数の効果であるため、やや不誠実です。したがって、生の値の変動を報告することは、S効果に関して意味がないか誤解を招く可能性があります。

私は通常、そのようなグラフと、効果のばらつきを示す隣接する効果グラフにエラーバーがないことを支持しています。そのグラフ上に完全に合理的なCIがある場合があります。効果グラフの例については、Masson&Loftus(2003)を参照してください。表示される平均値の周りの((ほとんどまったく役に立たない)エラーバーを単に削除し、エフェクトエラーバーを使用するだけです。

調査のために、最初にデータを2 x 2 x 2の設計(2パネル2x2)として再プロットしてから、有効性、妥当性、指示、および相互作用効果の信頼区間でグラフのすぐ隣にプロットします。命令グループのSDとSEを表またはテキストに入れます。

(予想される混合効果分析の応答を待つ;))

更新:OK、編集後、値の推定値の品質を表示するために使用するSEだけが必要であることは明らかです。その場合は、モデル値を使用してください。両方の値はモデルに基づいており、サンプルには「真」の値はありません。データに適用したモデルからのものを使用します。ただし、図のキャプションで、これらのSEには、S内の効果や相互作用に対して推論的な価値はまったくないことを読者に警告してください。

更新2:提示したデータを振り返ってみると、最初はANOVAで分析されるべきではなかったパーセンテージのように見えます。それがそうであるかどうかに関係なく、最大値は100であり、極端な分散が減少しているため、ANOVAで分析する必要はありません。あなたのrm.plotプロットとよく似ています。生データを示す条件間のプロットと、S間の変動が除去されたデータを示す条件内のプロットを別々に行いたいと思います。


1
グラフをそのままプロットするのには(統計的ではない)正当な理由があります。研究の質問に対する答えが直接わかります。さらに、中間の問題について知っているので、推論目的のエラーバーを探していません。しかし、メイソンとロフタスに戻って私を特定したおかげで、彼らが混合した例を持っていることを忘れていたに違いありません。私の目的にかなうかどうかを考えなければなりません。
ヘンリック

7

これは非常に良い実験のように見えるので、おめでとうございます!

私はジョン・クリスティに同意します。それは混合モデルですが、ANOVA設計で適切に指定できる場合(&のバランスが取れている場合)、そのように定式化できない理由はわかりません。被験者間の2つの因子と1つの因子、被験者間の因子(帰納的/演ductive的)は、被験者内効果を明確に相互作用(修正)します。プロットされた平均はANOVAモデル(LHS)からのものであり、モデルが正しく指定されていると想定しています。よくできました-これは簡単なことではありません!

いくつかのポイント:1)「推定」対「実際の」「エラー」は誤った二分法です。両方とも、基礎となるモデルを想定し、それに基づいて推定を行います。モデルが合理的である場合、モデルベースの推定値を使用する方が良いと主張します(それらはより大きなサンプルのプールに基づいています)。しかし、ジェームズが述べているように、エラーはあなたが行っている比較によって異なるため、単純な表現は不可能です。

2)箱型図または個々のデータポイント(多すぎることがない場合)を表示し、おそらくある程度の横揺れがあるので、同じ値を持つポイントを区別できます。

http://en.wikipedia.org/wiki/Box_plot

3)平均の誤差の推定値をプロットする必要がある場合は、SDをプロットしないでください-それらはサンプルの標準偏差の推定値であり、平均値の統計的比較ではなく、母集団の変動性に関連します。一般に、SEではなく95%の信頼区間をプロットすることが望ましいですが、この場合はそうではありません(1とJohnのポイントを参照)

4)このデータに関する1つの問題は、特に演MP的な人々にとって、「MP有効かつ妥当な」データが100%の制限によって明確に制約されているため、均一分散の仮定におそらく違反していることです。私はこの問題がどれほど重要であるかを自分の心で考えています。混合効果ロジット(二項確率)への移行はおそらく理想的なソリューションですが、それは難しい質問です。他の人に答えさせるのが最善かもしれません。


1での推奨事項を理解しているかどうかはよくわかりません。実際のSE [SD / sqrt(n)]と推定SEはどちらもモデルベースであるため、モデルベースを使用することをお勧めします。それでどれ?または、より複雑なモデル(ここではANOVA)を使用すると、両方のモデルが合理的であるという意味になります。
ヘンリック

ポイント1に完全に同意する
ジョン

こんにちはHenrik、簡単な例-NDと仮定した2つのグループ(x1、x2)を比較します。仮定とモデル:1)独立してサンプリングされた、異なる分散。x1、x2のSEは個別に推定されます。これは、多くのグラフィカルプレゼンテーションで暗黙的に仮定されています。推定SEは異なります。2)独立、同じ変数 通常の分散分析の仮定。プールされたRSSを使用してSEを推定します。推定は、より堅牢なIF仮定が正しいです。3)各x1にはx2ペアがあります。x1-x2から推定されたSE。それらを効果的にプロットするには、差x1-x2をプロットする必要があります。1)と2)を混ぜると、意味のあるSEまたはCIをプロットする際に実際の問題が発生します。
チラコレオ

Henrik、プロットに関するコメント。被験者は何人いますか?データを個別にプロットし、線セグメントを使用して個人をリンクすることを強くお勧めします。(手段をリンクする線分は不正です。)SEをプロットする必要はありません。アイデアは、統計分析を視覚的にサポートすることです。プロットが乱雑にならない限り、読者は(たとえば)スコアの明らかな過半数が、誘導グループではMP-valid-implausからAC-inval-plausに上昇し、演ductiveグループでは下降することを確認する必要があります。参照:jstor.org/stable/2685323?seq= 1特に図1と9の下部パネル。
チラコレオ

3

最近、混合効果分析を使用しており、付随する視覚データ分析アプローチを開発しようとして、ブートストラップを使用しています(ここの説明を参照してください)。これにより、トラブル間の影響を受けにくい信頼区間が得られます。従来のCIの。

また、上記のグラフで行ったように、複数の変数を同じ視覚的外観にマッピングすることは避けます。x軸にマップされた3つの変数(MP / AC、有効/無効、もっともらしい/信じられない)があるため、デザインとパターンの解析がかなり難しくなります。代わりに、たとえばMP / ACをx軸にマッピングし、有効/無効をファセット列に、もっともらしい/信じられない行をファセット列にマッピングすることをお勧めします。これを簡単に実現するには、Rでggplot2をチェックしてください。例:

library(ggplot2)
ggplot(
    data = my_data
    , mapping = aes(
        y = mean_endorsement
        , x = mp_ac
        , linetype = deductive_inductive
        , shape = deductive_inductive
)+
geom_point()+
geom_line()+
facet_grid(
    plausible_implausible ~ valid_invalid
)

Mike、パッケージlanguageRのpvals.fnc関数はMCMCを実行してlmerモデルの仮説を評価します-ただし、ランダムな勾配の設計は処理しません-ランダムな勾配でMCMCを実行する何らかの理由があるのではないかと疑いますどういうわけか問題がありますが、そのような問題がないことを明確に知っていますか?
ラッセルピアス

私はまだMCMCがどのように機能するかを理解していないことを認めなければなりません。これが、ブートストラップを選択した理由の1つです。あなたが推測したように、ランダムな勾配でブートストラップが可能になるはずですが、これは何らかの理由で無効であるため、pvals.fncがランダムな勾配を持つモデルのCIを許可しない可能性があり、さらにこの無効性がそのようなモデルのブートストラップ。私は直感的にブートストラップに問題があるとは思わないが、それは私の限られた専門知識の機能かもしれない。
マイクローレンス
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.