一部の時点で応答が大幅に歪んでおり、一部の時点で反復測定研究が行われていない場合はどうすればよいですか?


12

通常、縦断的デザインで連続的ではあるが歪んだ結果測定値に遭遇すると(たとえば、被験者間効果が1つ)、一般的なアプローチは結果を正常性に変換することです。切り捨てられた観測値など、状況が極端な場合は、空想を得てTobit成長曲線モデルなどを使用する可能性があります。

しかし、特定の時点で通常分布し、その後他の時点で大きく歪んだ結果を見ると、私は途方に暮れています。変換は、あるリークを埋めるが、別のリークを引き起こす可能性があります。そのような場合、何を提案できますか?私が知らない混合効果モデルの「ノンパラメトリック」バージョンはありますか?

注:適用例は、一連の教育的介入の前後の知識テストのスコアです。スコアは正常に始まりますが、その後、スケールの上限でクラスター化します。


6
この例は、常に発生するため興味深いものです。Tukeyの「フォールド」パワー変換など、それに対処するためのよく知られた変換があります。これらはスケールの中央でほとんど変化を起こしませんが、両端の歪度を治します。折り畳まれたルートとログは、標準化された事前/事後テストの比較に非常にうまく機能することがわかりました。
whuber

ありがとう、フーバー。フォールド変換のアプローチを検討します。
ブレンデンデュフォール

1
Brendenの定義と例については、stats.stackexchange.com / a / 10979を参照してください。それらの使用方法については、Tukeyの本EDAの最後のいくつかの章を参照してください。
whuber

2
追加のメモ-関係する実際の変数ではなく、モデルの残差について仮定が行われることに注意してください。
ピーターフロム-モニカの復職

回答:


1

(結果変数の分布自体は通常問題ではないため)残差で問題が発生すると仮定すると、変換またはアプリケーションの適用によって問題を「修正」するのではなく、問題の原因を調査したいと考えています。ノンパラメトリックモデル。

傾向があるように見える場合(例:徐々に正常に近づいていく)、または正常から非正常に移行する際の明確な中断がある場合は、ある種の「政権交代」を示唆しますデータ(つまり、データ生成メカニズムが時間とともに変化している)または何らかの種類の欠損変数の問題。

明らかなパターンがない場合(たとえば、期間1と3は正常に見え、期間2と4はそうではない)、データの整合性の問題を非常に注意深く調べます。

政権交代があるかどうかを確認する簡単な方法は、「通常の」期間のみを使用してモデルを推定し、他の期間を使用して再推定し、どのような差異が発生するかを確認することです。より複雑なアプローチは、潜在クラスモデルを使用することです。おそらく時間を付随変数として使用します。

ノンパラメトリック混合効果モデルに関する質問に関しては、ノンパラメトリックの意味に依存します。数値従属変数を想定しないモデルを意味する場合、そのようなモデルは多数あります(たとえば、LIMDEPにはかなりの数があります)。また、正規性の仮定に違反するのは、サンプルサイズが小さい場合に推論の観点からのみ問題になる可能性が高いことに注意してください。これを調査する1つの方法は、他のコメントと回答で説明したさまざまな変換を試して、それが結論に大きな影響を与えるかどうかを確認することです。


+1ありがとう、ティム。潜在クラスモデルとLIMDEPに関するご提案に感謝します。これらのアプローチは、私がそれらについてさらに学び始めるにつれて、私にとって魅力的になっています。
ブレンデンデュフォルト

0

変数をパワーラムダに上げるBox-Cox変換があります。ラムダはモデルパラメーター推定に含まれます。私はテューキーの折り畳まれた力の変換に精通していないので、同じことを話しているのかどうかはわかりません。ラムダを推定するには、近似に複数の点が必要です。各時点でテストを受けている被験者のセットで分布が定義されている各時点で異なる分布に適合させたいですか?その場合でも、いくつかの時点が同じ分布を持っていることがわかっている場合は、それらを単一の近似に結合することができます。

ノンパラメトリックで、正規性への変換を伴わない別のアプローチは、各時点または時点の各組み合わせセットでブートストラップを適用することです。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.