カテゴリ変数(R内)で使用できるさまざまなタイプのコーディングと、それらをいつ使用しますか?


14

線形モデルまたは混合モデルを近似する場合、カテゴリーまたはノミナルバリベールを、ダミーコンディング(Rデフォルト)やエフェクトコーディングなど、パラメーターが推定される多くの変数に変換するために使用できるさまざまなタイプのコーディングがあります。

相互作用がある場合、エフェクトコーディング(偏差またはコントラストコーディングと呼ばれることもあります)が好ましいと聞きましたが、可能なコントラストはどのようなもので、どのタイプのコントラストを使用するのですか?

コンテキストはを使用したRでの混合モデリングですが、lme4より広範な応答は問題ないと思います。申し訳ありませんが、同様の質問を逃した場合。

編集:2つの有用なリンクがあります:効果コーディングと説明されたダミーコーディング


S-Plusを使用した最新の応用統計がある場合、この質問に関する第6章のすばらしいセクションがあります
-richiemorrisroe

4
あなたの質問に対する完全な答えが見つかるとは思いませんが、ここにはさまざまなタイプのコーディングに関する多くの良い情報があります
GUNG -復活モニカ

@gungこのサイトは本当に面白そうです。ただし、コントラストコーディングをカバーしていないようです(または別の名前があります)。
ヘンリック

よく分かりません; 誤解があるのではないかと思います。そのページのタイトルは「コントラストコーディング」です。
GUNG -復活モニカ

1
どんな質問が残っているのかよくわかりません。さまざまなタイプのコーディングのリストが必要な場合は、それがあります。今、あなたの質問の主な目的は何ですか?
GUNG -復活モニカ

回答:


4

私が間違っていれば他の人が私を啓発することができますが、ここに行きます...

以前のレベルの平均と比較したレベルの効果は何ですか?つまり、効果のしきい値を見つけることに興味があります

  • Helmertコントラストを使用します。これは累積比較だと思います。曝露の薬物用量反応限界を決定することに関心がある場合、私はこれを使用しました。一度に複数のレベルと比較すると、破棄される情報が少なくなります。これは累積比較だと思います。

ベースラインレベルに対するレベルの影響は何ですか?つまり、1つのベースライン比較グループに興味があります。

  • ダミー変数コーディングを使用します(治療コントラスト)。これをベースライン比較と考えています。通常、他の研究で重要と設定されたグループ/レベルが1つある場合にこれを使用しました。私の研究では、このしきい値を超えた場合にも関連付けが存在することを示しています。

変数の2つの隣接するレベルの効果は何ですか?

  • 前方/後方差分を使用します。これは、短い間隔の連続した比較だと思います。社会経済的地位の異なるレベルの効果を比較する際に、私はこれを使用しました。各グループはそれ自体で権利が組成的に異なり、他のグループよりも興味がありません。
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.