実験/ランダム化比較試験のコンテキストで、2値の処理割り当てインジケーターを使用した処理と共変量の相互作用に興味があります。
特定の方法/ソースに応じて、治療された被験者と治療されていない被験者について、それぞれとT = \ {1、-1 \}の両方を確認しました。
または\ {1、-1 \}を使用するときの経験則はありますか?
解釈はどのように異なりますか?
実験/ランダム化比較試験のコンテキストで、2値の処理割り当てインジケーターを使用した処理と共変量の相互作用に興味があります。
特定の方法/ソースに応じて、治療された被験者と治療されていない被験者について、それぞれとT = \ {1、-1 \}の両方を確認しました。
または\ {1、-1 \}を使用するときの経験則はありますか?
解釈はどのように異なりますか?
回答:
指標変数の推定量と切片の解釈は異なります。から始めましょう:
次のモデルがあるとします
どこ
その場合、最終的には次の式になります。
したがって、の解釈はプラセボの効果であり、の解釈はプラセボの効果と薬物の効果の違いです。実際には、を薬剤による改善として解釈できます。β 1 β 1
次に、見てみましょう。
その後、次のモデル(再び)ができます。
しかしここで
その場合、最終的には次の式になります。
ここでの解釈は、はプラセボの効果と薬物の効果の平均であり、は2つの治療法のその平均との差です。β 1
解釈で基本的に、ベースラインです。いくつかの標準処理を設定し、他のすべての処理(複数ある場合があります)をその標準/ベースラインと比較します。特に他の共変量を追加し始めたとき、これは標準的な医学的質問に関して解釈するのが簡単なままです:これらの薬はプラセボまたは確立された薬とどのように比較されますか? { 0 、1 }
しかし結局、それはすべて私が上で説明した解釈の問題です。したがって、仮説を評価し、どの解釈が結論の描画を最も簡単にするかを確認する必要があります。
線形回帰のコンテキストでは、はバイナリ変数をコーディングするためのより自然な(そして標準の)方法です(それらを回帰の左側の左側に配置するかどうかにかかわらず)。@Jarko Dubbeldamが説明するように、もちろん他の解釈を使用することができ、係数の意味は異なります。
別の方法で例を示すと、計算の基礎となるサポートベクターマシンをプログラミングまたは導出する場合出力変数コーディングが標準です。(ライブラリーを呼び出すときは、ライブラリーが期待する形式(おそらく0、1の公式)でデータを渡します。)
あなたがやろうとしていること/使用していることすべてに対して標準的な表記法を使用してみてください。
切片項を持つあらゆる種類の線形モデルの場合、2つの方法は単純な線形変換によって関連付けられるという意味で同等です。数学的には、データ行列を使用するか、データ行列を使用するかは関係ありません。ここで、はフルランクです。一般化線形モデルでは、推定係数はどちらの方法でも線形変換によって関連付けられ、近似値は同じになります。〜X = X A A A Y
これはより抽象的な(そしておそらく役に立たない)ですが、これら2つの表現は、数学的な意味では、実際にはグループ表現であり、それらの間には同型性があることに注意します。
インジケーター変数の意味は、基本的にブール値で、「factor is true」または「factor is false」です。2つのイベントと与えられた場合、「これら2つのイベントの要因は同等ですか、たとえば、両方とも真であるか、両方とも偽ですか?」ブール論理では、これはです。これはグループ構造定義します。ここで、と両方ともこのグループの表現を形成し、グループ演算とです。最初の表現から2番目の表現への同型は、与えられます。。
この表現は、連続指標変数、つまり確率にも拡張されます。場合確率である真であることが、その後の確率真すべきであり、。同型下では、これはです。数量は、-1と1の間の符号付きインジケーターです。したがって、ブール演算の確率に関する計算は、多くの場合、この基準ではるかに単純です。T T ⇔ T ' P ' ⇔ P = P 、P ' + (1 - P )(1 - P ')T (P )= 2 P - 1 T ⇔ T ' = T T ' T