従属変数のみ、従属変数と独立変数の両方、または独立変数のみが対数変換されるかどうかの解釈に違いがあるのかと思います。
の場合を考えます
log(DV) = Intercept + B1*IV + Error
IVはパーセントの増加として解釈できますが、
log(DV) = Intercept + B1*log(IV) + Error
または私が持っているとき
DV = Intercept + B1*log(IV) + Error
?
従属変数のみ、従属変数と独立変数の両方、または独立変数のみが対数変換されるかどうかの解釈に違いがあるのかと思います。
の場合を考えます
log(DV) = Intercept + B1*IV + Error
IVはパーセントの増加として解釈できますが、
log(DV) = Intercept + B1*log(IV) + Error
または私が持っているとき
DV = Intercept + B1*log(IV) + Error
?
回答:
チャーリーは素晴らしい、正しい説明を提供します。UCLAの統計コンピューティングサイトには、さらにいくつかの例があります:http : //www.ats.ucla.edu/stat/sas/faq/sas_interpret_log.htmおよび http://www.ats.ucla.edu/stat/mult_pkg/ faq / general / log_transformed_regression.htm
チャーリーの答えを補足するために、例の具体的な解釈を以下に示します。いつものように、係数の解釈は、モデルを守ることができ、回帰診断が満足できるものであり、データが有効な研究からのものであると仮定します。
例A:変換なし
DV = Intercept + B1 * IV + Error
「IVの1単位の増加はB1
、DVの()単位の増加に関連しています。」
例B:変換された結果
log(DV) = Intercept + B1 * IV + Error
「IVの1単位の増加はB1 * 100
、DVの()パーセントの増加に関連しています。」
例C:露出が変換された
DV = Intercept + B1 * log(IV) + Error
「IVの1パーセントの増加はB1 / 100
、DVの()単位の増加に関連しています。」
例D:結果が変換され、露出が変換される
log(DV) = Intercept + B1 * log(IV) + Error
「IVの1パーセントの増加はB1
、DVの()パーセントの増加に関連しています。」
ログ対数モデルで、ことを確認 ことを思い出してください または この後者の定式化に100を掛けると、変化率が得られます。についても同様の結果が得られます。
この事実を使用して、 1%の変化に対する変化率としてを解釈できます。
同じロジックに従って、レベルログモデルの場合、次のようになります。
線形回帰の主な目的は、リグレッサの隣接レベルを比較した結果の平均差を推定することです。手段には多くの種類があります。算術平均に最も精通しています。
AMは、OLSおよび変換されていない変数を使用して推定されるものです。幾何平均は異なります。
実際には、GMの差は乗法の差です:ローンを引き受けるときに利息のプレミアムのX%を支払う、メトホルミンの開始後にヘモグロビンレベルがX%減少する、スプリングの故障率が幅の一部としてX%増加する これらのすべての場合において、生の平均差はあまり意味がありません。
対数変換は、幾何平均差を推定します。結果をログ変換し、次の式仕様を使用して線形回帰でモデル化するlog(y) ~ x
場合、係数は、隣接する単位を比較するログ結果の平均差です。これは実際には役に立たないので、パラメーターを指数化し、この値を幾何平均差として解釈します。 X E β 1
たとえば、ARTの10週間投与後のHIVウイルス負荷の研究では、ポスト幾何平均を推定する場合があります。つまり、ベースラインでのウイルス量が何であれ、追跡時に平均で60%減少したか、0.6倍減少したことを意味します。負荷がベースラインで10,000だった場合、私のモデルはフォローアップで4,000と予測し、ベースラインで1,000だった場合、モデルはフォローアップで400と予測します(生のスケールでは小さい差ですが、比例的に同じ)。
これは、他の答えとの重要な区別です。対数スケール係数に100を掛ける規則は、が小さい場合の近似に由来し。(対数スケールでの)係数が0.05の場合、あり、解釈は次のとおりです 1単位の "増加"に対する結果の5% "増加" 。ただし、係数が0.5の場合はで 、 1単位の「増加」に対して 65%の「増加」と解釈します。50%の増加ではありません。X EXP (0.05 )≈ 1.05 XのEXP (0.5 )= 1.65 Y X
私たちは、予測変換ログとしますy ~ log(x, base=2)
。ここでは、生の違いではなく、乗法的変化に興味があります。現在、 2倍異なる参加者を比較することに興味があります。たとえば、相加的リスクモデルを使用して、さまざまな濃度の血液媒介病原体への曝露後の感染(yes / no)を測定することに興味があるとします。生物学的モデルは、濃度が倍になるたびにリスクが比例して増加することを示唆している可能性があります。次に、結果を変換しませんが、推定された係数は、感染物質の2倍の濃度差で暴露されたグループを比較するリスク差として解釈されます。X β 1
最後に、log(y) ~ log(x)
単純に両方の定義を適用して、曝露レベルが乗法的に異なるグループを比較する乗法的差異を取得します。