私の状況は:
単純な線形回帰のために残差を正規化するために対数変換した1つの連続従属変数と1つの連続予測子変数があります。
これらの変換された変数を元のコンテキストに関連付ける方法について、何か助けていただければ幸いです。
線形回帰を使用して、生徒が2010年に見逃した日数に基づいて、2011年に生徒が見逃した日数を予測したいと思います。ほとんどの生徒は0日またはほんの数日欠けており、データは積極的に左に歪んでいます。したがって、線形回帰を使用する変換が必要です。
両方の変数にlog10(var + 1)を使用しました(0日間学校を休んだ生徒には+1を使用しました)。性別/民族性などのカテゴリー要素を追加したいので、回帰を使用しています。
私の問題は:
私がフィードバックしたいオーディエンスは、log10(y)= log(constant)+ log(var2)xを理解していません(そして率直に言っても私は理解していません)。
私の質問は:
a)回帰で変換された変数を解釈するより良い方法はありますか?つまり、2010年に1日間欠落すると、2011年には2日間欠落します。これに対して、2010年には1単位のログ単位が変更されたのに対し、2011年にはx単位の単位が変更されますか?
b)具体的には、次のようにこの出典から引用された一節を考える:
「これは、他の変数がモデル内で一定に保たれている場合、数学標準化テストスコアが1ユニット増加したときの負の二項回帰推定です。学生が数学テストスコアを1ポイント増加させた場合、期待される数は、モデルの他の変数を一定に保ちながら、0.0016単位で減少すると予想されます。
私が知りたいのですが:
- この一節は、
UNTRANSFORMED
変数mathのスコアが1ユニット増えるごとに定数(a)から0.0016減少するため、UNTRANSFORMED
数学スコアが2ポイント上がる場合、定数aから0.0016 * 2を引くと言っていますか? - これは、exponential(a))とexponential(a + beta * 2)を使用して幾何平均を取得することを意味しますか?そして、これら2つの間のパーセンテージの差を計算して、予測変数がどのような効果を持つかを示す必要があります/従属変数を持っていますか?
- それとも私はそれを完全に間違っていますか?
SPSS v20を使用しています。長い質問でこれをフレーミングして申し訳ありません。
R
ゼロ膨張モデルのパッケージがあります。このサイトを検索してください。)