数ヶ月前、私はこの組織で実習しました。そして、去るプレゼントとして、私は先週を、休みの時間に関係なく、教師の給料に影響する要因を調査することにしました。私が教師の給料で遭遇した問題の1つは、特定の州の分布が歪んでいたことです。私は賃金スペクトルの下限に固執する多くの観察をしました。比較可能な賃金指数を従属変数(教師の賃金)に組み込むことでこれを解決しようとしましたが、見つかった結果は私のプロジェクトの範囲では完全に時代遅れでした。代わりに、従属変数をログに記録することにしました。賃金が正規分布になり、ヒストグラムで完璧に見えたので、これは良かったです。テストを開始すると、最後の独立変数である固定資産税の申告書が残されました。私の標準的な賃金の問題は、私の固定資産税申告の観察でも明らかでした。スペクトルの下限に向かって、固定資産税の申告番号に大きな偏りがありました。そのため、この変数もログに記録しましたが、それでも帰無仮説検定に合格しました。
これが正確に正しいかどうかはわかりませんが、ログに記録された変数の変更を別のログに記録された変数と比較すると、弾力性が得られました。これが正しいと仮定すると、私の回帰式(LogWages = B0 + B1(LogPropertyTaxReturns)のようなもの)は、2つの変数間の弾力性を示しています。しかし、これは意味がありますか?私の目標が、私の州の任意の郡で教師の給与に最も影響を与える変数を確認することであった場合、2つの変数間の弾力性を示すことは役に立ちますか?私たちは、生活水準を上げるために、最低の教師の給料で郡を高く上げたいと思っていますが、私が結論を下す回帰式は無意味であるという実際の観察から遠く離れていると推測しています。
編集:私の大きな懸念の1つは、関係を示すために非線形モデルを使用すべきだったということです。この線形回帰で従属変数と独立変数の両方を協調させることは、何らかの形で誤解を招くと感じています。