2
直線性を達成するために最適な変換を選択するにはどうすればよいですか?
多重線形回帰を実行してから、ほとんど外挿せずに新しい値を予測します。-2から+7の範囲の応答変数と3つの予測子(約+10から+200の範囲)があります。分布はほぼ正常です。しかし、応答と予測子の関係は線形ではありません。プロット上に曲線が表示されます。たとえば、次のようになります:http : //cs10418.userapi.com/u17020874/153949434/x_9898cf38.jpg 線形性を実現するために変換を適用したいと思います。さまざまな関数をチェックし、結果のプロットを見て応答と予測子の線形関係を確認することで、応答変数を変換しようとしました。そして私は目に見える線形関係を与えることができる多くの関数があることを発見しました。たとえば、関数 t1= ログ(y+ 2.5 )t1=log(y+2.5)t_1=\log(y+2.5) t2= 1ログ(y+ 5 )t2=1log(y+5)t_2=\frac{1}{\log(y+5)} t3= 1y+ 5t3=1y+5t_3=\frac{1}{y+5} t4= 1(y+ 10 )3t4=1(y+10)3t_4=\frac{1}{(y+10)^3} などでも同様の結果が得られます。http: //cs10418.userapi.com/u17020874/153949434/x_06f13dbf.jpgt5= 1(y+ 3 )13t5=1(y+3)13t_5=\frac{1}{(y+3)^\frac{1}{3}} 予測値を逆変換します( asy′=1t = 1(y+ 10 )3t=1(y+10)3t=\frac{1}{(y+10)^3}など)。分布は通常とほぼ同じです。y』= 1t13− 10y′=1t13−10y’=\frac{1}{t^\frac{1}{3}}-10 データに最適な変換を選択するにはどうすればよいですか?直線性を評価する定量的(そしてそれほど複雑ではない)方法はありますか?選択した変換が最良であることを証明するため、または可能であれば自動的に変換を見つけるため。 または、唯一の方法は非線形重回帰を行うことですか?