「より良い」は、モデルの機能です。
混乱の理由の一部は、モデルの半分しか書いていないことです。
と言うとき、実際にはそうではありません。観測されたy値はa x bと等しくありません。エラーコンポーネントがあります。y=axbyaxb
たとえば、あなたが言及する2つのモデルは、(可能な限り唯一の可能なモデルではありません)エラーについて全く異なる仮定をします。
おそらく、E (Y | X = x )= a x bに近いものを意味しますE(Y|X=x)=axb。
しかし、与えられたxでのその期待値から離れたの変化については何と言うでしょうか?重要です!Yx
非線形最小二乗モデルを近似すると、誤差は加法的であり、誤差の標準偏差はデータ全体で一定であると言っています。
yi∼N(axbi,σ2)
または同等に
と、 VAR (E I)= σ 2yi=axbi+eivar(ei)=σ2
対照的に、ログを取得して線形モデルを近似すると、エラーはログスケールで加算され、(ログスケールで)データ全体で一定であると言います。これは、観測のスケールでは、誤差項が乗法であるため、期待値が大きいほど誤差が大きくなることを意味します。
yi∼logN(loga+blogxi,σ2)
または同等に
yi=axbi⋅ηiηi∼logN(0,σ2)
(ご了承ください E(η)σ2
(正規性/対数正規分布を仮定せずに最小二乗を行うことができますが、議論されている中心的な問題はまだ当てはまります...そして、正規性に近いところがない場合は、とにかく異なるエラーモデルを検討する必要があります)
したがって、最善の方法は、状況を記述するエラーモデルの種類によって異なります。
yxx