R、nls()またはnlm()の非線形最小二乗法対最尤法?


7

モデルを推定しています

E(Y|X)=Pr(Y=1|X)=α0+(1α0α1)ϕ(Xβ),
どこ α0およびはパラメーター、はパラメーターの長のベクトル、はデータの行列、従属変数はバイナリー、はプロビットモデルなので、累積分布標準正規分布の関数。予想を導き出すために、エラーは正常で平均ゼロであるという仮定がなされました。α1βpXp×nYϕ()

モデルのソースはここにあり(式6および7を参照)、論文に従って、非線形最小二乗法または最尤法のいずれかを使用してモデルを推定できます。nls()非線形最小二乗のnlm()関数と最大尤度の関数を使用して、Rで両方のアプローチを試しました。実験により、私のアプリケーションの結果は非常によく似ていることが示唆されていますが、nls()高速です。どちらか一方のアプローチを優先する理由はありますか?メソッドの選択についてはどのように考えればよいでしょうか。

これらの2つのアプローチの違いを検討するための提案、または関連する参考文献の提案をいただければ幸いです。


より高速なソリューションに関して、nlsとnlmが同じオプティマイザを使用することを確認しましたか?別の検眼医を使用した場合、一方が他方よりも速い理由を説明できます。
予測者

良い質問。確認しませんでした-調査します。私のアプリケーションでは速度はそれほど重要ではないので、どちらのモデルを使用するのも私は気まずいでしょう。どちらか一方を優先する理論的な理由があるかどうかを知りたいと思っています。
gfgm 2017年

どのような変数ですか y?数値、カテゴリ、バイナリなどですか?とはϕ?そして、あなたの統計モデルは何ですか?あなたが書いたものはモデルではありません-エラー項はありません。せいぜい、それはの条件付き平均の式である可能性がありますy に関して x。もしyは連続確率変数であり、平均がゼロで分散が一定の加法的iidガウス誤差を仮定すると、NLS推定量とMLE推定量は同じになります。
DeltaIV 2017

@DeltaIVに感謝します。投稿を編集してわかりやすくしました。これは、推測したとおり、xに対するyの条件付き平均の式であり、yはバイナリです。
gfgm 2017

回答:


6

予想を導き出すために、エラーは正常で平均ゼロであるという仮定がなされました。

それが想定である場合、MLEとNLSは数学的に同一である必要があり、違いはおそらくオプティマイザの選択/設定によって説明されます。

バイナリ応答の正規分布が良い考えかどうかは別の問題です。代替案は、MLEで推定された非線形予測子を備えたロジスティックglmです。

MLEを行う場合は、nlm()の代わりにhttps://cran.r-project.org/web/packages/bbmle/index.htmlを使用することを検討することをお勧めします。CIのその他のオプションなど。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.