私の質問は:
- 一般化線形モデル(GLM)は、グローバルな最大値に収束することが保証されていますか?もしそうなら、なぜですか?
- さらに、凸性を保証するためのリンク関数にはどのような制約がありますか?
GLMについての私の理解は、それらが高度に非線形な尤度関数を最大化するということです。したがって、いくつかの極大値があり、収束するパラメーターセットは最適化アルゴリズムの初期条件に依存すると想像します。しかし、いくつかの研究を行った後、複数の局所的最大値があることを示す単一の情報源は見つかりませんでした。さらに、私は最適化手法にあまり精通していませんが、ニュートンラプソン法とIRLSアルゴリズムは極大になりやすいことを知っています。
可能であれば、直感的かつ数学的に説明してください!
編集:dksahujiは私の元の質問に答えましたが、上記の追加の質問[ 2 ] を追加したいと思います。(「凸性を保証するためのリンク関数にはどのような制約がありますか?」)
そうする前に、いくつかの制限が必要だと思います。ステートメントのソースは何ですか?
—
Glen_b -Reinstateモニカ
いくつかのサイトはそれを暗示しているように見えましたが、私はそれを完全に言及したものを見つけることができなかったので、その反論も歓迎します!
—
DankMasterDan
可能性がドメインのあらゆる場所で明確に定義されている限り(および、いくつかの接線上の数値の問題を無視する限り)、そうだと思います。これらの条件下では、ヘッシアンはドメインのどこでも<0であるため、尤度はグローバルに凹になります。ところで、この関数はパラメーター内で「高度に非線形」ではなく、それが重要です。
—
user603 14
@ user603ヘシアンがどこでも<0であることのソース/証明は何ですか?
—
DankMasterDan 14
ロジスティック、ポアソン、およびガウス回帰は、「適切な」リンク関数が与えられると、多くの場合凸です。ただし、任意のリンク関数では、凸状ではありません。
—
Memming