私は3つの選択肢から職業選択のモデルを推定しようとしています。このような順序付けされていないカテゴリ結果を処理するときに多項ロジスティック回帰を使用する代わりの方法はありますか?
バイナリ従属変数を扱う場合、LPMモデルやバイナリプロビットモデルやロジットモデルなど、いくつかの選択肢があるようです。ただし、順序付けされていないカテゴリ変数を扱う場合、文献では、代替案と比較せずに多項ロジットモデルを推奨しています。
私は3つの選択肢から職業選択のモデルを推定しようとしています。このような順序付けされていないカテゴリ結果を処理するときに多項ロジスティック回帰を使用する代わりの方法はありますか?
バイナリ従属変数を扱う場合、LPMモデルやバイナリプロビットモデルやロジットモデルなど、いくつかの選択肢があるようです。ただし、順序付けされていないカテゴリ変数を扱う場合、文献では、代替案と比較せずに多項ロジットモデルを推奨しています。
回答:
多項モデルをモデル化するために利用できるさまざまなモデルがあります。
簡単で優れた紹介にはCameron&Trivedi Microeconometrics Using Stataをお勧めします。または、オンラインで入手できるImbens&Wooldridge講義スライドまたはこちらをご覧ください。
広く使用されているモデルは次のとおりです。
Stataでの多項ロジスティック回帰またはmlogit
多項ロジット条件(簡単個人固有も選択固有プレディクタだけでなく、を含むことを可能にする)またはasclogitのStataで
ネストされたロジット(階層的な方法で選択肢をグループ化/ランク付けすることにより、無関係な代替の仮定(IIA)からの独立性を緩める)またはStataのnlogit
混合ロジット(例えば、正常分散のパラメータを仮定することによってIIA仮定を緩和)またはmixlogit Stataのです。
多項プロビットモデル(さらにIIA仮定を緩和することができるが、使用可能な選択肢固有の予測因子を持つべきである)混合ロジット(例えば、通常の分散パラメータを仮定IIA仮定を緩和)、使用asmprobit mprobitは、使用の選択固有の予測因子に許可していないのStataで(しかし、IIAの仮定を緩和するためにそれらを使用する必要があります)
ロジスティック回帰とはまったく異なるオプションが必要な場合は、ニューラルネットを使用できます。たとえば、Rのnnet
パッケージにはmultinom
関数があります。または、ランダムフォレスト(RのrandomForest
パッケージなど)を使用することもできます。また、他にもいくつかの機械学習の選択肢がありますが、SVMなどのオプションは十分に調整されない傾向があるため、出力はロジスティック回帰に劣ります(私の意見では)。
[実際には、ロジットはおそらくニューラルネットのニューロンによって内部で使用されています。したがって、かなり異なりますが、同時にまったく違いはありません。]
また、ニューラルネット(ソフトマックスのアクティブ化を使用)、ディシジョンツリー(またはランダムフォレスト)は、IIA仮定の確認に関するこれらのテストの信頼性の低さを考慮すると、IIA仮定を満たす必要はないと考えます。したがって、これが予測のみである場合、これは多項ロジスティックスと比較して利点になる可能性があります。
あるいは、Kthカテゴリーを参照として、K-1カテゴリーに対して複数のロジスティックモデルを構築できます。これにより、多項式とは対照的に、方程式ごとに異なる予測子を接続することもできます