多項ロジットモデルの代替案


8

私は3つの選択肢から職業選択のモデルを推定しようとしています。このような順序付けされていないカテゴリ結果を処理するときに多項ロジスティック回帰を使用する代わりの方法はありますか?

バイナリ従属変数を扱う場合、LPMモデルやバイナリプロビットモデルやロジットモデルなど、いくつかの選択肢があるようです。ただし、順序付けされていないカテゴリ変数を扱う場合、文献では、代替案と比較せずに多項ロジットモデルを推奨しています。


1
多項式の場合に使用できる代替のリンク関数(ロジット以外)があるかどうかを尋ねているだけですか?または、さまざまなタイプのモデル(カートモデルなど)について質問しますか?それとも何か他に?(最初の場合は、ここで私の答えを読むのに役立つかもしれません:この問題についての一般的な情報については、差分
ビトウィーン

コメントありがとうございます。私は間違いなくリンクを読み上げます。私は主に、通常の線形回帰(OLS)を使用して、順序付けられていないカテゴリカルな結果を処理する代替策があるかどうか疑問に思います。そのような代替案を知っていますか?バイナリの結果に関しては、OLSを使用するか、バイナリロジット/プロビットモデルを使用するかについての全体的な議論があるようです。
トール

最初の概算では、OLS をバイナリ結果に使用しないでください。代替リンク関数を使用する多項回帰アルゴリズムが存在する、または存在する可能性があると確信していますが、主要なソフトウェアがそれらをサポートしているかどうかはわかりません。
gung-モニカの復活

1
最初の近似で何を意味するのかわからない(申し訳ありませんが、私は初心者です)。しかし、LPMモデル関数とバイナリ結果の推定よりもロジットモデルを使用すると主張するいくつかの著名な計量経済学者がいるようです。少なくともAngristとPischkeは、彼らの著書「Mostly harmless econometrics」(2009)でそうしています。そのような代替リンク機能について私がどこで読むことができるかについてのヒントはありますか?繰り返しますが、フィードバックをありがとうございます!
2013

1
「最初の近似に...決して...」とは、99%の確率でOLSをバイナリ結果で使用してはならないことを意味します。私はそれが違いを少なくするいくつかのケースがあることを知っています、そして何人かの人々は標準的なアドバイスに同意しません-それが私がヘッジなしで「決してしない」と言わなかった理由です。残念ながら、私は多項式回帰付きの代替リンク関数の使用について読むのに適した場所を知りません。
gung-モニカの回復

回答:


3

多項モデルをモデル化するために利用できるさまざまなモデルがあります。

簡単で優れた紹介にはCameron&Trivedi Microeconometrics Using Stataをお勧めします。または、オンラインで入手できるImbens&Wooldridge講義スライドまたはこちらをご覧ください。

広く使用されているモデルは次のとおりです。

Stataでの多項ロジスティック回帰またはmlogit

多項ロジット条件(簡単個人固有も選択固有プレディクタだけでなく、を含むことを可能にする)またはasclogitのStataで

ネストされたロジット(階層的な方法で選択肢をグループ化/ランク付けすることにより、無関係な代替の仮定(IIA)から独立性を緩める)またはStataのnlogit

混合ロジット(例えば、正常分散のパラメータを仮定することによってIIA仮定を緩和)またはmixlogit Stataのです。

多項プロビットモデル(さらにIIA仮定を緩和することができるが、使用可能な選択肢固有の予測因子を持つべきである)混合ロジット(例えば、通常の分散パラメータを仮定IIA仮定を緩和)、使用asmprobit mprobitは、使用の選択固有の予測因子に許可していないのStataで(しかし、IIAの仮定を緩和するためにそれらを使用する必要があります


1
β

A:はい、もちろん、おかげで、説明のために、ウィキペディアを参照してくださいhttps://en.wikipedia.org/wiki/Mixed_logit
アルネ・ジョナスWarnke

2

ロジスティック回帰とはまったく異なるオプションが必要な場合は、ニューラルネットを使用できます。たとえば、Rのnnetパッケージにはmultinom関数があります。または、ランダムフォレスト(RのrandomForestパッケージなど)を使用することもできます。また、他にもいくつかの機械学習の選択肢がありますが、SVMなどのオプションは十分に調整されない傾向があるため、出力はロジスティック回帰に劣ります(私の意見では)。

[実際には、ロジットはおそらくニューラルネットのニューロンによって内部で使用されています。したがって、かなり異なりますが、同時にまったく違いはありません。]


+1。いくつかの点を拡張するだけです... SVMは、トレーニング後にキャリブレーションして、良好な確率を生成できます(例:プラットスケーリングまたは等張回帰を使用して、追加のステップを犠牲にして)。softmax出力(および非表示層の任意のタイプの非線形活性化関数)を含むニューラルネットは、いくつかの特徴空間への非線形マッピングを同時に学習し、その特徴空間で多項ロジスティック回帰を実行すると考えることができます。
user20160 2017

@ウェイン; 多項ロジットにはIIAの仮定が必要なので、私は不思議に思っています。しかし、ソフトマックスアクティベーションを備えたニューラルネットワークについてはどうですか?同じ前提が必要ですか?
ElleryL

0

また、ニューラルネット(ソフトマックスのアクティブ化を使用)、ディシジョンツリー(またはランダムフォレスト)は、IIA仮定の確認に関するこれらのテストの信頼性の低さを考慮すると、IIA仮定を満たす必要はないと考えます。したがって、これが予測のみである場合、これは多項ロジスティックスと比較して利点になる可能性があります。

あるいは、Kthカテゴリーを参照として、K-1カテゴリーに対して複数のロジスティックモデルを構築できます。これにより、多項式とは対照的に、方程式ごとに異なる予測子を接続することもできます


1
これは答えというよりはむしろコメントです。コメントで回答を変換するか、回答を拡張することができます。
フェルディ2017

ニューラルネット(ソフトマックスのアクティブ化)がIIAの仮定を必要としない理由を説明していただけませんか。これによると、en.wikipedia.org
wiki / Luce%27s_choice_axiom
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.