従属変数がごく一部のケースで誤ってコーディングされていることがわかっているバイナリロジット回帰を実行しています。だから私はこのモデルでを推定しようとしています:
代わりにベクトルの、私は〜Yいくつかのランダムな誤差を含む(すなわち、Y I = 1、しかし〜Y iは = 0、いくつかのために、またはその逆をIを)。
この問題に対する(合理的に)簡単な修正はありますか?
ケースコントロール研究では、ロジットにいくつかの優れた特性があることを知っています。ここでも同様のことが当てはまるようですが、良い解決策を見つけることができませんでした。
その他のいくつかの制約:これはテキストマイニングアプリケーションであるため、の次元は大きくなります(数千または数万)。これにより、計算量の多い手順が除外される場合があります。
また、私は正しく推定することは気にせず、βだけを気にします。