ロジット回帰の従属変数の測定エラーを修正するにはどうすればよいですか？

8

従属変数がごく一部のケースで誤ってコーディングされていることがわかっているバイナリロジット回帰を実行しています。だから私はこのモデルでを推定しようとしています： $\beta$

$prob(y_i) = 1/(1 + e^{-z_i})$

$z_i = \alpha + X_i\beta$

代わりにベクトルの、私はいくつかのランダムな誤差を含む（すなわち、、しかし、いくつかのために、またはその逆を）。 $Y$ $\tilde{Y}$ $y_i = 1$ $\tilde{y_i} = 0$ $i$

この問題に対する（合理的に）簡単な修正はありますか？

ケースコントロール研究では、ロジットにいくつかの優れた特性があることを知っています。ここでも同様のことが当てはまるようですが、良い解決策を見つけることができませんでした。

その他のいくつかの制約：これはテキストマイニングアプリケーションであるため、の次元は大きくなります（数千または数万）。これにより、計算量の多い手順が除外される場合があります。 $X$

また、私は正しく推定することは気にせず、だけを気にします。 $\alpha$ $\beta$

logistic measurement-error

— 阿部
ソース

2

$\beta$

— ガボルグリア
ソース

1

要約によると、このペーパーは「エラーが発生しやすいバイナリ共変量」、つまり誤って分類された独立変数のみを処理するようです。

— whuber

1

両方で実際に抽象的な情報：「成果誤分類のために、我々は可能性に基づいた分析はクリーンかつ最も好ましいアプローチであると主張共変量誤分類の場合、私達はコンバイン[...]。

— rolando2

2

MLEを使用してエラーのパラメトリックモデルを推定するか、最大ランク相関（MRC）推定器などに基づくセミパラメーターアプローチを使用できます。計算上、MRCは大量のサンプルに対して禁止されているため、MLEが私にとって適切なアプローチであるように見えます。

特に「誤分類エラー」という用語に関して、いくつかの良い迅速な指示をしてくれたGaBorgulyaに感謝します。

このトピックに関する優れた情報源は次のとおりです。

— 阿部
ソース