ロジット回帰の従属変数の測定エラーを修正するにはどうすればよいですか?


8

従属変数がごく一部のケースで誤ってコーディングされていることがわかっているバイナリロジット回帰を実行しています。だから私はこのモデルでを推定しようとしています:β

prob(yi)=1/(1+ezi)

zi=α+Xiβ

代わりにベクトルの、私はYいくつかのランダムな誤差を含む(すなわち、Y I = 1、しかしY iは = 0、いくつかのために、またはその逆をIを)。YY~yi=1yi~=0i

この問題に対する(合理的に)簡単な修正はありますか?

ケースコントロール研究では、ロジットにいくつかの優れた特性があることを知っています。ここでも同様のことが当てはまるようですが、良い解決策を見つけることができませんでした。

その他のいくつかの制約:これはテキストマイニングアプリケーションであるため、の次元は大きくなります(数千または数万)。これにより、計算量の多い手順が除外される場合があります。X

また、私は正しく推定することは気にせず、βだけを気にします。αβ

回答:


2

β


1
要約によると、このペーパーは「エラーが発生しやすいバイナリ共変量」、つまり誤って分類された独立変数のみを処理するようです。
whuber

1
両方で実際に抽象的な情報:「成果誤分類のために、我々は可能性に基づいた分析はクリーンかつ最も好ましいアプローチであると主張共変量誤分類の場合、私達はコンバイン[...]。
rolando2

2

MLEを使用してエラーのパラメトリックモデルを推定するか、最大ランク相関(MRC)推定器などに基づくセミパラメーターアプローチを使用できます。計算上、MRCは大量のサンプルに対して禁止されているため、MLEが私にとって適切なアプローチであるように見えます。

特に「誤分類エラー」という用語に関して、いくつかの良い迅速な指示をしてくれたGaBorgulyaに感謝します。

このトピックに関する優れた情報源は次のとおりです。

元の問題で説明されているとおりの基本モデル

同じのゲートなしバージョン

より複雑ですが、より一般的なモデル

素敵な概要

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.