5
打ち切りデータとは正確には何ですか?
打ち切りデータのさまざまな説明を読みました。 A)このスレッドで説明されているように、特定のしきい値を下回るまたは上回る数量化されていないデータは打ち切られます。数量化されていないということは、データが特定のしきい値を上回るか下回ることを意味しますが、正確な値はわかりません。データは、回帰モデルの低しきい値または高しきい値でマークされます。これは、このプレゼンテーションの説明と一致しますが、非常に明確であることがわかりました(最初のページの2番目のスライド)。つまり、は最小値、最大値、またはその両方に制限されます。これは、その範囲外の真の値がわからないためです。YYY B)友人から、未知の結果に関する少なくともいくつかの制限情報があれば、打ち切りデータモデルを部分的に未知の 観測に適用できると言われました。たとえば、いくつかの定性的基準(商品の種類、国、入札者の富など)に基づいて、サイレントオークションと公開オークションの組み合わせの最終価格を推定します。公開オークションではすべての最終価格わかりますが、サイレントオークションでは最初の入札(たとえば1,000ドル)だけがわかり、最終価格はわかりません。この場合、データは上から打ち切られ、打ち切り回帰モデルを適用する必要があると言われました。YYYYiYiY_iYiYiY_i C)最後によって与えられた定義があるウィキペディア完全に欠けているが、予測因子が利用可能ですが。この例が切り捨てられたデータとどのように異なるかはわかりません。YYY では、打ち切られたデータとは正確には何ですか?