回答:
ロジスティック回帰を実行すると、および0としてコード化された2つのクラスが与えられます。ここで、1つの個体が1としてコーディングされたクラスに属する説明変数を与えられる確率を計算します。確率のしきい値を選択し、このしきい値を超える確率を持つすべての個人をクラス1として分類し、0として分類する場合通常、2つのグループを完全に識別することはできないため、ほとんどの場合、いくつかのエラーが発生します。このしきい値では、エラーといわゆる感度と特異度を計算できます。多くのしきい値でこれを行う場合、多くの可能なしきい値の1特異性に対する感度をプロットすることにより、ROC曲線を作成できます。判別分析やプロビットモデルなど、2つのクラスを区別しようとするさまざまな方法を比較する場合は、曲線の下の領域が役立ちます。これらのすべてのモデルに対してROC曲線を作成できます。曲線の下の面積が最も大きいモデルが最適なモデルと見なされます。
ロジスティック回帰モデルは、直接的な確率推定方法です。分類は、その使用において何の役割も果たさないはずです。非常に特別な緊急事態を除き、個々の被験者の効用の評価(損失/コスト関数)に基づいていない分類は不適切です。ここではROC曲線は役に立ちません。また、全体的な分類精度と同様に、最尤推定によって適合されていない偽のモデルによって最適化される不適切な精度スコアリングルールである感度または特異性もありません。
私はこのブログの著者ではありません。このブログは非常に役に立ちました。http://fouryears.eu/2011/10/12/roc-area-under-the-curve-explained
この説明をデータに適用すると、平均的な肯定的な例では、負の例の約10%がそれよりも高いスコアを獲得しています。