ROC曲線の解釈方法は?


13

SASのデータにロジスティック回帰を適用しました。これがROC曲線と分類表です。

ここに画像の説明を入力してください

私は分類表の数値に満足していますが、roc曲線とその下の領域が何を示すのか正確にはわかりません。どんな説明でも大歓迎です。

回答:


20

ロジスティック回帰を実行すると、および0としてコード化された2つのクラスが与えられます。ここで、1つの個体が1としてコーディングされたクラスに属する説明変数を与えられる確率を計算します。確率のしきい値を選択し、このしきい値を超える確率を持つすべての個人をクラス1として分類し、0として分類する場合10110通常、2つのグループを完全に識別することはできないため、ほとんどの場合、いくつかのエラーが発生します。このしきい値では、エラーといわゆる感度と特異度を計算できます。多くのしきい値でこれを行う場合、多くの可能なしきい値の1特異性に対する感度をプロットすることにより、ROC曲線を作成できます。判別分析やプロビットモデルなど、2つのクラスを区別しようとするさまざまな方法を比較する場合は、曲線の下の領域が役立ちます。これらのすべてのモデルに対してROC曲線を作成できます。曲線の下の面積が最も大きいモデルが最適なモデルと見なされます。

より深く理解する必要がある場合は、ここをクリックし ROC曲線に関する別の質問の答えを読むこともできます。


ROC曲線の下の面積は、分類表の正しいレートとどのように異なりますか?
ギュナル14年

2
表には、1つのしきい値の正しいものと正しくないもののみが示されています。ただし、AUROC曲線は、完全な分類方法の尺度であり、多くの異なるしきい値の正しいものと正しくないものです。
random_guy 14年

それを聞いてうれしい!
random_guy 14年

6

AUCは基本的に、1ラベル付きデータの予測応答確率からのランダムドローが、0ラベルデータの予測応答確率からのランダムドローよりもどれくらいの頻度で大きくなるかを示しています。


6

ロジスティック回帰モデルは、直接的な確率推定方法です。分類は、その使用において何の役割も果たさないはずです。非常に特別な緊急事態を除き、個々の被験者の効用の評価(損失/コスト関数)に基づいていない分類は不適切です。ここではROC曲線は役に立ちません。また、全体的な分類精度と同様に、最尤推定によって適合されていない偽のモデルによって最適化される不適切な精度スコアリングルールである感度または特異性もありません。

c15pYp0.05


@フランク・ハレル:切片に関する計算と誤差の範囲に関するコメントについて詳しく説明してください。ありがとう!
ジュリス14

@FrankHarrellは、モデルを較正するためにリッジ回帰を行うことになった場合、少なくとも15pの観測が必要であるというアドバイスをしますか?私の理解では、pを有効な次元に置き換えます。
Lepidopterist

正解です。2次(リッジ)ペナルティなどのペナルティを使用してパラメーターを推定すると、キャリブレーションが改善されます
フランクハレル

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.