(たとえば)5分割交差検証を実行する場合、通常は5分割ごとに個別のROC曲線を計算し、多くの場合stdで平均ROC曲線を計算します。開発者。曲線の太さとして表示されます。
ただし、各フォールドに単一のテストデータポイントしかないLOO交差検証の場合、この単一のデータポイントのROC "曲線"を計算することは意味がありません。
私はすべてのテストデータポイントを(個別に計算されたp値と共に)取得し、それらを1つの大きなセットにプールして単一のROC曲線を計算しましたが、これは統計的に正確な方法ですか?
(LOO相互検証の場合のように)各フォールドのデータポイントが1つである場合にROC分析を適用する正しい方法は何ですか?
どうして?あなたはそのような生き物で何を達成したいですか?
ある範囲のp値のしきい値全体で予測全体のパフォーマンスを分析する必要があります。ROC曲線は、他のすべてのタイプの相互検証に従来使用してきたものです。したがって、基本的にはROC分析がk分割交差検証に役立つのと同じ理由です。LOO xvalに異なる類似のアプローチがある場合、それも知っておくとよいでしょう。また、十分なデータがあり、これが問題にならない場合は、代わりに10倍xvalのようなことをします。
—
user1121 2011年
私はあなたが賢明にそれをしていると思います、真のラベルと各ケースの予測値を使用して単一のROCカーブを作成します(そのケースはホールドアウトでした)
—
B_Miner