キャレットの再サンプリング方法


20

caretR のライブラリを使用して、さまざまなモデリング手順をテストしています。

trainControlオブジェクトは、1つの再サンプリング方法を指定することを可能にします。方法は、に記載されている文書のセクション2.3を含む:bootboot632cvLOOCVLGOCVrepeatedcvおよびoob。これらのいくつかは推測が容易ですが、これらの方法のすべてが明確に定義されているわけではありません。

これらのリサンプリング方法に対応する手順は何ですか?


ドキュメントのリンクが壊れています。代わりにこれを使用してください。
ビカ16

回答:


20

わかりました、ここに私の試みがあります:


1
LGOCVは、トレーニングセットと検証セットの間でランダムに分割され、n回繰り返されると思います。そのため、データを列車とホールドアウトに分割する通常のケース(列車でモデルを構築し、ホールドアウトで検証する)の代わりに、このプロセスが何度も繰り返されます。
B_Miner

3
また、繰り返されるCVはk倍のクロス検証であり、複数回実行されると考えています。
B_Miner

これはどこにも文書化されていないとは信じがたい。
アンドリュー

4

repeatedcvマックス・クーン氏のプレゼンテーションによると、確かに10倍の相互検証を繰り返しています。デフォルトのリサンプリングスキームはブートストラップです。

リサンプリング方法について確認できる優れたファイルは、Rとキャレットパッケージを使用した予測モデリングpdf)です。マックスはこれを「useR!2013」で発表しました。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.