キャレットを使用したモデルのスタック/アンサンブル


21

caretRを使用していくつかの異なる予測モデルをトレーニングすることがよくあります。すべてを同じクロス検証フォールドでトレーニングし、を使用してcaret::: createFolds、クロス検証エラーに基づいて最適なモデルを選択します。

ただし、いくつかのモデルからの予測の中央値は、独立したテストセットで最良の単一モデルを上回ることがよくあります。同じクロス検証フォールドでトレーニングされたキャレットモデルをスタック/アンサンブルするための関数を書くことを考えています。たとえば、各フォールドの各モデルから中央値予測を取得したり、「メタモデル」をトレーニングしたりします。

もちろん、これには外側の相互検証ループが必要になる場合があります。キャレットモデルをアセンブルするための既存のパッケージ/オープンソースコードを知っている人はいますか?

回答:


19

Max Kuhnが実際にキャレットモデルのアンサンブル用パッケージの作業を開始したように見えますが、まだ終了する時間がありません。これはまさに私が探していたものです。プロジェクトがいつか完成することを願っています!

編集:これを行うために独自のパッケージを作成しました:caretEnsemble


1
このパッケージのすばらしい仕事です!
mikeycgto

8

探しているものは「モデルの組み立て」と呼ばれます。Rコードを使用した簡単な入門チュートリアルは、http//viksalgorithms.blogspot.jp/2012/01/intro-to-ensemble-learning-in-r.htmlにあります。


3
うるさいことではありませんが、私の記事のタイトルには「アンサンブル」があります。私は、任意のモデルを組み立てるためのRパッケージを非常に具体的に探していますが、これは存在しないようです。ただし、コードを投稿していただきありがとうございます。たぶん私は自分のパッケージを書くでしょう!
ザック

1

あなたが何を探しているのかよくわかりませんが、これは役立つかもしれません:http : //www.jstatsoft.org/v28/i05/paper

キャレットで複数のモデルを使用する方法です。あなたが興味があるかもしれない部分は、pgのセクション5です。13。


私が探しているのは、キャレットオブジェクトのリストを入力として受け取り、その予測の中央値、平均、または加重平均を出力するパッケージです。より高度な機能には、ネストされたクロス検証による重みの最適化が含まれる場合があります。
ザック
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.