データブレンドとは


15

この用語は、メソッド関連のスレッドで頻繁に使用されます。

されたブレンドデータマイニングと統計的学習における具体的な方法を?Googleから関連する結果を取得できません。

ブレンディングは多くのモデルの結果を混合し、より良い結果をもたらしているようです。それについてもっと知るのに役立つリソースはありますか?

回答:


10

http://www.cs.cornell.edu/~caruana/ctp/ct.papers/caruana.icml04.icdm06long.pdf ブレンドとは何かをさらに理解するのに役立ついくつかの論文。アンサンブルの選択/学習、スタックも同様にグーグルで検索できると思います。

「多くのモデルからの結果を混合し、より良い結果をもたらす」という一般的な理解は正しいものです。


そのリンクはkaggleフォーラムのどこかからも取られました。PDFのリンクのみを保存しましたが、ディスカッションは保存しませんでした
キング

12

ブースティング(リンクされた説明で述べたように)は、一連のアルゴリズムを組み合わせて、単一のアルゴリズムから得られるものよりも優れた結果を得る方法です。たとえば、ランダムフォレストは、分類アルゴリズムのためにさまざまな分類ツリーを組み合わせる方法です。このアプローチは、正式にはアンサンブル平均と呼ばれます(ただし、アルゴリズムは通常多数決ルールを適用します)。ブレンディングは、分類へのブースティングアプローチを説明するために使用する単語のようです。


それで、通常のadaboostモデルの分類ツリーを他のアルゴリズムのセットに置き換えた場合、これをブレンドと呼ぶことができますか?
トムホール

こんにちは、マイケル。あなたの答えは本当に役に立ちますが、恥ずかしいことに、私は統計の初心者であり、あなたの答えをまだ投票するのに十分な評判を得ていません。
トムホール

1
それでは、いくつかの担当者ポイントを取得した後、それを忘れないでください。
マイケルR.チャーニック

0

業界では、データブレンドはモデルではなく前処理に関するものです。データベースからのデータやCSVファイルからの他のデータなど、さまざまなソースからのデータがマージされるのはそのときです。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.