3
データマイニングにおけるアソシエーションルールとデシジョンツリーの実際の違いは何ですか?
これら2つの手法の実際の違いについて、本当に簡単な説明はありますか? どちらも教師あり学習に使用されるようです(ただし、関連付けルールは教師なし学習も処理できます)。 両方とも予測に使用できます 「良い」説明に最も近いのは、Statsoft Textbookです。アソシエーションルールは次の目的で使用されると言われています。 ...大規模なデータセットのカテゴリ変数の特定の値間の関係または関連付けを検出します。 ながら、ディシジョン・ツリー分類をするために使用されるものとして説明されています。 ... 1つ以上の予測変数の測定値から、カテゴリ従属変数のクラスのケースまたはオブジェクトのメンバーシップを予測します。 ただし、Rデータマイニングでは、ターゲットフィールドで使用されるアソシエーションルールの例を示しています。 したがって、両方を使用してグループのメンバーシップを予測できますが、決定木は非カテゴリー入力データを処理できますが、関連付けルールは処理できないという重要な違いはありますか?または、より基本的なものがありますか?1つのサイト(sqlserverdatamining.com)は、主な違いは次のとおりであると述べています。 デシジョンツリールールは情報獲得に基づいており、アソシエーションルールは人気や信頼に基づいています。 したがって、(おそらく自分の質問に答える)それは、決定木が実際に分散を最小化しようとしている間に、データセットに表示される頻度(およびそれらが「真」である頻度)に基づいて関連付けルールが純粋に評価されることを意味しますか? 誰かが良い説明を知っているなら、彼らは私にそれを向けたいと思うでしょう、それは素晴らしいでしょう。