[注:以下の更新1を参照してください。]の方法論rpart
はの説明よりもはるかに簡単ですparty
。ただし、後者ははるかに洗練されており、より良いモデルを提供する可能性があります。私が時々説明する方法party
は、ローカル線形(またはGLM)モデルを作成するための基礎としてそれを話すことです。rpart
リーフノードに分類されるすべての要素(つまり、分割で囲まれたボックス/領域)の結果が一定であることを指摘して、これを構築します。ローカルモデルによる改善があったとしても、一定の予測しか得られません。
対照的にparty
、分割を開発して、潜在的に地域のモデルを最適化します。実際にはモデルの最適性とは異なる基準を使用していますが、違いを説明するための独自の能力を測定して、それをうまく説明できるかどうかを判断する必要があります。それのための論文は、研究者のためにかなりアクセス可能ですが、非常に昇圧、ランダム森のような単純な方法を検討することを望んでいない誰かのためなど数学的に挑戦することができる、私はそれが思うparty
より洗練され...それでも、CARTモデルがしやすくなります方法論と結果の両方の面で説明し、これらはより洗練されたツリーベースのモデルを導入するためのまともな足がかりを提供します。
要するに、rpart
明確にするためにあなたがしなければならないと言います、そして、あなたはparty
正確さ/性能のために使うことができます、しかし、私は導入party
せずに紹介しませんrpart
。
更新1. 1 party
年または2年前の私の理解に基づいて答えを決めました。かなり成長しrpart
ましたが、クライアント/コラボレーターにとって「空想ではない」が重要な基準であるならば、その簡潔さとレガシーをお勧めしますと答えを修正します。しかし、にparty
誰かを紹介した後、からより多くの機能を使用するように移行しようとしrpart
ます。はるかに複雑な概念を含むパッケージと方法論を導入する前に、単純なコンテキストで、損失関数、分割基準などを使用して小規模に開始することをお勧めします。