質問が意味を成すかどうかはわかりませんが、ランダムな効果を持つランダムフォレストを提案した論文のタイトルを見たと思います。これはRで可能ですか?
質問が意味を成すかどうかはわかりませんが、ランダムな効果を持つランダムフォレストを提案した論文のタイトルを見たと思います。これはRで可能ですか?
回答:
それらは通常一緒に使用されることはないため、それらを組み合わせる前に注意が必要です。
通常、ランダムフォレストは分類子として使用されます。別の方法(K平均クラスタリングなど)の代わりにランダムフォレストを使用する理由は、分類するディメンションが多数ある可能性があるためです。ディメンションの数が多い場合の問題は、ディメンションの順序のすべての組み合わせをテストする場合、選択肢が多数あることです(ディメンションの階乗の数よりも速く増加します)。
ランダム効果は通常、同じことを繰り返し測定する回帰で使用されます。これらは、混合という用語が固定効果とランダム効果の両方を指す混合効果モデルで一般的に使用されます。固定効果は、再び表示されるパラメーター(たとえば、薬物や年齢)を表すと考えられます。ランダム効果は、今後は表示されないパラメーター(特定の人物など)の変動のインスタンスを表すと考えられます。
クラスター化されたデータがある場合にそれらを一緒に使用する例がありますhttp://dx.doi.org/10.1080/00949655.2012.741599およびhttp://www2.ims.nus.edu.sg/Programs/014swclass/files/denis.pdf。
私は、この分析を行うことができるRパッケージを知りません。
ええ、それは可能です。「RE-EMツリー:縦断的およびクラスター化されたデータのデータマイニングアプローチ」および関連するRパッケージREEMtreeを確認する必要があります。
論文を見てからしばらく経ちました。著者はまだこれらの木のアンサンブルを形成しようとしていないが、それが機能しないことを示唆するものはなかったことを思い出す。
混合効果ランダムフォレスト(MERF)は重要です。上記の答えが述べているように、HECモントリオールのラロック博士のグループによるそれらに関するいくつかの素晴らしい研究があります。論文はここにある:http://www.tandfonline.com/doi/abs/10.1080/00949655.2012.741599。
本質的に、ランダムフォレストの非線形モデリングと線形ランダム効果を組み合わせる理論的に健全な方法です。
上記のアルゴリズムを使用してMERFを実装するPythonのオープンソースパッケージをリリースしました。
パッケージとクラスター化されたデータセットでの使用方法に関する詳細なブログ記事を作成しました。