タグ付けされた質問 「random-forest」

ランダムフォレストは、多くの決定木の出力の組み合わせに基づく機械学習手法です。

3
ランダムフォレストの予測式を出力するためのアイデア
私が尋ねようとしていた質問に答えた次の投稿を読みました: ランダムフォレストモデルを使用してセンサーデータから予測を行う 出力予測の決定木 これまでに行ったことは次のとおりです。私はロジスティック回帰をランダムフォレストと比較し、RFがロジスティックを上回りました。今、私が一緒に働く医学研究者は私のRF結果を医学診断ツールに変えたいと思っています。例えば: 25〜35歳のアジア人男性で、ビタミンDがxx未満で、血圧がxxを超えている場合、76%の確率で病気xxxを発症します。 ただし、RFは単純な数式に適していません(上記のリンクを参照)。だから私の質問です:RFを使用して診断ツールを開発するためにあなたは皆どんなアイデアを持っていますか(数百本の木をエクスポートする必要はありません)。 ここに私のアイデアのいくつかがあります: 変数の選択にRFを使用してから、ロジスティックを使用して(考えられるすべての相互作用を使用して)、診断方程式を作成します。 どういうわけか、RFフォレストを1つの「メガツリー」に集約します。これにより、ツリー全体でノード分割が平均化されます。 #2や#1と同様に、RFを使用して変数を選択し(合計でm個の変数など)、何百もの分類ツリーを構築します。これらすべてですべてのm変数を使用し、最適な単一ツリーを選択します。 他のアイデアは?また、#1を行うのは簡単ですが、#2と#3を実装する方法に関するアイデアはありますか?

3
ブレイマンのコードを使用して教師なしランダムフォレスト分類を実行する方法
私はブレイマンのランダムフォレストコード(http://stat-www.berkeley.edu/users/breiman/RandomForests/cc_manual.htm#c2)を使用して、衛星データの分類(教師あり学習)を行っています。サンプルサイズが2000、変数サイズが10のトレーニングとテストのデータセットを使用しています。データは2つのクラスAとBに分類されます。教師あり学習モードでは、アルゴリズムは非常に低い分類エラー(<2%)で良好に実行されます。ここで、テストデータセットにクラスラベルのない教師なし分類を試し、アルゴリズムがクラスを予測する方法を確認します。ブレイマンのコードを使用して教師なし分類を実装する方法はありますか?この方法のエラーは、監視あり分類よりも高くなりますか?アルゴリズムのデータと実行パラメーターの設定を以下に示します。 DESCRIBE DATA 1 mdim = 10、ntrain = 2000、nclass = 2、maxcat = 1、1 ntest = 2000、labelts = 1、labeltr = 1、 SET RUN PARAMETERS 2 mtry0 = 3、ndsize = 1、jbt = 500、look = 100、lookcls = 1、2 jclasswt = 0、mdim2nd = 0、mselect = 0、

2
ランダムフォレストの補完
ランダムフォレスト(特にRのrandomForest)を(予測子空間で)欠損値補完に使用することについて、2つの質問があります。 1)代入アルゴリズムはどのように機能しますか?特に、代入にクラスラベルがどのようにそしてなぜ必要なのですか?クラスごとに定義された欠損値を補完するために平均値に重みを付ける役割を果たす近接行列は何ですか? 2)欠損値を補完するためにクラスラベルが必要な場合-これを使用して、予測しようとしている新しいデータの欠損値を補完する方法を教えてください。

3
アンサンブル分類器で分類はどのようにマージされますか?
アンサンブル分類器は、構成要素である分類器の予測をどのようにマージしますか?明確な説明が見つからない。私が見つけたいくつかのコード例では、アンサンブルは予測を平均化するだけですが、これがどのようにして「より良い」全体的な精度を実現できるかはわかりません。 次のケースを考えてください。アンサンブル分類子は、10個の分類子で構成されています。1つの分類子の精度は、データサブセットXの時間の100%、それ以外の時間はすべて0%です。他のすべての分類子の精度は、データサブセットXでは0%、その他の場合はすべて100%です。 分類器の精度が無視される平均化式を使用すると、集団分類器の精度はせいぜい50%になります。これは正しいですか、それとも何か不足していますか?N個の潜在的に無知な分類子から平均予測を取得すると、特定のドメインの専門家である単一の分類子よりも優れた予測を作成できる可能性があります。

1
デシジョンフォレストとランダムフォレストは同じものですか?
Cross Validatedの回答に基づいて、テキストドキュメントを分類するために.NET / C#にランダムフォレストを実装することを検討してきました。 既存の実装があるかどうかを確認するためにWebを見て、Alglibの意思決定フォレストのアルゴリズムに出くわしました。 問題は、「決定の森」に固有の何かをどこにも見つけることができないように見えることです(ここでもあいまいです)。通常、ランダムな森と混ざっています。 とはいえ、2つは同じであり、単に異なって参照されているだけですか、それとも2つの間に固有の違いがありますか?

2
縦断データのあるランダムフォレスト
複数の個人の多くの測定値がありますが、ランダムフォレストモデルを実行するときに、その繰り返し測定構造をどのように説明するかわかりません。 ランダムフォレストモデルを使用して、縦断的なデータの基になるデータ構造を説明する方法はありますか? これも必要ですか?-それはあるべきだと私には思われます... 特にでこれを実行できるようにしたいと思いRます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.