複数のターゲットを持つデータを処理できる手法(例:3つの従属変数:2つの離散と1つの連続)に関するリソース(本、講義ノートなど)を探しています。
誰かこれに関するリソース/知識はありますか?これにニューラルネットワークを使用することは可能です。
複数のターゲットを持つデータを処理できる手法(例:3つの従属変数:2つの離散と1つの連続)に関するリソース(本、講義ノートなど)を探しています。
誰かこれに関するリソース/知識はありますか?これにニューラルネットワークを使用することは可能です。
回答:
ランダムフォレストはそれをうまく処理します。複数の出力を持つランダムフォレストが可能/実用的であるかを参照してください。またはscikit learnのドキュメント。GBMやツリーベースのメソッドは、同様の方法で適応できると思います。
より一般的には、スコアを最小化する学習アルゴリズムを実行すると、通常は1次元のを最小化することに取り組みます。ただし、任意のターゲット関数を指定できます。(2次元の)位置予測で作業している場合、は適切なメトリックになります。
タイプ出力(分類と回帰)が混在している場合、ターゲット関数を指定するには、他のターゲットよりもいくつかのターゲットに重みを与えるターゲット関数を指定する必要があります。連続応答にどのスケーリングを適用しますか?誤分類にはどの損失を適用しますか?
さらなる学術読書については、
複数の出力予測のためのランドマーク選択方法 (高次元の従属変数を持つ取引)
このペーパーは、現在のメソッド、利用可能なツールキット、およびテストするデータセットについて説明するのに適しています。
私はたまたまマルチターゲット回帰を必要とする商業的な問題に取り組んでおり、Clusツールキットには高性能と堅牢性がうまくブレンドされていることがわかりました
新しいメソッドのいくつか(2012年以降)は、Mulanツールキットの拡張機能として実装されています。これがGithubリンクです。Random Linear Target Combinationsなどのこれらのメソッドは、アンサンブルモデルよりも優れたパフォーマンスを報告しますが、このツールキットはClusツールキットほど成熟していないため、それらを使用していません。
ベイジアンはこの種の問題を引き受けます:混合タイプの空間的にインデックス付けされたデータのベイジアンノンパラメトリックモデル。多重応答要素は、さまざまな正規分布ランダムベクトルとそのリンク関数によって処理されます。したがって、完全な応答は、法線のベクトル、カウントのベクトル、およびベルヌーイのベクトルのスタックになります。