世界の国ごとに5つの変数があり、独立変数に対するそれらの影響と相互作用を分析する必要があります。ランダムフォレストは、非線形の関係を扱い、変数の重要性を予測するため、私のスコープには適切です。しかし、空間依存が問題になるのではないかと思います。それが空間データに広く使用されている場合でも、RFアプリケーションで説明されている空間依存性を見たことがありません。
世界の国ごとに5つの変数があり、独立変数に対するそれらの影響と相互作用を分析する必要があります。ランダムフォレストは、非線形の関係を扱い、変数の重要性を予測するため、私のスコープには適切です。しかし、空間依存が問題になるのではないかと思います。それが空間データに広く使用されている場合でも、RFアプリケーションで説明されている空間依存性を見たことがありません。
回答:
応答または説明変数の空間的自己相関に問題はありません。これは完全にノンパラメトリックな手法です。通常のグリッドからの現場データに基づいて、国全体の構造的多様性変数の補間に使用し、共変数として座標を導入すると、より良い予測が生成されます。これは、ランダムフォレストが分割統治アプローチ(分類および回帰ツリー)に基づいているためです。つまり、フィーチャスペースが互いに素なサブセットに分離され、単純なモデル(デフォルトでは回帰の場合は単純な平均)で適切な予測を生成できます。私の場合、変数として座標を導入することは、国の特定の地理的サブセットが均一に振る舞うことが理にかなっているので、空間的自己相関を利用します。