ノンパラメトリック混合アプローチで処理しようと考えているクラスターについて質問があります(私はそう思います)。人間の関わりの説明に取り組んでいます。
私のデータベースの各行には以下が含まれます:
- 誰かのID
- 環境Xのいくつかのパラメータ(例:温度、風など)
- パラメータに対する人の反応を表すバイナリ変数Y(例:天候のために病気になるか、病気にならない)。
私の考え(データではなく直感に基づく)は、有限数のグループに人々を集めて、グループ内の人々が同じように温度に反応できるようにすることです(簡単に病気になる人もいれば、決して病気にならない人もいます...)。 。特定のグループでは、より正式には、パラメーターXを条件とするYの法則は同じです。
Xを条件とするYの法則を知りません。パラメータXについては、必要に応じていくつかの仮説を立てることができます。
パラメータに対する同じ反応を「多かれ少なかれ持っている」人々のクラスタを作成したいと思います。さらに、パラメーターの特定の値に対する特定の人の反応を予測したいと思います(このイベントがデータベースで発生したことがない場合でも)。
- 私のアプローチは正しいですか?
- この問題について別の見方をお勧めしますか?
私はそれについてのどんな参考文献にも非常に興味があります。
問題の説明を再定式化するよう私に頼むことを躊躇しないでください。