私には3つの変数があります。
- 距離(連続、可変範囲、負の無限大から正の無限大)
- isLand(離散カテゴリ/ブール、可変範囲1または0)
- 居住者(離散カテゴリカル、可変範囲0〜7)
次の統計的な質問に回答したいと思います。
- カテゴリー変数と連続変数の両方がある分布を比較する方法。たとえば、距離と居住者のデータ分布がisLandの値に応じて変化するかどうかを確認します。
- 3つの変数のうち2つが与えられた場合、いくつかの方程式を使用して3番目の変数を予測できますか?
- 3つ以上の変数を使用して独立性を判断するにはどうすればよいですか?
1
これを3つの個別の質問に分割することをお勧めします。
—
シェーン
実際、これをもう少し詳しく読んだので、それぞれの答えは非常に密接に関連していることがわかります。
—
シェーン
質問の核心は2つの異なるディストリビューションを比較することだと感じました。たまたま、3つの異なる方法をリストするだけです。
—
Elpezmuerto
以下のために
—
Mike Dunlavey、2010
occupants
私は、カテゴリと考えるないようにあなたが持っているもの、順序変数です。特に8つの値では、ほぼ連続しています。