このデータセットを扱っているとします。ここで、は連続変数(たとえば、指数)であり、は離散分布(たとえば、ポアソン)です。がと間の相関であるとしましょう。どうすれば定義できますか?
予測変数のいくつかがカウントデータであり、応答データが連続的である場合、モデリングのために変数選択を行うのが一般的です。実数と整数を比較することは禁止されていません。分布の形はより大きな問題になります。一連のTukeyのラダー関数(パワーシリーズとも呼ばれます)を試してみます。
—
Chris
@Chrisコメントありがとうございます。ここでは回帰を扱っていません(ただし、GLMを構築すると相関関係が取得されると誰かが主張することはできます)。相関の尺度があるかどうかに興味があります(つまり、連続データのピアソンの尺度)。
—
user9292 2015
通常のピアソン相関がこの問題の相関の尺度にならないのはなぜですか?
—
Glen_b-2015