残差vs適合プロット上の平行な直線


8

重回帰の問題があり、単純な重回帰を使用して解決しようとしました:

model1 <- lm(Y ~ X1 + X2 + X3 + X4 + X5, data=data)

これは、85%の分散(R-squaredによる)を説明しているようで、かなり良いようです。

しかし、私が心配しているのは、奇妙に見える残差対適合プロットです。以下を参照してください:

ここに画像の説明を入力してください

このような平行線がある理由は、Y値にはX値の約160に対応する10個の一意の値しかないためだと思います。

この場合、おそらく別のタイプの回帰を使用する必要がありますか?

編集次の論文で同様の動作を確認しました。1ページのみの用紙なので、プレビューするとすべて読むことができます。この動作を観察する理由はかなりよく説明されていると思いますが、他の回帰がここでうまく機能するかどうかはまだわかりませんか?

Edit2:私が考えることができる私たちのケースに最も近い例は、金利の変化です。FEDは新しい金利を数か月ごとに発表します(いつ、どのくらいの頻度かわかりません)。それまでの間、日次で独立変数(日次インフレ率、株式市場データなど)を収集します。その結果、1つの金利に対して多くの測定値を持つことができる状況になります。


1
ほとんどの場合、他の形式の回帰が必要です。Yデータが序数である場合(私はそう思う)、おそらく序数ロジスティック回帰が必要です。これを行う1つのRパッケージはですがordinal、他にもあります
Peter Flom

実際、Yは予測​​しようとする価格であり、数か月ごとに変化します。数か月ごとに変化する対応する価格(Y)の週ごとのレコーダー変数(X)があります。この場合、将来の価格がわからないときにロジスティック回帰は機能しますか?
Datageek 2012

2
あなたは説明について正しいです。あなたの参照はそれを釘付けにしました。しかし、状況は異常に見えます。独立した応答は10個程度しかなく(離散的な尺度ではなく、連続的な尺度であるようです)、時間とともに変化する複数の説明変数を使用しています。これは、ほとんどの回帰手法で想定される状況ではありません。これらの変数の意味とそれらの測定方法に関する詳細情報は、優れた分析アプローチの特定に役立つ可能性があります。
whuber

回答:


4

y1,y10ZYi=yjyj1Ziyj+1y0=,y11=+


1
これは良い考えです。それは現象を処理しますが、それがより大きな問題を見落とすのではないかと思います。
whuber

censReg Rパッケージを試しましたが、動作させることができませんでした。あなたの考えが理解できなかった可能性もあります。問題は、すべての従属変数を知っているため、Y = 0(打ち切り)の状況が発生しないことです。Yが数か月間安定しているだけです。私は別の編集を行ったばかりなので、うまくいけば、これは私たちのユースケースをよりよく説明します。
Datageek 2012

1
Y(t)t1,t2,Z(t)titi+1 Z(t)Y(ti)Y(ti+1)tZ(t)Y(ti)Y(ti+1)

1
Z(yj1,yj+1Z(t)f(Z(1),Z(2,,Z(t1))Z
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.