上限のある1つの変数を考慮して、どのタイプの回帰を使用しますか?


9

次のように説明されている実験で、2つの変数(と)間の関係をモデル化するためにどの方法を使用すべきかわかりません。yxy

  • 3つの変数があります:、および。 x yxaimxy
  • の値は、実験の操作時に設定されます。ただし、とは常に等しいとは限りません。 x x a i mxaimxxaim
  • と間のピアソンの相関係数は約0.9です。 xxaimx
  • と間のピアソンの相関係数ははるかに小さく、約0.5です。yxy
  • y m a xyには最大値()があり、これを超えることはできません。ymax
  • 各データポイントは、を設定してとを読み取った後に取得されます。 x yxaimxy

間のピアソンの相関係数がと大きくないように、それは見え伴って増加する傾向がある。y y xxyyx

と単純な線形回帰を実行した後(および後者をに変換し直して、たとえばと同じグラフに表示されるようにした後)、両方の勾配陽性であるが、傾きのそれよりも大きい。x = g y g 1 f g 1 fy=f(x)x=g(y)g1fg1f

またはと言っても意味がありますか?(は、2番目のケースで早く到達します。)x m a x = g y m a xx m a xxmax=f1(ymax)xmax=g(ymax)xmax

ことを考慮によって結合されて、何の可能な最大値についても言えるに到達することができますか?y m a x xyymaxx

私が理解している限り、が独立変数でが従属変数である場合、形式の線形回帰を行うことは理にかなっています。ただし、このコンテキストでは、は独立であり、は依存していると考えることが理にかなっているかどうかはわかりません。x y x yy=f(x)xyxy

合計最小二乗回帰の方が適切でしょうか?到達できる値(およびその可能性)を決定する他の方法はありますか?xmax

(これが問題になる場合、とは正規分布に従っていないようです。より高い値に到達しようとする試みが多く行われているためです。)y xxyx


もしあなたがそれを見つけたら、あなたはこの関係をどうしますか?あなたは仮説をテストしますか、それともそれがどのように見えるかに興味がありますか?データポイントが多い場合は、非線形モデルを検討する必要があります。
mpiktas 2011年

@mpiktas、最終的には、どのx_maxが(一度だけではなく)定期的に到達できる妥当なターゲットであるかを知りたいです。その試みのために)。
Bruno

総最小二乗(またはエラーイン変数)回帰の分散場合に示されているに比べてかなりなる。との90%の相関は、分散が独立変数として安全に処理できるほど十分に小さい可能性があることを示唆しています。これは、対の残差のRMSE と対の残差のRMSEを比較することにより、回帰後のチェックができるものです。が問題であるかどうかは異なります。を使用して散布図に上限カットオフが表示された場合、それは重要な考慮事項です。y x aim x x aim x y x aim y max x aimxyxaimxxaimxyxaimymaxxaim
whuber

回答:


4

@Kingのポイントを2番目にしたいと思います。を回帰すること(「直接回帰」)とを回帰すること(「逆回帰」)は同じであるべきだと疑うことは非常に直感的です。 ただし、これは数学的にも、回帰が分析している状況にどのように関連しているかについても当てはまりません。グラフの縦軸にを、横軸にをプロットすると、何が起こっているかを確認できます。直接回帰は、データポイントとラインの間の垂直距離を最小化するラインを見つけますが、逆回帰は、水平距離を最小化します。一方を最小化する線は、次の場合にのみ他方を最小化しますx x y y x r x y = 1.0 y x x m a x = f 1y m a xyxxyyxrxy=1.0。何を説明したいか、何を使って説明したいかを決める必要があります。その質問への答えは、どの変数がとであるかを示し、モデルを指定します。また、(再び@Kingをフォロー)、同じ理由で、と言おうとはしません。 yxxmax=f1(ymax)

有界変数の問題については、通常、「実際の」金額が高くなる可能性がありますが、それを測定することはできません。たとえば、私の窓の外の温度計は120まで上がりますが、場所によっては140になる可能性があり、測定値は120しかありません。したがって、変数には上限がありますが、あなたが本当に考えたかったことには上限がありません。この場合、tobitモデルはそのような状況にのみ存在します。

別のアプローチは、レスのようなより堅牢なものを使用することです。これは、ニーズに完全に適している場合があります。


お待たせして申し訳ありませんでした。Tobitモデルについて読む必要があります。
ブルーノ

問題ない。回帰の性質(vs.逆回帰)の詳細については、ここを参照してください。さまざまなソフトウェアを使用してtobit回帰を適用する場合のヘルプについては、こちらをお試しください
gung-モニカの復活

3

まず、ここでと言っても意味がないと思います。これは、が説明されているにもかかわらず、1対1の関数であることを意味するようなものです他の観測されていない変数による。x m a xxmax=f1(ymax)xmax

第2に、それは独立変数または従属変数として扱うコンテキストに本当に依存します。私の経験から、理論が一つの方法を強く示唆しない限り。どちらでもかまいません。10月7日のコメントから、は依存関係にあり、は独立関係にあるようです。yxy

可能であれば、残差を調べて、残差を絞れるかどうかを確認します。あなたが忘れていた別の変数があるかもしれません。または、変数の変換に役立つ場合があります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.