縮退


22

ピアソン相関係数の人口値の2種類の推定量について、私の頭の中にいくつかの混乱がありました。

A. フィッシャー(1915)二変量正規母集団実証するためにあることを示したである負にバイアスの推定量ρバイアスだけ小さいサンプルサイズ(のために実際にかなりの量であることができるが、N < 30)。サンプルrは、ρよりも0に近いという意味でρを過小評価しています。(後者が0または± 1の場合を除き、rは不偏です。)ρのほぼ不偏の推定量がいくつか提案されてます。rρn<30rρ0ρ0±1rρオルキンとプラット(1958)は修正しました。r

runbiased=r[1+1r22(n3)]

B.回帰では、は対応する母集団のR平方を過大評価していると言われています。または、単回帰で、それはつまり、R 2つの過大評価はρ 2。事実に基づいて、私はそれを言って、多くのテキストを見てきましたrがされ積極相対バイアスρを絶対値を意味する、:rは遠くからである0よりρ(?その文が真です)。テキストは、サンプル値による標準偏差パラメーターの過大評価と同じ問題であると述べています。観測されたR 2を「調整」するための多くの式が存在しますR2r2ρ2rρr0ρR2人口パラメータに近いWherryの(1931) は最もよく知られています(ただし、最良ではありません)。そのような調整されたr 2 adjのルートはshrunken rと呼ばれます:Radj2radj2 r

rshrunk=±1(1r2)n1n2

2つの異なる推定量が存在します。非常に異なる:最初のものはrを膨張させ、2番目はrを収縮させます。それらを調整する方法は?1つをどこで使用/報告し、もう1つを報告しますか?ρrr

特に、「縮められた」推定量も(ほぼ)偏りのない「偏りのない」推定値であるが、異なるコンテキストでのみ-回帰の非対称コンテキストであるというの事実でしょうか。というのは、OLS回帰では、片側(予測子)の値を固定値と見なし、サンプルからサンプルへのランダムエラーなしで対応するためですか?(そして、ここに追加するために、回帰は二変量正規性を必要としません。)


これはジェンセンの不平等に基づいているだけなのかしら。それと、2変量正規性は、ほとんどの場合、おそらく悪い仮定です。
シャドウトーカー

1
また、Bの問題についての私の理解は、回帰が過大評価であるということです。これは、回帰当てはめを予測子を追加することで任意に改善できるためです。Aと同じ問題のように私には聞こえませんr2
shadowtalker15年

いることを、実際に真であるの正にバイアス推定値であるρ 2のすべての値に対してρ?2変量正規分布の場合、これはρが十分に大きい場合には当てはまらないようです。r2ρ2ρρ
NRH

バイアスは、推定量の二乗に対して反対方向に進むことができますか?例えば、単純な推定と、それことを示すことができるの一部の範囲に対してθθ = ρの場合、これを行うのは難しいと思いますが、おそらくもっと簡単な例を考え出すことができます。E[θ^θ]<0<E[θ^2θ2]θθ=ρ
アンソニー

回答:


1

相関関係の偏りについて:サンプルサイズが偏りが実用的な意味を持つほど小さい場合(たとえば、n <30)、不正確さはひどいため、偏りが心配の最小になる可能性があります。

重回帰におけるR 2のバイアスに関しては、同じサイズの独立したサンプルでの不偏母集団推定と不偏推定に関係する多くの異なる調整があります。Yin、P.&Fan、X.(2001)を参照してください。重回帰におけるR 2収縮の推定:分析方法の比較。Journal of Experimental Education、 69、203-224。

現代の回帰法は、回帰係数の縮小とその結果としてのR 2にも対応しています。たとえば、k倍の交差検証を備えたエラスティックネット、http: //web.stanford.edu/~hastie/Papers/を参照してください。 elasticnet.pdf


1
これが本当に質問に答えるかどうかわかりません
-shadowtalker

1

その答えは、単純回帰と重回帰のコンテキストにあると思います。1つのIVと1つのDVを使用した単純な回帰では、R sqは正にバイアスされず、rが負にバイアスされると、in-factは負にバイアスされる場合があります。しかし、それ自体が相関する可能性のある複数のIVによる重回帰では、発生する可能性のある「抑制」のために、R sqが正にバイアスされる可能性があります。したがって、私の見解では、観測されたR2は対応する母集団のR平方を過大評価しますが、重回帰でのみです


1
R sq is not positively biased, and in-fact may be negatively biased面白い。見せたり参考にしたりできますか?-二変量正規母集団では、観測されたサンプルRsq統計量は負にバイアスされた推定量になりますか?
ttnphns

あなたは間違っていると思います。あなたの主張をバックアップするための参照をお願いできますか?
リチャードハーディ

申し訳ありませんが、これはより多くの思考演習でしたので、私は参照を持っていません。
ディンガス

上記のコメントAから離れていました。フィッシャーは、2変量の通常の状況で、rはrhoの負にバイアスされた推定量であることを示しました。その場合、R sqにも負のバイアスがかけられないでしょうか?
ディンガス

おそらくこれは、会話に役立つdigitalcommons.unf.edu/cgi/...
Dingus
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.