ポアソン回帰の係数の解釈

OLS回帰の係数と比較して、ポアソン回帰の係数を解釈する方法がわかりません。

時系列データがあるとします。左側の変数は1年あたりの勝ちゲーム数であり、私の右側の主要変数はNASDAQ値です。モデルをパーセンテージで解釈するのが私の好みの仕様である場合、勝ったゲームの対数変換を行います。また、NASDAQのログを見て、NASDAQが1％増加するとゲームの勝率がどの程度増加するかを説明することもできます。今、私はポアソンモデルが意味をなす可能性があることを認めます。なぜなら、勝ったゲームのデータはカウントされ、連続的ではないからです。私は、多くの制御変数を使用して回帰を実行します。

勝ったゲームで対数変換を行わず、代わりにゲームのみを使用しますか？係数を取得したときに、ある種の限界効果計算を実行しますか（プロビットで実行できるように）？
これらの係数はどのように解釈すればよいですか？
ポアソンの解釈をOLS（対数変換されたOLSまたは変換されていないOLS）と比較するにはどうすればよいですか？

私はこの種の質問が以前に尋ねられたことを知っていますが、私はまだそれを完全に理解していません。

poisson-distribution

— user1690130
ソース

私の答えはここでは関係あり： stats.stackexchange.com/questions/142338/...

— HalvorsenのはKjetil B

重要ではありませんが、これは一種の奇妙な例です。本当に時系列分析を行っているのか、NASDAQがチームが勝ったゲームの数とどう関係しているのかは明らかではありません。チームが勝ったゲームの数について何か言うことに興味がある場合、おそらくプレイされたゲームの数を知っているとすれば、バイナリロジスティック回帰を使用するのが最善だと思います。ポアソン回帰は、可能な合計が十分に制約されていないか、少なくとも不明な場合のカウントについて話すのに最も適しています。

ベータ版をどのように解釈するかは、一部には、使用されるリンクによって異なります。ログリンクがより一般的（通常はより適切）でも、IDリンクを使用することは可能です。ログリンクを使用している場合は、おそらく応答変数のログを取得しないでしょう。リンクは本質的にそれを実行しています。抽象的なケースを考えてみましょう。次のようにログリンクを使用したポアソンモデルがあります。または、

\hat{y} = exp ({\hat{β}}_{0}) * exp ({\hat{β}}_{1})^{x}

$\hat{y}=\text{exp}(\hat{\beta}_0)*\text{exp}(\hat{\beta}_1)^x$

\hat{y} = exp ({\hat{β}}_{0} + {\hat{β}}_{1} x)

$\hat{y}=\text{exp}(\hat{\beta}_0+\hat{\beta}_1x)$

（編集：醜いので、次のベータ版から「帽子」を削除しますが、それでも理解する必要があります。）

通常のOLS回帰では、共変量の値を条件とする応答変数のガウス分布の平均を予測しています。この場合、共変量の値を条件とする応答変数のポアソン分布の平均を予測しています。OLSの場合、与えられたケースが共変量で1ユニット高かった場合、すべての条件が等しく、その条件付き分布の平均はユニット高かったはずです。ここで、特定のケースが1ユニット高い（Ceteris paribus）場合、条件付き平均は倍高いと予想されます。たとえば、と言います ${\beta}_1$ $e^{{\beta}_1}$ ${\beta}_1=2$ 、その後、通常の回帰では2ユニット高く（つまり+2）、ここでは7.4 倍高くなります（つまりx 7.4）。どちらの場合も、が切片です。上記の方程式で、、次にexp、そしての平均を与えるexp（）に還元される場合の状況を考えます。すべての共変量が0の場合。 ${\beta}_0$ $x=0$ $({\beta}_1)^x=1$ ${\beta}_0$ $y$

これについて混乱する可能性のあることがいくつかあります。まず、ポアソン分布の平均を予測することは、ガウス分布の平均を予測することと同じではありません。正規分布では、平均は最も可能性の高い単一の値です。しかし、ポアソンの場合、平均はしばしば不可能な値になります（たとえば、予測平均が2.7の場合、それは存在する可能性のある数ではありません）。さらに、通常、平均は分散のレベル（つまり、SD）とは無関係ですが、ポアソン分布では、分散は平均と必然的に等しくなります（ただし、実際にはそうでないことが多く、複雑さが増します）。最後に、これらの累乗はそれをより複雑にします。相対的な変化ではなく、正確な値を知りたい場合は、0から開始する必要があります（つまり、 $e^{{\beta}_0}$ ）そして、あなたの方法を倍します。特定の値を予測するには、下の式のかっこ内の式を解いて指数化する方が簡単です。これにより、ベータ版の意味がわかりにくくなりますが、計算が容易になり、エラーの可能性が減ります。 $x$

— gung-モニカの回復
ソース

ご協力ありがとうございました！はい、私は例がひどいことに同意します。抽象化していただきありがとうございます。OLSの解釈方法を理解しています。xが1ユニット増加すると、yがbeta_1増加します。yの対数変換を行うと、xが1単位増えると、yが100 * beta_1％増加します。ポアソンをどうするかわかりません。beta_1を知っている場合、xが1ユニット増えると、yがいくら増加しますか？

— user1690130 2012年

答えの3番目の段落にあります。xの1単位の増加は、yのexp（）倍の増加にます。あなたの「古い」yが10だったとしましょう

β_{1}

$\beta_1$

β_{1} = 2

$\beta_1=2$ 、次にexp（

β_{1}

$\beta_1$ ）= 7.4、及びyが10であろう回依然として、それは等、74 * 7.4であろう1つの単位高かった別の観察があった場合、すなわち74、7.4

— GUNG -回復モニカ

xとyの値に依存しているように見えるので、理解できません。人々が通りがちである「限界効果」はありますか？たとえば、人々はStataでmfxを使用してプロビットの見積もりを報告していませんか？

— user1690130 2012年

私はそれに従いません。OLSとポアソンを比較しません。それらは異なるタイプの状況/現象の異なるタイプのモデルです。これらは同じものの2つのdifモデルではなく、1つのモデルが他のモデルよりも優れている可能性があります。子猫とクリスマスツリーを比較して、1の方が優れているかどうかを確認することはありません。他のすべての変数の影響（ANOVAの因子の限界効果など）を無視する予測子の効果を意味する場合、「限界効果」という語句の使用方法がよくわかりません。次に、exp（

β_{1}

$\beta_1$ ）は、

x_{1}

$x_1$ 。

— gung-モニカの復活

@gungのように、あなたが何をしようとしているのかわかりません。ただし、2つのモデルの結果を比較する場合は、それぞれの予測値を散布図で互いにプロットできます。係数を比較しても意味がありません。

— Peter Flom