重要ではありませんが、これは一種の奇妙な例です。本当に時系列分析を行っているのか、NASDAQがチームが勝ったゲームの数とどう関係しているのかは明らかではありません。チームが勝ったゲームの数について何か言うことに興味がある場合、おそらくプレイされたゲームの数を知っているとすれば、バイナリロジスティック回帰を使用するのが最善だと思います。ポアソン回帰は、可能な合計が十分に制約されていないか、少なくとも不明な場合のカウントについて話すのに最も適しています。
ベータ版をどのように解釈するかは、一部には、使用されるリンクによって異なります。ログリンクがより一般的(通常はより適切)でも、IDリンクを使用することは可能です。ログリンクを使用している場合は、おそらく応答変数のログを取得しないでしょう。リンクは本質的にそれを実行しています。抽象的なケースを考えてみましょう。次のようにログリンクを使用したポアソンモデルがあります。
または、
y^=exp(β^0)∗exp(β^1)x
y^=exp(β^0+β^1x)
(編集:醜いので、次のベータ版から「帽子」を削除しますが、それでも理解する必要があります。)
通常のOLS回帰では、共変量の値を条件とする応答変数のガウス分布の平均を予測しています。この場合、共変量の値を条件とする応答変数のポアソン分布の平均を予測しています。OLSの場合、与えられたケースが共変量で1ユニット高かった場合、すべての条件が等しく、その条件付き分布の平均はユニット高かったはずです。ここで、特定のケースが1ユニット高い(Ceteris paribus)場合、条件付き平均は倍高いと予想されます。たとえば、と言いますβ1eβ1 β1=2、その後、通常の回帰では2ユニット高く(つまり+2)、ここでは7.4 倍高くなります(つまりx 7.4)。どちらの場合も、が切片です。上記の方程式で、、次にexp、そしての平均を与えるexp()に還元される場合の状況を考えます。すべての共変量が0の場合。 β0x=0(β1)x=1β0y
これについて混乱する可能性のあることがいくつかあります。まず、ポアソン分布の平均を予測することは、ガウス分布の平均を予測することと同じではありません。正規分布では、平均は最も可能性の高い単一の値です。しかし、ポアソンの場合、平均はしばしば不可能な値になります(たとえば、予測平均が2.7の場合、それは存在する可能性のある数ではありません)。さらに、通常、平均は分散のレベル(つまり、SD)とは無関係ですが、ポアソン分布では、分散は平均と必然的に等しくなります(ただし、実際にはそうでないことが多く、複雑さが増します)。最後に、これらの累乗はそれをより複雑にします。相対的な変化ではなく、正確な値を知りたい場合は、0から開始する必要があります(つまり、eβ0)そして、あなたの方法を倍します。特定の値を予測するには、下の式のかっこ内の式を解いて指数化する方が簡単です。これにより、ベータ版の意味がわかりにくくなりますが、計算が容易になり、エラーの可能性が減ります。 x