最近、私は比率である結果のために、ベータ回帰モデルの実装に興味を持っています。この結果には離散的な「成功」という意味のある概念がないため、この結果は二項の状況に適合しないことに注意してください。実際、結果は実際には期間の比率です。分子は、特定の条件がアクティブであった間の秒数であり、その条件がアクティブである資格があった合計秒数です。私は気まぐれで申し訳ありませんが、このようなプロセスをベータ回帰以外にもさまざまな方法でモデル化できることに気付いているので、この正確なコンテキストにあまり重点を置きたくありません。そのようなモデルを実装しようとする私の試みで生じた質問(もちろん、私は
いずれにせよ、私が見つけることができたすべてのリソースは、ベータ回帰が通常、ロジット(またはプロビット/クロログ)リンクと、ログオッドの変更として解釈されるパラメーターを使用して適合していることを示しています。ただし、このリンクを使用する理由を実際に正当化するためのリファレンスはまだ見つけていません。
元のFerrari&Cribari-Neto(2004)の論文では正当化されていません。指数パラメータのオッズ比の解釈により、ロジット関数が「特に有用」であることにのみ言及しています。他の情報源は、間隔(0,1)から実際の線にマップすることを望んでいます。しかし、すでにベータ分布を想定している場合、そのようなマッピングにはリンク関数が必ずしも必要ですか?最初にベータ分布を仮定することによって課される制約を超えて、リンク関数はどのような利点を提供しますか?いくつかのクイックシミュレーションを実行しましたが、確率リンクが主に0または1近くに集中しているベータ分布からシミュレーションした場合でも、アイデンティティリンクで(0,1)間隔の外側の予測を確認していませんが、おそらく私のシミュレーションいくつかの病状を捉えるのに十分一般的ではありませんでした。
個人が実際にベータ回帰モデルからのパラメーター推定をどのように解釈するかに基づいて(つまり、オッズ比として)、「成功」のオッズに関して暗黙的に推論しているように思えます。つまり、二項モデルの代わりにベータ回帰を使用しています。ベータ分布と二項分布の間の関係を考えると、これはおそらく一部のコンテキストでは適切ですが、これは一般的なものよりも特別なケースのように思えます。では、この質問、答えは連続割合ではなく、成果に対するオッズ比を解釈するために提供されていますが、使用するのではなく、この方法を試してみて、物事を解釈するために不必要に面倒なことに私には思われる、と言う、ログまたはIDリンクと%変更または単位シフトの解釈。
では、なぜベータ回帰モデルにロジットリンクを使用するのでしょうか。それを二項モデルに関連付けるのは、単に便宜上の問題ですか?