比率である従属変数をロジスティック回帰に適合させることは技術的に「有効」ですか?


8

いくつかの投稿(herehere)は、従属変数が自然に0と1の間にある場合にベータ回帰がより適切であることを示唆しています。Rは警告をスローしますが、結果を生成します。

応答変数がバイナリではなく比例している場合、尤度関数は有効な尤度ではないように見えますが、数学的には、最小化して解を得ることができます。ロジスティック回帰を比例データに当てはめるときに、違反/間違いがある場合はどうなるのでしょうか。


以下の回答に加えて:ここでは、この質問に対処する別のポストです。
COOLSerdash 2013年

回答:


8

あなたが提案するものは時々フラクショナルロジットと呼ばれます。確かな標準エラーを使用することを覚えている限り、確かにそのメリットがあります。2010年に、ドイツのStataユーザー会議で、ベータ回帰とフラクショナルロジットを比較した講演を行いました。スライドはここにあります:http : //www.maartenbuis.nl/presentations/berlin10.pdf


(+1)マールテン、別の質問:トライアルの総数が各分数/比率に提供されている場合(Rではこれはへのweights引数で行われますglm)、二項GLMを分数/比率応答に使用できることを読みました、たとえばここを参照してくださいstats.stackexchange.com/a/26779/28666。「堅牢な標準誤差」を伴う「フラクショナルロジット」は、このアプローチとどのように関連していますか?同じことなのか?
amoeba 2016

2
@amoeba違います。小数ロジットを平均比率のモデルとして考え、ロジットモデルを回復する方法として提案したものを考えます。
Maarten Buis

6

この種のモデルは、1種類の一般化線形モデルとして定義および使用されることがよくあります。1つの簡潔なレビューについては、http: //www.stata-journal.com/article.html?article = st0147を参照してください。平均が近づくにつれて分散も0に近づくため、連続的な比率でも2項式は妥当なファミリーであるという議論があります。 0または1。

特定のプログラムまたは特定のソフトウェアの機能がそれらに対応するかどうかは、別の問題です。「Rは警告をスローしますが、結果を生成します」と言っても、情報はほとんどありません。どのパッケージを参照していますか?それは本当に唯一の関連パッケージですか?いずれにせよ、参照したばかりの記事が示すように、このモデルは、たとえばStataで十分にサポートされています。

それでも、連続比率とベータ回帰のロジットモデルの相対的なメリットを詳細に説明する余地はあります。


1
本日の別の場所での議論の後、この古い答えに+1を付けます。このアプローチに関する回答をstats.stackexchange.com/questions/29038に投稿することをお勧めします。
アメーバ2017

1
これがRでどのように機能するかに関するいくつかのコメントは、関連スレッドのこの回答stats.stackexchange.com/a/43369の下のコメントなどにあります。
アメーバ2017
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.