ロジスティック回帰の適合値と確率


7

従属変数

[0,1]の範囲の依存値があります。意味0と1、およびその間のすべての値が含まれます。したがって、これはたとえば農家が受精させる土地の割合などの比例値です。

型番

私が現在注力しているモデルは、ロジスティックモデルです。

  • ただし、出力として、モデルによって従属変数がどのように予測されるかを確認したいと思います(実際の値と推定値を比較するため)。

ただし、ロジスティック回帰は通常、出力として「確率」を示します。その結果、私は今少し混乱しています。

私のモデル=

out <- glm(cbind(fertilized, total_land-fertilized) ~ X-variables,
       family=binomial(cloglog), data=Alldata)

私が使用する受精地の推定割合を予測するには

Alldata$estimated_fertilized<-predict(out,data=newdata,type="response"))

これは正しいです?または、この線は予測されたパーセンテージの代わりに確率を与えますか?正しくない場合、必要なものを取得するにはどうすればよいですか?

更新

選択したモデルの正確性について質問があるという事実を踏まえて、いくつかの追加情報を提供します。

従属変数の分布(これは0-1、0、1を含む比率です)。

ヒストリグラム従属変数


3
あなたは実際には確率をモデル化していないので、ベータ回帰のような代替モデルは検討する価値があります。
mdewey 2016

2
カウントされた比率と連続比率を区別するこのQ&Astats.stackexchange.com / questions / 239422 / …もご覧ください
mdewey 2016

2
比率の分子と分母はありますか?
kjetil b halvorsen 16

3
私はあなたのすべての推論に従っていると思いますし、それに基づいて、あなたのケースではロジスティック回帰はまったく適用されないと思います。モデル化されるものとして確率はありません。はい/いいえではなく、はいまたはいいえの確率ではなく、詳細な結果をモデル化する必要があります。どの種類の回帰が最適であるかについては、OLS、ベータ、および打ち切りが候補であり、従属変数の分布のイメージを投稿すると、その選択について最良の答えが得られます。
rolando2 2016

3
そのため、ほとんどの農家は肥料を一切使用せず、どこでも使用している農家もいれば、中間的な慣行をしている農家もいます。これは、2つの段階でモデル化する必要があるように見えます。最初のモデルを使用するか、ロジスティック回帰で使用しないか、2番目に、肥料モデルの使用量を条件とします。
mdewey 2016

回答:


1

実際には、ロジスティック回帰を使用して、[0-1]の範囲にある観測された比率をまとめることは問題ありません。

過去には、データが実際に階層的である場合、そのようなアプローチは信用されておらず、分析の目標は、クラスターレベルまで集計された個々のレベルのエクスポージャーを要約することでした。この特定のケースでは、関連性の尺度としてのオッズ比の生態学的誤りと非折りたたみ性のため、ロジスティック回帰を適用することは正しくありません。

ロジスティック回帰推定式は、平均の対数から1の対数から平均を引いた値の対数の線形モデルが適切である場合(ロジットリンク)、および比率の分散が比率の時間に等しい場合の分析に適用するのに適しています。 1マイナス比率(二項分散の仮定)。後者はかなり厳しい要件であることが判明したため、通常、アナリストは準二項尤度方程式や一般化された推定方程式などのより柔軟な分散推定器を使用します。

ロジスティック回帰(およびそのバリアント)の問題は、モデルの検証方法が明確でないことです。予測精度を平均二乗誤差(多くの理由で有効なアプローチ)でまとめると、代わりにロジット曲線の非線形最小二乗(NLS)推定器を使用する必要があります。NLSは、予測された応答曲面からの差の2乗の合計を最小化することにより、モデル予測子との関連付けを要約する最適なS字型曲線を見つけます。または、共変量の線形結合に基づいてしきい値を適用して、受精の過多または過少であったフィールドのサブセットを分類する場合は、線形判別分析が優れた分類を提供します。ロジスティックモデルは、多数の予測メトリックに基づいて最適とはいえない場合があります。

つまり、最終的には、分析を決定するのはデータの構造ではなく、分析者が評価しようとしている問題です。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.