非負のゼロ膨張連続データをモデル化する方法は?


15

私は現在、線形モデル(family = gaussian)を生物多様性の指標に適用しようとしています。生物多様性はゼロ未満の値を取ることはできず、ゼロで膨張し、連続しています。値の範囲は0から0.25強です。その結果、モデルの残差には明らかなパターンがありますが、私はそれを取り除くことができませんでした。 ここに画像の説明を入力してください

誰もこれを解決する方法についてアイデアを持っていますか?


1
CVへようこそ!ユーザー名、identicon、およびユーザーページへのリンクは、作成するすべての投稿に自動的に追加されるため、投稿に署名する必要はありません。実際、私たちはあなたがそうしないことを好みます。
シルバーフィッシュ

3
連続変数はcdfにジャンプすることができないため(ゼロに1つあるのは明らかです)、ゼロインフレの場合は連続することはできません。0以外は連続している場合があります。
Glen_b-モニカの復職

回答:


31

ゼロ膨張(半)連続分布の場合には、さまざまなソリューションがあります。

  • Tobit回帰:データは単一の基礎となる正規分布からのものであるが、負の値は打ち切られ、ゼロにスタックされると仮定します(たとえばcensRegパッケージ
  • ハードルまたは「2段階」モデル:二項モデルを使用して、値が0または> 0であるかどうかを予測し、線形モデル(またはガンマ、切り捨てられた法線、または対数法線)を使用して、観測された非ゼロ値をモデル化します
  • 1<p<2バツ>0

または、データ構造が十分に単純な場合は、線形モデルを使用し、順列テストまたは他の堅牢なアプローチを使用して、データの興味深い分布によって推論が台無しにならないようにします。

これらのほとんどの場合に利用可能なRパッケージ/ソリューションがあります。

SEには、ゼロインフレ(半)連続データに関する他の質問があります(たとえばhereherehereなど)が、明確な一般的な答えを提供していないようです...

概要については、Min&Agresti、2002、Modeling Nonnegative Data with Clumping with Zero:A Surveyも参照してください。


@Ben Bolker「線形モデル(またはガンマ、切り捨てられた法線、または対数法線)を使用して、予測値または実際の非ゼロ値をモデル化しますか?」
rolando2
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.