結果が分数(2つのカウントの比率)の場合、Rでロジスティック回帰を行う方法は?


24

私は次の生物学的実験がある論文をレビューしています。デバイスを使用して、細胞をさまざまな量の流体せん断応力にさらします。より大きなせん断応力がセルに適用されると、より多くのセルが基板から剥離し始めます。せん断応力の各レベルで、付着したままの細胞をカウントします。また、最初に付着した細胞の総数を知っているため、部分的な付着(または剥離)を計算できます。

付着率とせん断応力をプロットすると、結果はロジスティック曲線になります。理論的には、個々のセルはそれぞれ1つの観測ですが、明らかに数千または数万のセルがあるため、通常の方法(各行が観測)でセットアップされた場合、データセットは巨大になります。

ですから、当然、私の質問(タイトルで述べられているように)は今では意味があります。DVとして分数の結果を使用してロジスティック回帰を行うにはどうすればよいですか?glmで実行できる自動変換はありますか?

同じ線に沿って、潜在的に3つ以上の(分数の)測定がある場合、多項ロジスティック回帰の場合、これをどのように行いますか?


多変量の結果ロジスティック回帰に関するいくつかの例を次に示しますhttp://www.ats.ucla.edu/stat/r/dae/mlogit.htm
。– marbel

1
あなたが説明することは、独立した観察があるようには聞こえません(おそらく、せん断が増加しても細胞は再付着しないので、それぞれのより高い応力設定でまだ付着している数は以前の数以下でなければなりません); この依存関係を考慮する必要があります。(成長曲線の状況を連想させます。)---数値をGLMに独立しているかのように単に接続することはできません...そして、この問題に対処する答えはありません。
Glen_b -Reinstateモニカ

2
@Glen_b各実験は異なるセルで行われます。つまり、「100%」の付着で開始し、せん断応力の異なる値を適用します。
thecity2

あ、そう。それは独立した結果をもたらします。
Glen_b

回答:


37

glm関数をR使用すると、3つの方法でロジスティック回帰モデルの式を指定できます。

最も一般的なのは、データフレームの各行が1つの観測値を表し、応答変数が0または1(または2レベルの係数、または2つの一意の値のみを持つ他の変数)であるということです。

別のオプションは、2列の行列を応答変数として使用することです。最初の列は「成功」のカウントで、2番目の列は「失敗」のカウントです。

また、応答を0と1の間の比率として指定し、比率が由来する合計数を与える「重み」として別の列を指定することもできます(したがって、0.3の応答と10の重みは3と同じです '成功」と7つの「失敗」)。

最後の2つの方法のいずれかは、あなたがやろうとしていることに適合します。最後の方法は、データをどのように記述するかについて最も直接的なようです。


9

はじめに、プロポーションである従属変数がある場合、ベータ回帰を使用できます。これは、(私の限られた知識では)複数の比率に拡張されません。

Beta Regressionの概要とRの実装については、betaregをご覧ください


ありがとう!それは二項の場合に必要なもののように見えます。
thecity2

2

nnet::multinomは(パッケージnnetはMASSの一部です)同様の目的で使用していますが、[0、1]の連続入力を受け入れます。

参照が必要な場合:C. Beleites et.al .:星状細胞腫組織のラマン分光法による分類:ソフト参照情報の使用。Anal Bioanal Chem、2011、Vol。400(9)、pp。2801-2816


すばらしいです!私はそのパッケージを持っていますが、この機能があることに気付きませんでした。
thecity2

@cbeleites:依存関係を[0,1]にすることができますか?私はそれは名目上の扶養家族のための関数でした(予測者は[0,1]にスケーリングされるべきです
...-B_Miner

@B_Miner:はい、依存は[0、1]にあります。この関数は、隠れ層およびロジスティックS字型のない人工ニューラルネットワークに適合します。そして、はい、より良い収束のために予測子をおよそ[0、1]にスケーリングすることをお勧めします。
cbeleitesはモニカをサポートしています
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.