タグ付けされた質問 「logistic」

一般に、ロジスティック関数を使用する統計的手順、最も一般的にはさまざまな形式のロジスティック回帰を指します。

2
ロジスティックGLMMで準完全分離を処理する方法
更新:私の問題が準完全分離と呼ばれていることがわかったので、これを反映するように質問を更新しました(Aaronに感謝)。 私は29人の人間の参加者(因子code)が一連の試行に取り組みresponse、1または0 であった実験からのデータセットを持っていp.validityます。type(肯定と拒否)、およびcounterexamples(少数と多数): d.binom <- read.table("http://pastebin.com/raw.php?i=0yDpEri8") str(d.binom) ## 'data.frame': 464 obs. of 5 variables: ## $ code : Factor w/ 29 levels "A04C","A14G",..: 1 1 1 1 1 1 1 1 1 1 ... ## $ response : int 1 1 1 1 0 1 1 1 1 1 ... …

1
ロジスティック回帰モデルの単一の予測に対する各共変量の寄与
たとえば、多くの共変量に基づいて患者が特定の疾患を発症する確率を出力するロジスティック回帰モデルがあるとします。 モデルの係数を調べ、オッズ比の変化を考慮することにより、一般的に各共変量の効果の大きさと方向を知ることができます。 一人の患者について、彼または彼女の最大の危険因子/彼または彼女の有利な最大の因子が何であるかを知りたい場合はどうでしょうか。私は特に、患者が実際に何ができるかについて興味があります。 これを行う最良の方法は何ですか? 私が現在検討している方法は、次のRコード(このスレッドから取得)にキャプチャされています。 #Derived from Collett 'Modelling Binary Data' 2nd Edition p.98-99 #Need reproducible "random" numbers. seed <- 67 num.students <- 1000 which.student <- 1 #Generate data frame with made-up data from students: set.seed(seed) #reset seed v1 <- rbinom(num.students,1,0.7) v2 <- rnorm(length(v1),0.7,0.3) v3 <- rpois(length(v1),1) #Create df representing …

3
マルチラベルロジスティック回帰
ロジスティック回帰を使用してマルチラベルデータを分類する方法はありますか?マルチラベルとは、複数のカテゴリに同時に属することができるデータを意味します。 このアプローチを使用して、いくつかの生物学的データを分類したいと思います。

1
バイナリ結果を伴う探索的分析のためのOLS対ロジスティック回帰
理想化されたロジスティックモデルでは、各連続IVをDVにリンクするS字型の曲線を取得します。しかし、実際にはこのS字型はまれにしか発生しないため、そのようなタイプのデータの場合、ロジスティックアプローチは少し優れているように見えます。もちろん、各観測値がDVで「1」になると予測される確率は、ロジスティックで使用でき、OLS回帰では使用できません。後者では、これらの確率は[0,1]の範囲を超える可能性があるためです。しかし、探索的な目的で、予測される確率が必要ない場合、OLSを使用して、DVとの関係が強いか、中程度か、弱いかを確認するのにどのくらい適切ですか。これは一種の多変量バージョンの点双相関に相当しませんか?(標準化回帰係数、共線性統計と部分プロットは言うまでもなく、

4
ロジスティック回帰の柔軟なバージョン
私は、どちらかのグループ(70対10,000)のデータポイントの数に大きな違いがあるロジスティック回帰を適合させようとしています。私の統計学者の友人は、これはロジスティック回帰の既知の問題であり、そのような種類の数値ではデータをオーバーフィットし、基本的に機能しないことを教えてくれました。データをビニングしてモデルと比較すると、これが間違いなく事実であることは明らかです。 この種類のバイナリ応答データをフィッティングするためのより良い/より柔軟な方法を誰かが知っているのだろうか? (ちなみに私は統計家ではないので、気楽にやってください!)

1
多項ロジスティック回帰におけるヘッセ行列誤差の予期しない特異点
SPSS 19を使用して多項ロジスティック回帰分析を行っています。分析手順を実行すると、次の問題が発生しました。 「ヘッセ行列に予期しない特異点が発生しました。これは、一部の予測変数を除外するか、一部のカテゴリをマージする必要があることを示しています。」 使用した私のデータについての少しの背景。1つまたは2つの2つのレベルを持つ4つのカテゴリカル予測子があります。モデルの応答変数は3レベルのカテゴリ変数です。最後のレベルを参照カテゴリとして使用しました。切片の係数を2つのロジットの4つの予測子の係数と比較して、この問題の原因となる可能性のある応答変数のレベルを見つけようとしました。切片と3つの予測子の間の係数の大きな違いは、問題があるのは参照カテゴリである可能性があることを示しています。ただし、応答変数のレベルを組み合わせることができませんでした(これは私の研究では許可されていません)。 予測変数を1つずつ除外することも試みましたが、それでも同じ問題が発生しました。 この問題を解決するために何をすべきかを誰かに教えてもらえますか?

5
二項変数の50%が遷移する時間をどのように推定できますか?
4つの被験者のバイナリ状態を4回表す次のデータがあります。各被験者がに遷移することのみ可能であり、1 → 0には遷移できないことに注意してください。0→10→10\to 11→01→01\to 0 testdata <- data.frame(id = c(1,2,3,4,1,2,3,4,1,2,3,4,1,2,3,4,1,2,3,4), day = c(1,1,1,1,8,8,8,8,16,16,16,16,24,24,24,24,32,32,32,32), obs = c(0,0,0,0,0,1,0,0,0,1,1,0,0,1,1,1,1,1,1,1)) 私はそれをロジスティック回帰でモデル化できます: testmodel <- glm(formula(obs~day, family=binomial), data=testdata) > summary(testmodel) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) -0.018890 0.148077 -0.128 0.899907 day 0.032030 0.007555 4.240 0.000493 *** 最初に、モデル内の同じ個人の反復測定をどのように説明できますか? 第2に、被験者の1/2がから移行する日を不確実に見積もるにはどうすればよいですか?0→10→10\to 1

2
ロジット回帰の従属変数の測定エラーを修正するにはどうすればよいですか?
従属変数がごく一部のケースで誤ってコーディングされていることがわかっているバイナリロジット回帰を実行しています。だから私はこのモデルでを推定しようとしています:ββ\beta prob(yi)=1/(1+e−zi)prob(yi)=1/(1+e−zi)prob(y_i) = 1/(1 + e^{-z_i}) zi=α+Xiβzi=α+Xiβz_i = \alpha + X_i\beta 代わりにベクトルの、私は〜Yいくつかのランダムな誤差を含む(すなわち、Y I = 1、しかし〜Y iは = 0、いくつかのために、またはその逆をIを)。YYYY~Y~\tilde{Y}yi=1yi=1y_i = 1yi~=0yi~=0\tilde{y_i} = 0iii この問題に対する(合理的に)簡単な修正はありますか? ケースコントロール研究では、ロジットにいくつかの優れた特性があることを知っています。ここでも同様のことが当てはまるようですが、良い解決策を見つけることができませんでした。 その他のいくつかの制約:これはテキストマイニングアプリケーションであるため、の次元は大きくなります(数千または数万)。これにより、計算量の多い手順が除外される場合があります。XXX また、私は正しく推定することは気にせず、βだけを気にします。αα\alphaββ\beta

1
Rのロジスティック回帰のハット行列を計算する方法は?
ロジットモデルのハット行列をRで直接計算したいと思います。Long(1997)によれば、ロジットモデルのハットマトリックスは次のように定義されます。 H=VX(X′VX)−1X′VH=VX(X′VX)−1X′VH = VX(X'VX)^{-1} X'V Xは独立変数のベクトルであり、Vはが対角にある対角行列です。π(1−π)−−−−−−−√π(1−π)\sqrt{\pi(1-\pi)} このoptim関数を使用して、可能性を最大化し、ヘッセ行列を導出します。だから私は私の質問だと思います: Rでを計算する方法は?VVV 注:尤度関数は次のようになります。 loglik <- function(theta,x,y){ y <- y x <- as.matrix(x) beta <- theta[1:ncol(x)] loglik <- sum(-y*log(1 + exp(-(x%*%beta))) - (1-y)*log(1 + exp(x%*%beta))) return(-loglik) } そして、これを次のようにoptim関数に送ります: logit <- optim(c(1,1),loglik, y = y, x = x, hessian = T) ここで、xは独立変数の行列であり、yは従属変数を持つベクトルです。 注:これを行うための既定の手順があることは知っていますが、最初から行う必要があります
8 r  logistic  deviance 

2
二項回帰とモデリング戦略の議論
今日、私は二項/ロジスティック回帰について質問を受けました。これは、私の部門のグループが行ってコメントを求めている分析に基づいています。匿名性を保護するために以下の例を作成しましたが、彼らはその反応に熱心でした。 まず、分析は単純な1または0の二項応答(たとえば、ある繁殖シーズンから次の繁殖シーズンまでの生存率)で始まり、目標はこの応答をいくつかの共変量の関数としてモデル化することでした。 ただし、一部の共変量の複数の測定値は、一部の個人では利用可能でしたが、他の個人では利用できませんでした。たとえば、変数xが分娩中の代謝率の測定値であり、個体の子孫の数が異なると想像してください(変数xは、個体Aでは3回、個体Bでは1回だけ測定されました)。この不均衡は、研究者自身のサンプリング戦略によるものではなく、彼らがサンプリングしていた母集団の特徴を反映しています。一部の個体は他の個体より多くの子孫を持っています。 これらのイベントの間隔が非常に短いため、労働イベント間の2項の0 \ 1応答を測定することは不可能であったことも指摘しておきます。繰り返しになりますが、問題の種は繁殖期が短いが、シーズン中に複数の子孫を産むことができると想像してください。 研究者たちは、変数xの平均を1つの共変量として使用し、個人が出産した子孫の数を別の共変量として使用するモデルを実行することを選択しました。 今、私はいくつかの理由でこのアプローチに熱心ではありませんでした 1)xの平均を取ることは、xの個体内変動の情報を失うことを意味します。 2)平均はそれ自体が統計であるため、モデルに入れることにより、統計に関する統計を実行することになります。 3)モデルには個体の子孫の数が含まれますが、変数xの平均の計算にも使用されます。これは問題を引き起こす可能性があると思います。 それで、私の質問は、人々がこのタイプのデータをどのようにモデル化しようとするのでしょうか? 現時点では、おそらく、子孫が1人の個体と、子孫が2人の個体に対して別々のモデルを実行します。また、変数xの平均を使用せず、各出生の生データのみを使用しますが、これもはるかに良いと確信していません。 お時間をいただきありがとうございます (PS:長い質問であることをお詫びします。例が明確であることを願っています)

1
ロジスティックモデリングのコンテキストで「ケースコントロール」と「横断的」とはどういう意味ですか?
ロジスティックモデリングを研究しているときに、次のステートメントを読みました ケースコントロールまたは横断研究のロジスティックモデリングから、オッズ比のみが推定され、個々のリスクは推定されないという事実は驚くべきことではありません。 「ケースコントロール」と「横断研究」が統計分析で何を表すのかわかりません。また、統計分析の観点から、上記の意味がよくわかりません。説明をいただければ幸いです。


4
ベイジアン分析とロジスティック回帰を理解するためのビデオ/オーディオのオンライン資料
ええと、私は日々エンジニアです。私の仕事のほとんどはモデリングを中心に展開していますが、通常はかなり基本的なことを行います。「高度な」モデルは、R2テストを使用して検証されたモンテカルロシミュレーションです。 現在、私の分野では、ロジスティック分析とベイズ分析を使用した多くの研究があります。 私の質問は、最初にビデオ/オーディオ、次に2番目に読むことで最もよく学ぶ人のために、MITのオープンコースサイトまたはその他のサイトからどのコースを推奨するかです。 私が学びたいのは以下です: モデルとそれらを採用する時期を理解できる フィールドデータ(一度生成され、再生成できない)を取り込み、実験を設計および実行できる 結果を理解し、それらを見て、何かがオフであるか、「ストッパーを示す」または「外れ値」であるか、またはすべてが正常でダンディであるかを理解することができる モデルを検証して、実際の「完成した」結果に合わせて調整できる 適切な感度分析を使用して結果を予測できる 不足しているデータを予測/「プラグ」できる 私の分野に関連するジャーナル論文を書くことができる 一言で言えば、私の分野は、一般的な4ステップモデル、またはPECASやurbansimなどの社会経済活動/ツアーベースのモデルを使用した、乗用車の輸送需要モデリングです。

1
等しくないクラスのSoftmax回帰バイアスと事前確率
マルチクラス分類問題にSoftmax回帰を使用しています。各クラスの事前確率が同じではありません。 私はロジスティック回帰(2つのクラスの回帰)から、クラスの以前の確率がバイアス()に暗黙的に追加されることを。log(p0/p1)log⁡(p0/p1)\log(p_0/p_1) 通常、私は手動でこの用語をバイアスから削除します。 私の質問は、ソフトマックス回帰バイアスの対応する用語は何ですか? ありがとう。

3
ロジスティック回帰で異なる分布の予測子変数をどのように処理しますか?
x1とx2を指定してyを予測するためにロジスティック回帰を使用しています。 z = B0 + B1 * x1 + B2 * x2 y = e^z / (e^z + 1) ロジスティック回帰は、変数のスケールが大きく異なる場合にどのように処理されるはずですか?変数の高次係数を使用してロジスティック回帰モデルを構築することはありますか?私はこのようなものを想像しています(2つの変数について): z = B0 + B1 * x1 + B2 * x1^2 + B3 * x2 + B4 * x2^2 または、ロジスティック回帰を使用する前に、x1とx2の値を単純に正規化、標準化、または再スケーリングする正しい答えは何ですか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.