タグ付けされた質問 「logistic」

一般に、ロジスティック関数を使用する統計的手順、最も一般的にはさまざまな形式のロジスティック回帰を指します。

6
Rのロジスティック回帰の代替
ロジスティック回帰と同じタスクを実行する多くのアルゴリズムが欲しいです。それは、説明変数(X)を使用してバイナリ応答(Y)に予測を与えることができるアルゴリズム/モデルです。 アルゴリズムに名前を付けた後、Rでそれを実装する方法も示すことができれば嬉しいです。他のモデルで更新できるコードは次のとおりです。 set.seed(55) n <- 100 x <- c(rnorm(n), 1+rnorm(n)) y <- c(rep(0,n), rep(1,n)) r <- glm(y~x, family=binomial) plot(y~x) abline(lm(y~x), col='red', lty=2) xx <- seq(min(x), max(x), length=100) yy <- predict(r, data.frame(x=xx), type='response') lines(xx, yy, col='blue', lwd=5, lty=2) title(main='Logistic regression with the "glm" function')

7
ロジスティック回帰(Cox&SnellまたはNagelkerke)について報告するのはどの擬似尺度ですか?
SPSSロジスティック回帰モデルの出力があります。出力は、モデルの適合のための2つの対策を報告し、Cox & SnellそしてNagelkerke。 それで、経験則として、これらのR2R²R^²測定値のどれがモデルに適合すると報告しますか? または、これらの適合指数のどれがジャーナルで通常報告されますか? ある程度の背景:回帰は、いくつかの環境変数(例:急峻さ、植生被覆など)から鳥(アカゲラ)の有無を予測しようとします。残念ながら、鳥はあまり頻繁に出現しなかったため(35ヒットから468ミス)、回帰のパフォーマンスはかなり低下しました。Cox&Snellは.09、Nagelkerke、.23です。 主題は、環境科学または生態学です。

1
ロジスティック回帰モデルの近似から予測値(Y = 1または0)を取得する
クラスのオブジェクトglm(ロジスティック回帰モデルに対応)がありpredict.glm、引数type="response"を使用して与えられた予測確率をバイナリ応答、つまりまたはY = 0に変換したいとします。Rでこれを行う最も速く、最も標準的な方法は何ですか?Y= 1Y=1Y=1Y= 0Y=0Y=0 、再び、私の知る一方でpredict.glm、私は場所を正確にカットオフ値を知らない住んでいる-と私は、これはここに私のメインのつまずきであると思います。P(Y私= 1 | バツ^私)P(Yi=1|X^i)P(Y_i=1|\hat X_{i})

3
ロジスティック回帰が線形分類器であるのはなぜですか?
ロジスティック関数を使用して入力の線形結合を非線形出力に変換しているので、ロジスティック回帰を線形分類器とみなすにはどうすればよいですか? 線形回帰は、隠れ層のないニューラルネットワークのようなものです。なぜニューラルネットワークは非線形分類器と見なされ、ロジスティック回帰は線形なのでしょうか。

4
ロジスティック回帰サブセットの選択方法は?
私はRに二項家族glmを当てはめており、説明変数のグループがあり、最良のものを見つける必要があります(測定値としてのR2乗は問題ありません)。説明変数のランダムな異なる組み合わせをループするスクリプトを記述してから、どれが最高のパフォーマンスを発揮するかを記録する以外には、どうすればいいかわかりません。また、leapsパッケージleapsの関数は、ロジスティック回帰を実行していないようです。 どんな助けや提案も大歓迎です。
47 r  logistic 

5
Rのロジスティック回帰から擬似
Rのロジスティック回帰に関する Christopher Manningの記事は、次のようにRのロジスティック回帰を示しています。 ced.logr <- glm(ced.del ~ cat + follows + factor(class), family=binomial) いくつかの出力: > summary(ced.logr) Call: glm(formula = ced.del ~ cat + follows + factor(class), family = binomial("logit")) Deviance Residuals: Min 1Q Median 3Q Max -3.24384 -1.34325 0.04954 1.01488 6.40094 Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) -1.31827 …

2
ロジスティック回帰の人工データをシミュレートする方法は?
私はロジスティック回帰の理解に何か不足していることを知っており、どんな助けも本当に感謝しています。 私が理解している限り、ロジスティック回帰は、入力が与えられた場合の「1」の結果の確率は、逆ロジスティック関数を通過した入力の線形結合であると仮定しています。これは、次のRコードに例示されています。 #create data: x1 = rnorm(1000) # some continuous variables x2 = rnorm(1000) z = 1 + 2*x1 + 3*x2 # linear combination with a bias pr = 1/(1+exp(-z)) # pass through an inv-logit function y = pr > 0.5 # take as '1' if probability > 0.5 #now …

13
機械学習はSHA256ハッシュをデコードできますか?
64文字のSHA256ハッシュがあります。 ハッシュの生成に使用される平文が1で始まるかどうかを予測できるモデルをトレーニングしたいと考えています。 これが「可能」かどうかに関係なく、どのアルゴリズムが最良のアプローチでしょうか? 私の最初の考え: 1で始まるハッシュの大きなサンプルと1で始まらないハッシュの大きなサンプルを生成します ハッシュの64文字のそれぞれを、ある種の教師なしロジスティック回帰モデルのパラメーターとして設定します。 モデルが正しいか間違っているかを伝えることでモデルを訓練します。 プレーンテキストが1で始まるかどうかを十分に高い精度で(および適切なカッパで)予測できるモデルを作成できることを願っています

3
ロジスティック回帰の正則化方法
Ridge、Lasso、ElasticNetなどの方法を使用した正則化は、線形回帰では非常に一般的です。私は次のことを知りたかったです:これらの方法はロジスティック回帰に適用できますか?その場合、ロジスティック回帰に使用する方法に違いはありますか?これらの方法が適用できない場合、ロジスティック回帰はどのように正規化されますか?

2
バイナリ結果の相対リスクを推定するポアソン回帰
簡単な要約 ポアソン回帰(相対リスク)に対して、ロジスティック回帰(オッズ比)がバイナリ結果のコホート研究で使用されるのはなぜ一般的ですか? バックグラウンド 私の経験では、学部生および大学院生の統計学および疫学コースは、一般に、リスク推定値をオッズ比として報告するバイナリ結果のデータのモデリングにロジスティック回帰を使用する必要があることを教えています。 ただし、ポアソン回帰(および関連:準ポアソン、負の二項分布など)を使用して、バイナリ結果のデータをモデル化することもでき、適切な方法(堅牢なサンドイッチ分散推定量など)を使用して、有効なリスク推定値と信頼レベルを提供します。例えば、 Greenland S.、一般的な結果の研究および症例対照研究における相対リスクおよび他の疫学的測定のモデルベースの推定、Am J Epidemiol。2004 8月15日; 160(4):301-5。 Zou G.、バイナリデータを使用した前向き研究への修正ポアソン回帰アプローチ、Am J Epidemiol。2004 4月1日; 159(7):702-6。 Zou GYおよびDonner A.、相関バイナリデータを使用したプロスペクティブ研究への修正ポアソン回帰モデルの拡張、Stat Methods Med Res。2011 11月8日。 ポアソン回帰から、相対リスクを報告することができます。これは、特に頻繁な結果、特に統計に強いバックグラウンドを持たない個人にとって、オッズ比と比較して解釈しやすいと主張する人もいます。Zhang J.とYu KF、相対的なリスクは?一般的な結果のコホート研究におけるオッズ比を修正する方法、JAMA。1998年11月18日; 280(19):1690-1。 医学文献を読むと、二値アウトカムのコホート研究の中で、ポアソン回帰の相対リスクよりもロジスティック回帰のオッズ比を報告するのがはるかに一般的であると思われます。 ご質問 バイナリ結果のコホート研究の場合: ポアソン回帰の相対リスクではなく、ロジスティック回帰のオッズ比を報告する正当な理由はありますか? そうでない場合、医学文献の相対リスクを伴うポアソン回帰の頻度は、主に科学者、臨床医、統計学者、および疫学者の間の方法論と実践の間の遅れに起因する可能性がありますか? 中間統計と疫学のコースには、バイナリ結果のポアソン回帰の詳細な議論を含めるべきですか? 学生や同僚に、適切な場合にロジスティック回帰よりもポアソン回帰を考慮するように勧めるべきですか?

5
ロジスティック回帰係数の重要性は何ですか?
現在、2000年と2004年の選挙における投票場所と投票の選好に関する論文を読んでいます。その中には、ロジスティック回帰係数を表示するチャートがあります。数年前のコースから少し読んで、ロジスティック回帰は、複数の独立変数とバイナリ応答変数の間の関係を記述する方法であると理解しています。私が混乱しているのは、以下の表にあるように、南部のロジスティック回帰係数が.903であるため、南部人の90.3%が共和党に投票するということですか?メトリックのロジスティックな性質のため、この直接的な相関関係は存在しません。その代わり、0.903の南は、.506の回帰で、Mountains / plainsよりも共和党に票を投じているとしか言えないと思います。後者の場合、重要なものとそうでないものをどのように知ることができますか?また、このロジスティック回帰係数を与えられた共和党の投票の割合を推定することは可能ですか? サイドノートとして、間違って記載されている場合は投稿を編集してください

3
0〜1の結果(比率または分数)の回帰
私は、比率の予測モデルの構築を考えています、≤ B及び> 0及びB > 0を。だから、比率が間になる0と1。a / ba/ba/b≤ Ba≤ba \le ba > 0a>0a > 0b > 0b>0b > 0000111 線形回帰を使用できますが、自然に0.1に制限されるわけではありません。関係が線形であると信じる理由はありませんが、もちろん、とにかく、単純な最初のモデルとしてしばしば使用されます。 ロジスティック回帰を使用できますが、通常は2状態の結果の確率を予測するために使用され、範囲0.1からの連続値を予測するためではありません。 これ以上何も知らない場合、線形回帰、ロジスティック回帰、または非表示オプションcを使用しますか?

1
回帰:変数の変換
変数を変換する場合、同じ変換をすべて使用する必要がありますか?たとえば、次のように、さまざまに変換された変数を選択できますか。 、してみましょう年齢、雇用の長さ、住宅の長さ、および収入こと。バツ1、x2、x3x1,x2,x3x_1,x_2,x_3 Y = B1*sqrt(x1) + B2*-1/(x2) + B3*log(x3) または、変換と一貫性を保ち、すべてを同じように使用する必要がありますか?次のように: Y = B1*log(x1) + B2*log(x2) + B3*log(x3) 私の理解では、変換の目標は正常性の問題に対処することです。各変数のヒストグラムを見ると、それらが非常に異なる分布を示していることがわかります。これにより、必要な変換は変数ごとに異なると信じられます。 ## R Code df <- read.spss(file="http://www.bertelsen.ca/R/logistic-regression.sav", use.value.labels=T, to.data.frame=T) hist(df[1:7]) 最後に、それは使用して変数を変換する方法有効です持っているの値を?この変換は、すべての変数で一貫している必要がありますか、それとも含まない変数でもアドホックに使用されますか?x n 0 0ログ(xn+ 1 )log⁡(xn+1)\log(x_n + 1)バツnxnx_n000000 ## R Code plot(df[1:7])

4
なぜ他の代わりにシグモイド関数なのか?
事実上の標準シグモイド関数が(非深層)ニューラルネットワークとロジスティック回帰で非常に人気があるのはなぜですか?11+e−x11+e−x\frac{1}{1+e^{-x}} 他の多くの派生関数を使用して、計算時間を短縮するか、減衰を遅くします(勾配の消失が少なくなります)。シグモイド関数に関するいくつかの例がウィキペディアにあります。減衰が遅く計算が速い私のお気に入りの1つはです。x1+|x|x1+|x|\frac{x}{1+|x|} 編集 この質問は、シグモイドの「なぜ」にのみ興味があるので、賛否両論のニューラルネットワークの活性化関数の包括的なリストとは異なります。

2
ロジスティック回帰モデルが収束しない
航空会社のフライトに関するデータがあります(というデータフレーム内flights)。フライト時間が到着の大幅な遅延(10分以上を意味する)の確率に影響するかどうかを確認したいと思います。予測としてフライト時間を使用し、応答として各フライトが大幅に遅延した(ベルヌーイの束)かどうかのロジスティック回帰を使用すると考えました。私は次のコードを使用しました... flights$BigDelay <- flights$ArrDelay >= 10 delay.model <- glm(BigDelay ~ ArrDelay, data=flights, family=binomial(link="logit")) summary(delay.model) ...しかし、次の出力が得られました。 > flights$BigDelay <- flights$ArrDelay >= 10 > delay.model <- glm(BigDelay ~ ArrDelay, data=flights, family=binomial(link="logit")) Warning messages: 1: In glm.fit(x = X, y = Y, weights = weights, start = start, etastart = etastart, : algorithm …
40 r  logistic  separation 

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.