タグ付けされた質問 「logistic」

一般に、ロジスティック関数を使用する統計的手順、最も一般的にはさまざまな形式のロジスティック回帰を指します。

2
「受信者動作特性」(ROC)の用語の起源は何ですか?
謝罪なし:私はこれを調査しようとしませんでした(このクエリに回答した可能性があるCVが提供した質問のリストを確認することを超えて)。私は先週、ロジスティック重回帰モデルを診断するためにクラスでこれを教え、名前の由来がわからないことを生徒に事前に警告しました。 ROC曲線の名前の歴史:受信者操作特性は何ですか? 召喚の本(『Lady Tasting Tea』や 『Mario Livio』の本など)で言及されていることについて思い出しますが、誰かが共有する歴史があれば、それを歓迎します。
9 logistic  roc  history 

4
ロジスティック回帰でカテゴリ変数の共線性を回避するにはどうすればよいですか?
次の問題があります。それぞれが名目上のスケールを持ついくつかの変数に対して多重ロジスティック回帰を実行しています。私の回帰では多重共線性を避けたいです。変数が連続的である場合、分散インフレ係数(VIF)を計算して、VIFが高い変数を探すことができます。変数が通常スケーリングされている場合、いくつかの変数のペアについてスピアマンの順位相関係数を計算し、その計算値を特定のしきい値と比較できます。しかし、変数が名目上スケーリングされている場合はどうすればよいですか?1つのアイデアは、独立性のペアワイズカイ2乗検定を実行することですが、異なる変数がすべて同じco-domainを持つわけではありません。したがって、これは別の問題です。この問題を解決する可能性はありますか?

2
通常の最小二乗法を使用してロジスティック回帰を解決する方法は?
私は自己学習機械学習でした。私はそれが主張するロジスティック回帰に関するウィキペディアのページのこのセクションに出くわしました モデルは一般化線形モデル(下記参照)として表現できるため、0 ロジスティック回帰のセットアップを線形回帰のセットアップに再キャストできるように思えます。しかし、それを行う方法がわかりません。わからない0&lt;p&lt;10&lt;p&lt;10<p<1も意味します。多分それはトリックですか?

2
正規確率変数の逆ロジットの期待
ランダム変数Y= eバツ1 + eバツY=eX1+eXY = \frac{e^{X}}{1 + e^{X}}と私はを知っています。バツ〜N(μ 、σ2)X∼N(μ,σ2)X \sim N(\mu, \sigma^2) を計算する方法はありますか?私は積分を計算しようとしましたが、あまり進歩していません。可能ですか?E(Y)E(Y)\mathbb{E}(Y)

1
softmax関数の定義
この質問はstats.stackexchange.com/q/233658でフォローアップします クラス{0、1}のロジスティック回帰モデルは P(y=1|x)=exp(wTx)1+exp(wTx)P(y=0|x)=11+exp(wTx)P(y=1|x)=exp⁡(wTx)1+exp⁡(wTx)P(y=0|x)=11+exp⁡(wTx) \mathbb{P} (y = 1 \;|\; x) = \frac{\exp(w^T x)}{1 + \exp(w^T x)} \\ \mathbb{P} (y = 0 \;|\; x) = \frac{1}{1 + \exp(w^T x)} 明らかにこれらの確率の合計は1ですを設定することにより、ロジスティック回帰を次のように定義することもできます。w=β1−β0w=β1−β0w = \beta_1 - \beta_0 P(y=c|x)=exp(βTcx)exp(βT0x)+exp(βT1x)∀c∈{0,1}P(y=c|x)=exp⁡(βcTx)exp⁡(β0Tx)+exp⁡(β1Tx)∀c∈{0,1} \mathbb{P} (y = c \;|\; x) = \frac{\exp(\beta_c^T x)}{\exp(\beta_0^T x) + \exp(\beta_1^T x)} \quad \forall \; c …

1
Andrew Gelmanの再スケーリング方法に基づく回帰係数の解釈
バイナリロジスティック回帰モデルには2つの予測子があります。1つはバイナリ、もう1つは連続です。私の主な目標は、同じモデル内の2つの予測子の係数を比較することです。 連続回帰入力変数を標準化するというAndrew Gelmanの提案に出くわしました。 I)最初の提案(2008):連続予測子を2 SDで除算 Original manuscript: http://www.stat.columbia.edu/~gelman/research/published/standardizing7.pdf II)更新された推奨事項(2009):連続予測子を1 SDで除算し、バイナリ入力値を(0,1)から(-1、+ 1)に再コード化)。 Updated recommendation (1 SD, recode binary): http://andrewgelman.com/2009/06/09/standardization/ 結果として生じる係数の適切な解釈は、私にはまだとらえどころのないです: シナリオ1:両方の予測子が同じモデルで重要である 結果:非変換バイナリY連続予測子:XCONT(1sdで除算)バイナリ予測子:XBIN(値-1または1をとるように再コーディング) &gt; orfit1c=with(data=mat0, glm(YBIN~XCONT+XBIN, family=binomial(link="logit"))) &gt; summary(orfit1c) Call: glm(formula = YBIN ~XCONT + XBIN, family = binomial(link = "logit")) Deviance Residuals: Min 1Q Median 3Q Max -0.9842 -0.6001 -0.5481 -0.5481 …

1
サポートベクターマシン(SVM)はロジスティック回帰のゼロ温度限界ですか?
SVMはロジスティック回帰のゼロ温度限界であると述べた知識のある友人と最近、簡単な議論がありました。理論的根拠には、限界ポリトープとフェンシェル双対性が含まれていました。フォローできませんでした。 SVMがロジスティック回帰のゼロ温度限界であるというこの説明は正しいですか?もしそうなら、誰かが議論を説明できますか?

1
二項応答によるロジスティック回帰の結果の予測区間
ロジスティック回帰モデルがあるとします。 P(y=1|x)log(p1−p)=p=βxP(y=1|x)=plog⁡(p1−p)=βx\begin{align} P(y=1\vert\mathbf{x}) &= p \\ \log\left(\frac{p}{1-p}\right) &= \boldsymbol{\beta}\mathbf{x} \end{align} サイズNのランダムサンプルD={X,y}D={X,y}D=\{\mathbf{X},\mathbf{y}\}を指定すると、\ boldsymbol {\ beta}の信頼区間と、それに対応する特定の値\を指定したpの予測区間を計算できます予測ベクトルのmathbf {x} ^ *。これはすべて非常に標準的で詳細なものです(たとえば、こちら)。NNNββ\boldsymbol{\beta}pppx∗x∗\mathbf{x}^* 代わりに、\ mathbf {x} ^ *を指定して、yの予測区間に興味があると仮定します。もちろん、yは値0と1のみをとり、その間に値をとることができないため、yの単一の実現に対する予測区間を計算することはまったく意味がありません。ただし、\ mathbf {x} ^ *の同じ固定値に対してyのm実現を考慮すると 、これは二項確率変数の予測区間を計算する問題に似ています(ただし同一ではありません)。これは、基本的にこの回答へのコメントでGlen_bによって説明された同じ状況ですyyyx∗x∗\mathbf{x}^*yyyyyymmmyyyx∗x∗\mathbf{x}^*。この質問には、「ノンパラメトリックブートストラップを使用する」というささいな質問とは別に、答えはありますか?

2
ランダム性なしでロジスティック回帰をシミュレートすることは可能ですか?
私たちは、私たちが作る意味し、ランダムずに線形回帰をシミュレートすることができの代わりに、。次に、線形モデルを当てはめると、係数は「グラウンドトゥルース」と同じになります。例を示します。Y = X β + εy=Xβy=Xβy=X\betay=Xβ+ϵy=Xβ+ϵy=X\beta+\epsilon set.seed(0) n &lt;- 1e5 p &lt;- 3 X &lt;- matrix(rnorm(n*p), ncol=p) beta &lt;- runif(p) # y &lt;- X %*% beta + rnorm(n)*0.5 # remove the randomness y &lt;- X %*% beta dat &lt;- data.frame(y=y, x=X) lm.res = lm(y ~ .-1, data=dat) norm(as.matrix(lm.res$coefficients - beta)) …


1
切り捨てられたRV導出の条件付き予想、Gumbel分布(ロジスティック差異)
私は独立同一分布している2つの確率変数、すなわち持っ:ϵ1,ϵ0∼iidGumbel(μ,β)ϵ1,ϵ0∼iidGumbel(μ,β)\epsilon_{1}, \epsilon_{0} \overset{\text{iid}}{\sim} \text{Gumbel}(\mu,\beta) F(ϵ)=exp(−exp(−ϵ−μβ)),F(ϵ)=exp⁡(−exp⁡(−ϵ−μβ)),F(\epsilon) = \exp(-\exp(-\frac{\epsilon-\mu}{\beta})), f(ϵ)=1βexp(−(ϵ−μβ+exp(−ϵ−μβ))).f(ϵ)=1βexp⁡(−(ϵ−μβ+exp⁡(−ϵ−μβ))).f(\epsilon) = \dfrac{1}{\beta}\exp(-\left(\frac{\epsilon-\mu}{\beta}+\exp(-\frac{\epsilon-\mu}{\beta})\right)). 2つの量を計算しようとしています。 Eϵ1Eϵ0|ϵ1[c+ϵ1|c+ϵ1&gt;ϵ0]Eϵ1Eϵ0|ϵ1[c+ϵ1|c+ϵ1&gt;ϵ0]\mathbb{E}_{\epsilon_{1}}\mathbb{E}_{\epsilon_{0}|\epsilon_{1}}\left[c+\epsilon_{1}|c+\epsilon_{1}>\epsilon_{0}\right] Eϵ1Eϵ0|ϵ1[ϵ0|c+ϵ1&lt;ϵ0]Eϵ1Eϵ0|ϵ1[ϵ0|c+ϵ1&lt;ϵ0]\mathbb{E}_{\epsilon_{1}}\mathbb{E}_{\epsilon_{0}|\epsilon_{1}}\left[\epsilon_{0}|c+\epsilon_{1}<\epsilon_{0}\right] 私は、フォームの何かで統合を行う必要があるポイントに到達します:。これは、閉じたフォームに積分がないようです。誰かがこれを手伝ってくれる?多分私は何か間違ったことをした。eexeexe^{e^{x}} 私は間違いなく閉じた形のソリューションがあるべきだと感じています。(編集:それが閉じた形式ではない場合でも、積分をすばやく評価するためのソフトウェアがある[Ei(x)など]があれば、それは大丈夫だと思います。) 編集: 変数の変更に伴い、 およびy=exp(−ϵ1−μβ)y=exp⁡(−ϵ1−μβ)y =\exp(-\frac{\epsilon_{1}-\mu}{\beta}) μ−βlny=ϵ1μ−βln⁡y=ϵ1\mu-\beta\ln y =\epsilon_{1} これはおよび [ 0 、[0,∞)[0,∞)[0,\;\infty)それぞれ。[0,exp(−ϵ0−c−μβ)][0,exp⁡(−ϵ0−c−μβ)]\left[0,\;\exp(-\frac{\epsilon_{0}-c-\mu}{\beta})\right] 。次に、変数の変更の下で、(1)を煮詰めました...|J|=|dϵdy|=βy|J|=|dϵdy|=βy|J|=|\dfrac{d\epsilon}{dy}|=\frac{\beta}{y} ∫∞011−e−x(∫∞μ−βlnx−c[c+μ−βlny]e−ydy)e−xdx∫0∞11−e−x(∫μ−βln⁡x−c∞[c+μ−βln⁡y]e−ydy)e−xdx\int_{0}^{\infty}\dfrac{1}{1-e^{-x}}\left(\int_{\mu-\beta\ln x-c}^{\infty}\left[c+\mu-\beta\ln y\right]e^{-y}dy\right)e^{-x}dx 代数の間違いがあるかもしれませんが、私はまだこの積分を解決できません... 関連質問:iidガンベル変数の最大値への期待

1
ロジスティック回帰:コース間で異なる式?
統計と機械学習の初心者、およびオンラインコースの受講。 私はロジスティック回帰をより詳細に理解しようとしていますが、Andrew NgコースとStanford統計学習コースの式の違いに気づきました。以下に、両方の数式へのリンク画像を投稿します。したがって、分子は異なります。私はこれが初心者なので、smthgが欠落している必要があります。 Hθ(X)=1p (X)= eβ0+ β1バツ1 + eβ0+ β1バツp(X)=eβ0+β1X1+eβ0+β1Xp(X)=\frac{e^{\beta_0+\beta_1X}}{1+e^{\beta_0+\beta_1X}} およびhttp://prntscr.com/dmyvx7hθ(x )= 11 + e- θ⊤バツ。hθ(x)=11+e−θ⊤x.h_\theta(x)=\frac{1}{1+e^{-\theta^\top x}}. http://prntscr.com/dmywgy

3
残差逸脱度と自由度を使用してロジスティック回帰モデルをテストする
私はPrinceton.eduでこのページを読んでいました。彼らはロジスティック回帰を実行しています(Rを使用)。ある時点で、モデルの自由度と等しい自由度の分布で得られたものよりも高い残差を得る確率を計算します。ウェブサイトからコピーして貼り付けています...χ2χ2\chi^2 &gt; glm( cbind(using,notUsing) ~ age + hiEduc + noMore, family=binomial) Call: glm(formula = cbind(using, notUsing) ~ age + hiEduc + noMore, family = binomial) Coefficients: (Intercept) age25-29 age30-39 age40-49 hiEduc noMore -1.9662 0.3894 0.9086 1.1892 0.3250 0.8330 Degrees of Freedom: 15 Total (i.e. Null); 10 Residual Null Deviance: 165.8 …

2
Rはこの二項回帰のp値をどのように計算しますか?
次の二項回帰を考えます。 # Create some data set.seed(10) n &lt;- 500 x &lt;- runif(n,0,100) y &lt;- x + rnorm(n,sd=100) &lt; 0 # Fit a binomial regression model model &lt;- glm(y ~ x, family="binomial") summary(model) summary関数は、p値を返します1.03e-05。をanova.glm使用する場合、p値の計算にどの方法を使用するかに関係なく、p値が少し極端になります。 anova(model, test="Rao") # p.value = 7.5e-6 anova(model, test="LRT") # p.value = 6.3e-6 anova(model, test="Chisq") # p.value = …

3
この残差プロットをどのように解釈すればよいですか?
このグラフを解釈できません。私の従属変数は、ショーで販売される映画チケットの総数です。独立変数は、ショーの前に残った日数、季節性ダミー変数(曜日、年、月、休日)、価格、日付までに販売されたチケット、映画の評価、映画の種類(スリラー、コメディなど)です。 )。また、映画館の定員は固定ですのでご了承ください。つまり、最大xの人数のみをホストできます。線形回帰ソリューションを作成していますが、テストデータに適合していません。だから私は回帰診断から始めることを考えました。データは、需要を予測したい単一の映画館からのものです。 は多変量データセットです。日付ごとに、ショーの前日を表す90の重複行があります。したがって、2016年1月1日のレコードは90です。ショーの何日前かを示す 'lead_time'変数があります。つまり、2016年1月1日の場合、lead_timeの値が5であれば、ショーの日付の5日前までチケットが販売されます。従属変数、販売されたチケットの合計では、同じ値が90回得られます。 また、余談として、残差プロットを解釈して後でモデルを改善する方法を説明した本はありますか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.