タグ付けされた質問 「logistic」

一般に、ロジスティック関数を使用する統計的手順、最も一般的にはさまざまな形式のロジスティック回帰を指します。

1
ベリー反転
米国のワイン販売に関する大量の市場データがあり、特定の高品質ワインの需要を推定したいと思います。これらの市場シェアは、基本的形態のランダム効用モデルから導出された Xが観察含まを製品特性、pは製品価格、ξUijt=X′jtβ−αpjt+ξjt+ϵijt≡δjt+ϵjtUijt=Xjt′β−αpjt+ξjt+ϵijt≡δjt+ϵjtU_{ijt} = X’_{jt}\beta - \alpha p_{jt} + \xi_{jt} + \epsilon_{ijt} \equiv \delta_{jt} + \epsilon_{jt}XXXpppξξ\xiは需要に影響を与え、価格と相関する観測されていない製品特性であり、は誤差項、iは個人、jは製品、tは市場(この場合は都市)にインデックスを付けます。ϵϵ\epsiloniiijjjttt 観測されていない品質項ために、通常の条件付きロジットモデルを使用することはできません。また、適切な機器がありません。しかし、Berry(1994)は、多項ロジットフレームワークで市場方程式の非線形システムを線形化する戦略を開発しましたが、彼がどのように反転ステップを行うのかわかりません。ξξ\xi 真のパラメータ値で彼は、推定市場シェアは、「真」の市場シェアに等しくなければならないことを言うの J T(X 、β 、α 、ξ )= Sのjはトン彼はその後、市場シェアを反転させることを示唆しているためなどから S J T = S J T(δ 、α 、β ) に δ = S - 1(S 、α 、β )sˆjt(X,β,α,ξ)=Sjts^jt(X,β,α,ξ)=Sjt\widehat{s}_{jt} (X, \beta , \alpha , \xi) = …

1
ロジスティック回帰のハットマトリックスからの情報
私には明らかであり、複数のサイトで、ハットマトリックスの対角線上の値が線形回帰にどのような情報を与えるかをよく説明しています。 ロジスティック回帰モデルの帽子行列は、私にはあまり明確ではありません。それは、線形回帰を適用して帽子行列から得た情報と同一ですか?これは、CVの別のトピックで見つけた帽子行列の定義です(ソース1): H= Vバツ(X′Vバツ)−1 X′VH=Vバツ(バツ′Vバツ)−1バツ′VH=VX ( X'V X)^-1 X' V Xでは予測変数のベクトル、Vは対角行列です。(π(1- π))−−−−−−−−√(π(1−π))\sqrt{(π(1−π))} 言い換えれば、観測値のハットマトリックスの特定の値は、共変量空間内の共変量の位置も示すだけで、その観測値の結果値とは何の関係もないということですか? これはAgrestiの「Categorical data analysis」という本に書かれています。 観測値のレバレッジが大きいほど、フィットに対する潜在的な影響が大きくなります。通常の回帰と同様に、レバレッジは0から1の間にあり、合計はモデルパラメーターの数になります。通常の回帰とは異なり、帽子の値は近似とモデル行列に依存し、極端な予測値を持つポイントは高いレバレッジを持つ必要はありません。 したがって、この定義から、通常の線形回帰で使用するため、使用できないように見えますか? ソース1:Rのロジスティック回帰のハットマトリックスの計算方法

1
混合効果モデルの固定効果の推論
相関データがあり、ロジスティック回帰混合効果モデルを使用して、対象の予測変数の個々のレベル(条件付き)効果を推定しています。標準的な限界モデルの場合、Waldテストを使用したモデルパラメーターの推論は、尤度比テストとスコアテストで一貫していることを知っています。通常、これらはほぼ同じです。Waldは計算が簡単で、R出力で利用できるため、その99%の時間を使用します。 しかし、混合効果モデルでは、Rのモデル出力で報告されている固定効果のWaldテストと、「手作業」の尤度比テストの間に大きな違いがあることに興味をそそられました。実際に縮小モデルに適合します。直観的に、なぜこれが大きな違いを生むのかがわかります。なぜなら、縮小モデルでは、ランダム効果の分散が再推定され、尤度に大きく影響するからです。 誰か説明できますか 固定効果のWald検定統計量はどのようにRで計算されますか? 混合効果モデルの推定モデルパラメーターの情報マトリックスは何ですか?(そしてWald検定統計量の計算元と同じmxですか?) 説明したケースの2つのテストの結果の解釈の違いは何ですか?どのモデルが一般的に動機付けられ、推論のために文献で使用されていますか?

3
Mundlak固定効果手順は、ダミーを使用したロジスティック回帰に適用できますか?
8000個のクラスターと400万個の観測値を含むデータセットがあります。残念ながら、統計データであるStataは、ロジスティック回帰にパネルデータ関数を使用すると、実行速度がかなり遅くなりxtlogitます。 ただし、非パネルlogit機能を使用すると、結果がより早く表示されます。そのためlogit、固定効果を説明する変更されたデータを使用することでメリットが得られる場合があります。 この手順は「Mundlak固定効果手順」(Mundlak、Y. 1978. Pooling of Time-Series and Cross-Section Data。Econometrica、46(1)、69-85。) Antonakis、J.、Bendahan、S.、Jacquart、P。、およびLalive、R.(2010)の論文で、この手順の直感的な説明を見つけました。因果関係の主張について:レビューと推奨事項。リーダーシップクォータリー、21(6)。1086-1120。私は引用する: 固定効果の省略の問題を回避し、レベル2変数を含める方法の1つは、推定モデルにすべてのレベル1共変量のクラスター平均を含めることです(Mundlak、1978)。クラスター平均は、回帰変数として含めるか、レベル1の共変量から差し引く(クラスター平均の中心化)ことができます。クラスター平均はクラスター内で不変で(クラスター間で異なる)、固定効果が含まれているかのようにレベル1パラメーターの一貫した推定を可能にします(Rabe-Hesketh&Skrondal、2008を参照)。 したがって、クラスター平均のセンタリングは、私の計算上の問題を解決するのに理想的かつ実用的と思われます。ただし、これらの論文は線形回帰(OLS)に向けられているようです。 このクラスター平均センタリングの方法は、固定効果の「複製」バイナリロジスティック回帰にも適用できますか? 同じ答えになるはずのより技術的な質問はxtlogit depvar indepvars, fe、データlogit depvar indepvarsセットBがデータセットAのクラスター平均中心バージョンであるときに、データセットA とデータセットBが等しいかどうかです。 このクラスター平均のセンタリングで私が見つけた追加の難点は、ダミーに対処する方法です。ダミーは0または1であるため、ランダム回帰と固定効果回帰では同一ですか?それらは「中心」にすべきではありませんか?


1
複数の予測子を持つロジットモデルの確率曲線のグラフ化
次の確率関数があります。 確率= 11 + e− zプロブ=11+e−z\text{Prob} = \frac{1}{1 + e^{-z}} どこ z= B0+ B1バツ1+ ⋯ + Bnバツn。z=B0+B1バツ1+⋯+Bnバツn。z = B_0 + B_1X_1 + \dots + B_nX_n. 私のモデルは次のように見えます Pr (Y= 1 )= 11 + exp(− [ − 3.92 + 0.014 × (bid )] )Pr(Y=1)=11+exp⁡(−[−3.92+0.014×(入札)])\Pr(Y=1) = \frac{1}{1 + \exp\left(-[-3.92 + 0.014\times(\text{bid})]\right)} これは、以下のような確率曲線を介して視覚化されます。 元の回帰式にいくつかの変数を追加することを検討しています。性別(カテゴリ:FおよびM)および年齢(カテゴリ:<25および> …

2
ロジスティック回帰残差分析
この質問は一種の一般的で長々としたものですが、どうかご容赦ください。 私のアプリケーションには、多くのデータセットがあり、各データセットは、最大20,000個のデータポイントと最大50個の機能と1つの従属バイナリ変数で構成されています。正規化されたロジスティック回帰(Rパッケージglmnet)を使用してデータセットをモデル化しようとしています 分析の一環として、次のように残差プロットを作成しました。各機能について、その機能の値に従ってデータポイントを並べ替え、データポイントを100個のバケットに分割し、各バケット内の平均出力値と平均予測値を計算します。これらの違いをプロットします。 残差プロットの例を次に示します。 上記のプロットでは、特徴の範囲は[0,1](1の濃度が濃い)です。ご覧のとおり、特徴値が低い場合、モデルは1出力の可能性を過大評価する方向に偏っているように見えます。たとえば、左端のバケットでは、モデルは確率を約9%過大評価しています。 この情報を活用して、このバイアスを大まかに修正するために、機能の定義を簡単な方法で変更したいと思います。交換などの変更 x→x−−√x→xx \rightarrow \sqrt{x} または x→fa(x)={ax if x&lt;a elsex→fa(x)={a if x&lt;a x elsex \rightarrow f_a(x) = \cases{a & if $x<a$ \cr x & else} これどうやってするの?人間が50個のプロットすべてをすばやくスクロールして変更できるようにする一般的な方法論を探しています。これをすべてのデータセットに対して実行し、頻繁に繰り返して、データが時間の経過とともに最新の状態に維持されるようにします。 一般的な質問として、これは正しいアプローチですか?Googleが「ロジスティック回帰残差分析」を検索しても、実用的なアドバイスが得られても多くの結果は返されません。彼らは、「このモデルはぴったりだろうか?」という質問に答えることに固執しているようです。Hosmer-Lemeshowのようなさまざまなテストを提供して回答します。しかし、私のモデルが良いかどうかは気にしません。もっと良くする方法を知りたいです!

1
ロジスティッククォンタイル回帰–結果を最適に伝える方法
以前の投稿で、EQ-5Dスコアをどのように扱うかを考えました。最近、BottaiとMcKeownが提案したロジスティッククォンタイル回帰に出くわしました。式は簡単です: L O Gi t (y)= l o g(y− yM I nはymは、Xが− y)log私t(y)=log(y−ym私nymaバツ−y)logit(y)=log(\frac{y-y_{min}}{y_{max}-y}) 回避ログ(0)と0で除算するには、小さな値で範囲を拡張。これにより、スコアの境界を尊重する環境が得られます。ϵϵ\epsilon 問題は、すべてのがロジットスケールになり、通常のスケールに変換し直さなければ意味がないことですが、それはβが非線形であることを意味します。グラフ作成の目的では、これは重要ではありませんが、βの数が多い場合は問題になりません。ββ\betaββ\betaββ\beta 私の質問: フルスパンを報告せずにロジットを報告するにはどうすればよいですか?ββ\beta 実装例 実装をテストするために、この基本機能に基づいたシミュレーションを作成しました。 o u t c o m e = β0+ β1∗ x t e s t3+ β2∗ s e xoあなたはtcome=β0+β1∗バツtest3+β2∗seバツoutcome=\beta_0+\beta_1* xtest^3+\beta_2*sex ここで、、β 1 = 0.5及びβ 2 = 1。スコアには上限があるため、4以上および-1未満の結果値を最大値に設定しました。β0= 0β0=0\beta_0 = 0β1= 0.5β1=0.5\beta_1 …

2
ロジスティック回帰係数の分析
ロジスティック回帰係数のリストを次に示します(最初のものは切片です) -1059.61966694592 -1.23890500515482 -8.57185269220438 -7.50413155570413 0 1.03152408392552 1.19874787949191 -4.88083274930613 -5.77172565873336 -1.00610998453393 インターセプトが非常に低く、実際には0に等しい係数を持っているのがおかしいと思います。これをどのように解釈するかは完全にはわかりません。0は、特定の変数がモデルにまったく影響を与えないことを示していますか?しかし、自分の列を入力することによって作られるインターセプトは、突然本当に重要ですか?または、私のデータはただがらくたであり、モデルは適切に適合できません。


1
ロジスティック回帰のHosmer-LemeshowとAIC
Hosmer-Lemeshowが適合の欠如を示しているが、AICがすべてのモデルの中で最も低い場合....このモデルを引き続き使用する必要がありますか? 変数を削除しても、Hosmer-Lemeshow統計は重要ではありません(つまり、適合度が著しく低下することはありません)。しかし、AICは増加します。 編集:一般的に、異なるモデルのAICが互いに近い(つまり、2 )場合、それらは基本的に同じだと思います。しかし、AICは大きく異なります。これは、Hosmer-Lemeshowテストでそうでないことが示されていても、AICが最も低いものが使用すべきものであることを示しているようです。&lt; 2&lt;2<2 また、HLテストは大きなサンプルにのみ適用されるのでしょうか?サンプルサイズが小さい場合は消費電力が低くなります(サンプルサイズは約300)。しかし、重要な結果が得られている場合...これは、低電力でも拒否されることを意味します。 AICcとAICを使用した場合、違いが生じますか?SASでAICcを取得するにはどうすればよいですか?多重度に問題がある可能性があることは知っています。しかし、先験的に、変数が結果に影響を与えると仮定します。 コメントはありますか? Edit2:変数が1つ少ないモデルと、有意でないHLを持つより高いAICを使用する必要があると思います。その理由は、2つの変数が互いに相関しているためです。したがって、1つを削除することは理にかなっています。

3
結果をカテゴリーではなく順序と見なした場合、何が得られますか?
順序変数とカテゴリ変数の予測には、さまざまな方法があります。 私が理解していないのは、この区別がいかに重要かということです。注文を落とすと何が悪いのかを明確にする簡単な例はありますか?どのような状況でそれは重要ではありませんか?たとえば、独立変数もすべてカテゴリカル/オーディナルである場合、違いはありますか? この関連する質問は、独立変数のタイプに焦点を当てています。ここでは、結果変数について尋ねています。 編集: 順序構造を使用するとモデルパラメーターの数が減るという点がわかりますが、それでもまだ確信が持てません。 ここに例があります(順序付きロジスティック回帰の序論から取られていますが、私が見る限り、順序ロジスティック回帰は多項ロジスティック回帰よりもパフォーマンスが良くありません: library(nnet) library(MASS) gradapply &lt;- read.csv(url("http://www.ats.ucla.edu/stat/r/dae/ologit.csv"), colClasses=c("factor", "factor", "factor", "numeric")) ordered_result &lt;- function() { train_rows &lt;- sample(nrow(gradapply), round(nrow(gradapply)*0.9)) train_data &lt;- gradapply[train_rows,] test_data &lt;- gradapply[setdiff(1:nrow(gradapply), train_rows),] m &lt;- polr(apply~pared+gpa, data=train_data) pred &lt;- predict(m, test_data) return(sum(pred==test_data$apply)) } multinomial_result &lt;- function() { train_rows &lt;- sample(nrow(gradapply), round(nrow(gradapply)*0.9)) train_data &lt;- …

5
ロジスティック回帰におけるデフォルトのより良い分類
完全な開示:これは宿題です。データセットへのリンクを含めました(http://www.bertelsen.ca/R/logistic-regression.sav) 私の目標は、このデータセットのローン債務不履行の予測を最大化することです。 私がこれまでに考え出したすべてのモデルは、非デフォルト者の90%を超えると予測していますが、デフォルト値の40%未満は全体として分類効率を最大80%にします。だから、変数間に相互作用効果があるのだろうか?ロジスティック回帰では、考えられる各組み合わせをテストする以外に、潜在的な相互作用効果を特定する方法はありますか?あるいは、債務不履行者の分類の効率を高める方法。 私は立ち往生しています。推奨事項は、単語、Rコード、またはSPSS構文の選択に役立ちます。 私の主な変数は、次のヒストグラムと散布図で概説されています(二項変数を除く) 主な変数の説明: age: Age in years employ: Years with current employer address: Years at current address income: Household income in thousands debtinc: Debt to income ratio (x100) creddebt: Credit card debt in thousands othdebt: Other debt in thousands default: Previously defaulted (dichotomous, yes/no, 0/1) ed: Level …
12 r  logistic  spss  self-study 

4
LASSOモデルに反復再加重最小二乗法(IRLS)を適用する方法は?
IRLSアルゴリズムを使用してロジスティック回帰をプログラムしました。適切な機能を自動的に選択するために、LASSOペナルティを適用したいと思います。各反復で、以下が解決されます。 (XTWX)δβ^=XT(y−p)(XTWX)δβ^=XT(y−p)\mathbf{\left(X^TWX\right) \delta\hat\beta=X^T\left(y-p\right)} してみましょうλλ\lambda非負実数であること。The Elementsで提案されているように、インターセプトにペナルティを課していません。統計学習。すでにゼロの係数についても同様です。そうでなければ、右側から項を引きます: XT(y−p)−λ×sign(β^)XT(y−p)−λ×sign(β^)\mathbf{X^T\left(y-p\right)-\lambda\times \mathrm{sign}\left(\hat\beta\right)} ただし、IRLSアルゴリズムの変更については不明です。それは正しい方法ですか? 編集:私はそれについて自信がありませんでしたが、ここで私がついに思いついた解決策の一つです。興味深いのは、このソリューションがLASSOについて私が今理解していることに対応していることです。実際、各反復には1つではなく2つのステップがあります。 最初のステップは以前と同じです:アルゴリズムの反復を行います(上の勾配の式でように)、λ=0λ=0\lambda=0 第二のステップは、新しいものである:我々は、(成分以外の各構成要素に軟判定閾値を適用ベクトルの切片に相当)β第一工程で得られました。これは、反復ソフトしきい値アルゴリズムと呼ばれます。β0β0\beta_0ββ\beta ∀i≥1,βi←sign(βi)×max(0,|βi|−λ)∀i≥1,βi←sign(βi)×max(0,|βi|−λ)\forall i \geq 1, \beta_{i}\leftarrow\mathrm{sign}\left(\beta_{i}\right)\times\max\left(0,\,\left|\beta_{i}\right|-\lambda\right)

4
ロジスティック回帰と変曲点
バイナリの結果といくつかの共変量のデータがあります。ロジスティック回帰を使用してデータをモデル化しました。単純な分析だけで、異常なことは何もありません。最終出力は、特定の共変量に対して確率がどのように変化するかを示す用量反応曲線であると想定されています。このようなもの: ロジスティック回帰を選択したことについて、(純粋な統計家ではなく)内部のレビューアからいくつかの批判を受けました。ロジスティック回帰は、確率スケールでのS字型曲線の変曲点が確率0.5であると想定(または定義)します。彼は、変曲点が確かに確率0.5であると仮定する理由はないと主張し、実際の位置がデータに基づくように変曲点を変化させることができる別の回帰モデルを選択する必要があります。 私はこの点について考えたことがないので、最初は彼の議論に油断しました。変曲点が0.5であると仮定することが正当化される理由について、私は何の議論もしませんでした。いくつかの調査を行った後、私はまだこの質問に対する答えがありません。 変曲点が追加のパラメーターである5パラメーターロジスティック回帰に出くわしましたが、この回帰モデルは通常、連続的な結果を伴う用量反応曲線を作成するときに使用されているようです。バイナリ応答変数に拡張できるかどうか、またどのように拡張できるかはわかりません。 私の主な質問は、ロジスティック回帰の変曲点が0.5であると仮定してよいのはなぜですか?それも重要ですか?ロジスティック回帰モデルをフィッティングして、変曲点の問題を明確に議論する人を見たことがありません。変曲点が必ずしも0.5とは限らない線量応答曲線を作成するための代替手段はありますか? 完全を期すために、上の図を生成するためのRコード: dat &lt;- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") dat$rank &lt;- factor(dat$rank) logit &lt;- glm(admit ~ gre + gpa + rank, family = binomial(link = "logit"), data = dat) newdata &lt;- data.frame(gre = seq(-2000,8000,1), gpa = 2.5, rank = factor(1,c(1,2,3,4))) pp &lt;- predict(logit, newdata, type = "response", se.fit = TRUE) …

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.