タグ付けされた質問 「ordered-logit」

順序付きロジットモデル(順序付き/順序ロジスティック回帰とも呼ばれる)は、バイナリ従属変数から順序従属変数へのロジスティック回帰の拡張です。普及している特殊なケースは比例オッズモデルです。

6
ワイン評価を予測する線形回帰または順序ロジスティック回帰(0〜10)
ここから、0から10までの値を持つ各エントリに関連付けられた従属評価を持つ11の数値独立変数で構成されるワインデータがあります。これは、変数と関連する変数との関係を調べるために回帰モデルを使用するのに最適なデータセットになります評価。しかし、線形回帰は適切でしょうか、または多項/順序付きロジスティック回帰を使用する方が良いでしょうか? ロジスティック回帰は、特定のカテゴリ、つまり連続従属変数ではないが、(1)11のカテゴリ(少し多すぎる?)があり、(2)検査時に、それらのカテゴリのうち6〜7のデータ、つまり残りの5-4のカテゴリには、データセットに例がありません。 一方、線形回帰では、0〜10の間の評価を線形に推定する必要があります。これは、私が見つけようとしているものに近いようです。それでも、従属変数はデータセット内で連続的ではありません。 どちらが良いアプローチですか?注:分析にRを使用しています 回答に記載されているいくつかのポイントに対処して編集します。 これは実際には大学のコースであるため、ビジネス目標はありません。タスクは、私が適切と思う方法で、選択したデータセットを分析することです。 評価の分布は正常に見えます(ヒストグラム/ qqプロット)。データセットの実際の値は3〜8です(技術的には0〜10です)。

1
順序ロジスティック回帰のプロットと解釈
1(簡単ではない)から5(非常に簡単)の範囲の順序依存変数easinessがあります。独立因子の値の増加は、容易性評価の増加に関連しています。 私の独立変数のうちの2つ(condAおよびcondB)はカテゴリカルであり、それぞれ2つのレベルがあり、2(abilityA、abilityB)は連続しています。 私が使用している序それは私がであると信じるものを使用してR、パッケージを ロジット(p (Y⩽ グラム))= lnp (Y⩽ グラム)p (Y> g)= β0g− (β1バツ1+ ⋯ + βpバツp)(g= 1 、… 、k − 1 )ロジット(p(Y⩽g))=ln⁡p(Y⩽g)p(Y>g)=β0g−(β1バツ1+⋯+βpバツp)(g=1、…、k−1)\text{logit}(p(Y \leqslant g)) = \ln \frac{p(Y \leqslant g)}{p(Y > g)} = \beta_{0_g} - (\beta_{1} X_{1} + \dots + \beta_{p} X_{p}) \quad(g = 1, \ldots, k-1) (@caracalの回答はこちら) 私はこれを独自に学習してきましたが、まだ苦労しているので、可能な限りの助けをお願いします。通常のパッケージに付属するチュートリアルに加えて、次の情報も役立つことがわかりました。 順序ロジスティック回帰の解釈 順序ロジスティック回帰の負の係数 …

2
Rで数値/カテゴリ値の両方で順序ロジスティック回帰分析を実行するにはどうすればよいですか?
基本データ:評価「1,1」「良い」「2」「中間」または「3」「悪い」でマークされた人が約1,000人あります-これらは将来の人のために予測しようとしている値です。それに加えて、性別(カテゴリ:M / F)、年齢(数値:17-80)、および人種(カテゴリ:黒/白人/ラテン系)の人口統計情報があります。 主に4つの質問があります。 最初に、上記のデータセットを重回帰分析として実行しようとしました。しかし、私は最近、私の従属変数が順序変数であり、連続変数ではないため、このようなことには順序ロジスティック回帰を使用する必要があることを学びました。最初はのようなものを使用していましたがmod <- lm(assessment ~ age + gender + race, data = dataset)、誰かが私を正しい方向に向けられますか? そこから、私が快適だと思う係数を取得すると仮定して、x1、x2などの数値のみをプラグインする方法を理解します-しかし、たとえば、複数の応答がある場合、レースにどのように対処しますか:黒/白人/ラテン系?それで、コーカサス係数が0.289で、予測しようとしている人がコーカサス人であることがわかった場合、値は数値ではないので、どのように元に戻すのですか? レース用、性別用など、欠落しているランダムな値もあります。これが歪んでいないことを確認するために、さらに何かをする必要がありますか?(データセットがR-StudioにロードされNA、欠落データがとしてロードされると、Rは次のよう(162 observations deleted due to missingness)になりますが、空白としてロードされても、何もしません。) これがすべてうまくいき、性別、年齢、人種を予測したい新しいデータがあると仮定します。新しい係数を持つ私の式が判明したとしても、Rでそれをすべて実行する簡単な方法がありますか?手動で行うのではなく?(この質問がここで適切でない場合は、Rフォーラムに戻すことができます。)

1
順序付きロジスティック回帰の負の係数
我々は序数応答があるとy:{Bad, Neutral, Good}→{1,2,3}y:{Bad, Neutral, Good}→{1,2,3}y:\{\text{Bad, Neutral, Good}\} \rightarrow \{1,2,3\}と変数の集合X:=[x1,x2,x3]X:=[x1,x2,x3]X:=[x_1,x_2,x_3]我々は考えることを説明するyyy。次に、y(応答)に対してXXX(設計行列)の順序付きロジスティック回帰を行います。yyy 推定係数と仮定x1x1x_1、それが呼び出しβ 1である、順序付けられたロジスティック回帰に- 0.5。e - 0.5 = 0.607のオッズ比(OR)をどのように解釈しますか?β^1β^1\hat{\beta}_1−0.5−0.5-0.5e−0.5=0.607e−0.5=0.607e^{-0.5} = 0.607 私が1つの単位増加のために」と言うか、paribusをceteris、観察のオッズ良いがある0.607観察の倍のオッズ悪い∪ ニュートラルを、とで同じ変更のためのx 1、観察のオッズ中性∪ 良いがある0.607 Badを観察する確率は?x1x1x_1GoodGood\text{Good}0.6070.6070.607Bad∪NeutralBad∪Neutral\text{Bad}\cup \text{Neutral}x1x1x_1Neutral∪GoodNeutral∪Good\text{Neutral} \cup \text{Good}0.6070.6070.607BadBad\text{Bad} 私は教科書やグーグルで負の係数の解釈の例を見つけることができません。

2
順序ロジスティック回帰の解釈
この順序ロジスティック回帰をRで実行しました。 mtcars_ordinal <- polr(as.factor(carb) ~ mpg, mtcars) 私はこのモデルの概要を得ました: summary(mtcars_ordinal) Re-fitting to get Hessian Call: polr(formula = as.factor(carb) ~ mpg, data = mtcars) Coefficients: Value Std. Error t value mpg -0.2335 0.06855 -3.406 Intercepts: Value Std. Error t value 1|2 -6.4706 1.6443 -3.9352 2|3 -4.4158 1.3634 -3.2388 3|4 -3.8508 1.3087 -2.9425 …

2
ランダム効果で順序ロジスティック回帰を使用する方法は?
私の研究では、いくつかのメトリックでワークロードを測定します。心拍変動(HRV)、皮膚電気活動(EDA)および主観的尺度(IWS)を使用。正規化後、IWSには3つの値があります。 ワークロードが通常よりも低い ワークロードは平均です ワークロードが通常よりも高くなっています。 生理学的測定が主観的な作業負荷をどれだけうまく予測できるかを見たい。 したがって、比率データを使用して順序値を予測したいと思います。によると:数値/カテゴリ値の両方でRで順序ロジスティック回帰分析を実行するにはどうすればよいですか?これは、MASS:polr関数を使用して簡単に実行できます。 ただし、被験者間差、性別、喫煙などのランダム効果も考慮したいと思います。このチュートリアルを見て、にランダム効果を追加する方法がわかりませんMASS:polr。代わりにlme4:glmerオプションがありますが、この関数はバイナリデータの予測のみを許可します。 順序ロジスティック回帰にランダム効果を追加することは可能ですか?

1
帰無仮説の下で交換可能なサンプルの背後にある直感は何ですか?
順列テスト(ランダム化テスト、再ランダム化テスト、または正確なテストとも呼ばれます)は非常に便利で、たとえば、必要な正規分布の仮定がt-test満たされていない場合や、ランク付けによる値の変換時に役立ちますノンパラメトリックテストのようにMann-Whitney-U-test、より多くの情報が失われます。ただし、この種の検定を使用する場合、帰無仮説の下でのサンプルの交換可能性の仮定は1つだけの仮定を見落とすべきではありません。coinRパッケージで実装されているようなサンプルが3つ以上ある場合にも、この種のアプローチを適用できることも注目に値します。 この仮定を説明するために、平易な英語で比fig的な言葉や概念的な直観を使ってください。これは、私のような非統計学者の間で見過ごされているこの問題を明確にするのに非常に役立つでしょう。 注: 置換テストの適用が同じ仮定の下で保持または無効にならない場合に言及することは非常に役立ちます。 更新: 私の地区の地元の診療所から無作為に50人の被験者を収集したとします。彼らは、1:1の比率で薬またはプラセボを無作為に割り当てられました。それらはすべてPar1、V1(ベースライン)、V2(3か月後)、およびV3(1年後)のパラメーター1について測定されました。50個の被験者はすべて、機能Aに基づいて2つのグループにサブグループ化できます。Aポジティブ= 20およびAネガティブ=30。これらは、機能Bに基づいて別の2つのグループにサブグループ化することもできます。Bポジティブ= 15およびBネガティブ=35 。今、私はPar1すべての訪問ですべての被験者からの値を持っています。交換可能性の仮定の下で、次のPar1場合に順列検定を使用するレベルを比較でき ますか?-薬物と被験者をV2でプラセボを投与した被験者と比較する ますか?-機能Aの対象とV2の機能Bの対象を比較しますか? -V2で機能Aを持つ対象とV3で機能Aを持つ対象を比較しますか? -この比較はどのような状況で無効であり、交換可能性の仮定に違反しますか?
15 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

4
Rのブラントテスト[終了]
閉まっている。この質問はトピック外です。現在、回答を受け付けていません。 この質問を改善したいですか? 質問を更新して、相互検証のトピックになるようにします。 6か月前に閉鎖されました。 順序ロジスティック回帰の並列回帰の仮定をテストする際、いくつかのアプローチがあることがわかりました。私は、グラフィカルなアプローチ(Harrellの本で詳述されている)とRの順序パッケージを使用して詳述されたアプローチの両方を使用しまし た。 ただし、個々の変数と全体モデルの両方に対して、Brantテスト(Stataから)も実行したいと思います。私は周りを見回しましたが、Rで実装されているのが見つかりません RにBrantテストの実装はありますか?

2
順序ロジスティック回帰モデルを指定して、応答カテゴリをどのように予測しますか?
健康上の問題を予測したい。「正常」、「軽度」、「重度」の3つの結果カテゴリがあります。これを2つの予測変数、テスト結果(連続、間隔共変量)およびこの問題の家族歴(はいまたはいいえ)から予測したいと思います。私のサンプルでは、​​確率は55%(正常)、35%(軽度)、および10%(重度)です。この意味で、私は常に「正常」を予測し、55%の確率で正しいことができますが、個々の患者に関する情報は得られません。私は次のモデルに適合します: (yのカットポイント ≥ 1 )ˆ(yのカットポイント ≥ 2 )ˆβ^t e s tβ^fa m i l y h i s t o r y = − 2.18= − 4.27= 0.60= 1.05のカットポイント (y≥1)^=−2.18のカットポイント (y≥2)^=−4.27β^test=0.60β^fam私ly h私story=1.05\begin{align} \text{the cut point for }\widehat{(y \ge 1)} &= -2.18 \\ \text{the cut point for }\widehat{(y \ge 2)} &= …

1
GBMパッケージとGBMを使用したキャレット
私はを使用してモデルのチューニングを行ってきましたがcaret、gbmパッケージを使用してモデルを再実行しています。caretパッケージが使用gbmし、出力が同じである必要があることは私の理解です。ただし、を使用した簡単なテスト実行でdata(iris)は、評価指標としてRMSEとR ^ 2を使用したモデルで約5%の不一致が示されています。を使用して最適なモデルのパフォーマンスを見つけたいが、部分的な依存関係プロットを利用するためにcaret再実行しgbmます。再現性のために以下のコード。 私の質問は次のとおりです。 1)これらの2つのパッケージは同じであっても違いがあるのはなぜですか(確率的ですが、5%がやや大きな違いであることがわかります。特に、次のような素晴らしいデータセットを使用していない場合 iris、モデリングの) 。 2)両方のパッケージを使用する利点または欠点はありますか? 3)無関係:irisデータセットを使用した場合、最適な値interaction.depthは5ですが、読み取り値が最大値floor(sqrt(ncol(iris)))である2 を超えるはずです。これは厳密な経験則ですか、それとも非常に柔軟ですか。 library(caret) library(gbm) library(hydroGOF) library(Metrics) data(iris) # Using caret caretGrid <- expand.grid(interaction.depth=c(1, 3, 5), n.trees = (0:50)*50, shrinkage=c(0.01, 0.001), n.minobsinnode=10) metric <- "RMSE" trainControl <- trainControl(method="cv", number=10) set.seed(99) gbm.caret <- train(Sepal.Length ~ ., data=iris, distribution="gaussian", method="gbm", trControl=trainControl, verbose=FALSE, tuneGrid=caretGrid, metric=metric, bag.fraction=0.75) …

1
Pythonでの順序ロジスティック回帰
Pythonで順序ロジスティック回帰を実行したいと思います-3つのレベルといくつかの説明要因を持つ応答変数に対して。このstatsmodelsパッケージは、バイナリロジットモデルと多項ロジット(MNLogit)モデルをサポートしていますが、順序付けられたロジットはサポートしていません。基礎となる数学はそれほど変わらないので、これらを使用して簡単に実装できるのだろうか?(または、動作する他のPythonパッケージを高く評価します。)

2
相互検証と順序ロジスティック回帰
順序ロジスティック回帰の相互検証を理解しようとしています。ゲームの目的は、分析で使用されるモデルを検証することです... 最初に、おもちゃのデータセットを作成します。 set.seed(1) N <- 10000 # predictors x1 <- runif(N) x2 <- runif(N) x3 <- runif(N) # coeffs in the model a <- c(-2,-1) x <- -x1+2*x2+x3 # P( y ≤ i ) is given by logit^{-1} ( a[i]+x ) p <- outer(a,x, function(a,x) 1/(1+exp(-a-x)) ) # computing the …


3
結果をカテゴリーではなく順序と見なした場合、何が得られますか?
順序変数とカテゴリ変数の予測には、さまざまな方法があります。 私が理解していないのは、この区別がいかに重要かということです。注文を落とすと何が悪いのかを明確にする簡単な例はありますか?どのような状況でそれは重要ではありませんか?たとえば、独立変数もすべてカテゴリカル/オーディナルである場合、違いはありますか? この関連する質問は、独立変数のタイプに焦点を当てています。ここでは、結果変数について尋ねています。 編集: 順序構造を使用するとモデルパラメーターの数が減るという点がわかりますが、それでもまだ確信が持てません。 ここに例があります(順序付きロジスティック回帰の序論から取られていますが、私が見る限り、順序ロジスティック回帰は多項ロジスティック回帰よりもパフォーマンスが良くありません: library(nnet) library(MASS) gradapply <- read.csv(url("http://www.ats.ucla.edu/stat/r/dae/ologit.csv"), colClasses=c("factor", "factor", "factor", "numeric")) ordered_result <- function() { train_rows <- sample(nrow(gradapply), round(nrow(gradapply)*0.9)) train_data <- gradapply[train_rows,] test_data <- gradapply[setdiff(1:nrow(gradapply), train_rows),] m <- polr(apply~pared+gpa, data=train_data) pred <- predict(m, test_data) return(sum(pred==test_data$apply)) } multinomial_result <- function() { train_rows <- sample(nrow(gradapply), round(nrow(gradapply)*0.9)) train_data <- …

1
Rでの順序付きロジットの予測
順序付きロジット回帰を実行しようとしています。私はそのようにモデルを実行しています(収入と人口の測定から市場の企業数を推定するばかげた小さなモデル)。私の質問は予測についてです。 nfirm.opr<-polr(y~pop0+inc0, Hess = TRUE) pr_out<-predict(nfirm.opr) 予測を実行すると(予測されたyを取得するために使用しています)、出力は0、3、または27のいずれかであり、これは係数からの手動予測に基づく予測であると思われるものを反映するものではありません推定と傍受。注文したロジットモデルの「正確な」予測を取得する方法を知っている人はいますか? 編集 私の懸念を明確にするために、私の応答データにはすべてのレベルにわたる観察があります >head(table(y)) y 0 1 2 3 4 5 29 21 19 27 15 16 私の予測変数が集まっているように見えるところ > head(table(pr_out)) pr_out 0 1 2 3 4 5 117 0 0 114 0 0

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.