タグ付けされた質問 「goodness-of-fit」

適合度テストは、ランダムなサンプルが特定の分布からのものであると仮定することが妥当かどうかを示します。

2
どの分布がデータに最も適しているかを判断する方法は?
データセットがあり、どの分布がデータに最も適しているかを把握したいと思います。 fitdistr()関数を使用して、必要なパラメーターを推定し、想定される分布(つまり、ワイブル、コーシー、正規)を記述しました。これらのパラメーターを使用して、コルモゴロフ・スミルノフ検定を実施して、サンプルデータが想定分布と同じ分布からのものかどうかを推定できます。 p値が0.05より大きい場合、サンプルデータは同じ分布から引き出されたと仮定できます。しかし、p値は適合度に関する情報を提供しませんよね? したがって、サンプルデータのp値がワイブル分布と同様に正規分布で0.05を超える場合、どの分布がデータに適合するかをどのように知ることができますか? これは基本的に私がやったことです: > mydata [1] 37.50 46.79 48.30 46.04 43.40 39.25 38.49 49.51 40.38 36.98 40.00 [12] 38.49 37.74 47.92 44.53 44.91 44.91 40.00 41.51 47.92 36.98 43.40 [23] 42.26 41.89 38.87 43.02 39.25 40.38 42.64 36.98 44.15 44.91 43.40 [34] 49.81 38.87 40.00 52.45 53.13 47.92 …

7
ロジスティック回帰(Cox&SnellまたはNagelkerke)について報告するのはどの擬似尺度ですか?
SPSSロジスティック回帰モデルの出力があります。出力は、モデルの適合のための2つの対策を報告し、Cox & SnellそしてNagelkerke。 それで、経験則として、これらのR2R²R^²測定値のどれがモデルに適合すると報告しますか? または、これらの適合指数のどれがジャーナルで通常報告されますか? ある程度の背景:回帰は、いくつかの環境変数(例:急峻さ、植生被覆など)から鳥(アカゲラ)の有無を予測しようとします。残念ながら、鳥はあまり頻繁に出現しなかったため(35ヒットから468ミス)、回帰のパフォーマンスはかなり低下しました。Cox&Snellは.09、Nagelkerke、.23です。 主題は、環境科学または生態学です。

8
与えられたサンプルがポアソン分布から取得された場合、どのようにテストできますか?
正規性テストは知っていますが、「ポアソン性」をテストするにはどうすればよいですか? 〜1000個の非負整数のサンプルがありますが、これらはポアソン分布から取得されたものと思われ、それをテストしたいと思います。


3
ロジスティック回帰の95%信頼区間を手動で計算することと、Rでconfint()関数を使用することに違いがあるのはなぜですか?
皆さん、私は説明できない奇妙なことに気づきました、できますか?要約すると、ロジスティック回帰モデルで信頼区間を計算する手動のアプローチとR関数confint()は異なる結果をもたらします。 Hosmer&LemeshowのApplied Logistic Regression(第2版)を行ってきました。第3章には、オッズ比と95%の信頼区間を計算する例があります。Rを使用すると、モデルを簡単に再現できます。 Call: glm(formula = dataset$CHD ~ as.factor(dataset$dich.age), family = "binomial") Deviance Residuals: Min 1Q Median 3Q Max -1.734 -0.847 -0.847 0.709 1.549 Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) -0.8408 0.2551 -3.296 0.00098 *** as.factor(dataset$dich.age)1 2.0935 0.5285 3.961 7.46e-05 *** --- Signif. codes: 0 ‘***’ 0.001 …
34 r  regression  logistic  confidence-interval  profile-likelihood  correlation  mcmc  error  mixture  measurement  data-augmentation  r  logistic  goodness-of-fit  r  time-series  exponential  descriptive-statistics  average  expected-value  data-visualization  anova  teaching  hypothesis-testing  multivariate-analysis  r  r  mixed-model  clustering  categorical-data  unsupervised-learning  r  logistic  anova  binomial  estimation  variance  expected-value  r  r  anova  mixed-model  multiple-comparisons  repeated-measures  project-management  r  poisson-distribution  control-chart  project-management  regression  residuals  r  distributions  data-visualization  r  unbiased-estimator  kurtosis  expected-value  regression  spss  meta-analysis  r  censoring  regression  classification  data-mining  mixture 

2
Hosmer-Lemeshowテストのの自由度
ロジスティック回帰モデルの適合度(GOF)に対するHosmer-Lemeshow検定(HLT)の検定統計量は、次のように定義されます。 その後、サンプルは単位、に分割され、十分位ごとに次の量が計算されます。d= 10d=10d=10D1、D2、… 、DdD1、D2、…、DdD_1, D_2, \dots , D_{d} O1つのD= ∑I ∈ Ddy私O1d=∑私∈Ddy私O_{1d}=\displaystyle \sum_{i \in D_d} y_i、すなわち、十分位数での陽性症例の観測数。DdDdD_d O0 d= ∑I ∈ Dd(1 − y私)O0d=∑私∈Dd(1−y私)O_{0d}=\displaystyle \sum_{i \in D_d} (1-y_i)、すなわち、十分位数で観測された負のケースの数。DdDdD_d E1つのD= ∑I ∈ Ddπ^私E1d=∑私∈Ddπ^私E_{1d}=\displaystyle \sum_{i \in D_d} \hat{\pi}_i、つまり十分位数陽性症例の推定数。DdDdD_d E0 d= ∑I ∈ Dd(1 - π^私)E0d=∑私∈Dd(1−π^私)E_{0d}= \displaystyle \sum_{i \in D_d} (1-\hat{\pi}_i)、すなわち、十分位数負のケースの推定数。DdDdD_d ここで、は番目の観測の観測されたバイナリ結果で、はその観測の推定確率です。y私y私y_iπ I私私iπ^私π^私\hat{\pi}_i 次に、検定統計量は次のように定義されます。 …

2
生残差対標準化残差対スチューデント化残差-いつ使用するか
これは同様の質問のように見え、多くの回答を得られませんでした。 クックのDなどのテストを省略し、残差をグループとして見て、適合度を評価するときに他の人が残差を使用する方法に興味があります。生の残差を使用します: 正規性を評価するためのQQプロット 対残差の散布図で、(a)異分散性および(b)シリアル自己相関の眼球チェック用。yyy と残差をプロットして、外れ値が発生する可能性のあるの値を調べるには、スチューデント化された残差を使用することを好みます。私の好みの理由は、標準化された残差は非常に類似した結果を提供しますが、どの値でどの残差が問題であるかを簡単に表示できることです。どの理論が使用されているかは、どの大学に行ったかに依存するというものです。y yyyyyyyyyy これは、他の人が残差を使用する方法に似ていますか?他の人はこの数のグラフを要約統計と組み合わせて使用​​しますか?

6
シャピロウィルクテストの解釈
私は統計が初めてなので、あなたの助けが必要です。 次のような小さなサンプルがあります。 H4U 0.269 0.357 0.2 0.221 0.275 0.277 0.253 0.127 0.246 Rを使用してShapiro-Wilkテストを実行しました。 shapiro.test(precisionH4U$H4U) そして、私は次の結果を得ました: W = 0.9502, p-value = 0.6921 ここで、p値よりも0.05の有意水準がalpha(0.6921> 0.05)よりも大きいと仮定すると、正規分布に関する帰無仮説を拒否できませんが、サンプルに正規分布があると言えますか? ありがとう!

6
d20の公平性をテストするにはどうすればよいですか?
20面ダイス(d20)の公平性をテストするにはどうすればよいですか?明らかに、値の分布を均一な分布と比較することになります。私は大学でカイ二乗検定を使用したことを漠然と覚えています。これを適用して、ダイスが公平かどうかを確認するにはどうすればよいですか?

1
lmerモデルからの効果の再現性の計算
混合効果モデリングによる測定の再現性(別名信頼性、別名クラス内相関)の計算方法を説明するこの論文に出会ったばかりです。Rコードは次のようになります。 #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = attr(vc$id,'stddev')[1]^2 #compute the unadjusted repeatability R = intercept_var/(intercept_var+residual_var) #compute n0, the repeatability adjustment n = as.data.frame(table(my_data$unit)) k = nrow(n) N = sum(n$Freq) n0 = (N-(sum(n$Freq^2)/N))/(k-1) #compute the adjusted repeatability Rn = …
28 mixed-model  reliability  intraclass-correlation  repeatability  spss  factor-analysis  survey  modeling  cross-validation  error  curve-fitting  mediation  correlation  clustering  sampling  machine-learning  probability  classification  metric  r  project-management  optimization  svm  python  dataset  quality-control  checking  clustering  distributions  anova  factor-analysis  exponential  poisson-distribution  generalized-linear-model  deviance  machine-learning  k-nearest-neighbour  r  hypothesis-testing  t-test  r  variance  levenes-test  bayesian  software  bayesian-network  regression  repeated-measures  least-squares  change-scores  variance  chi-squared  variance  nonlinear-regression  regression-coefficients  multiple-comparisons  p-value  r  statistical-significance  excel  sampling  sample  r  distributions  interpretation  goodness-of-fit  normality-assumption  probability  self-study  distributions  references  theory  time-series  clustering  econometrics  binomial  hypothesis-testing  variance  t-test  paired-comparisons  statistical-significance  ab-test  r  references  hypothesis-testing  t-test  normality-assumption  wilcoxon-mann-whitney  central-limit-theorem  t-test  data-visualization  interactive-visualization  goodness-of-fit 

7
分布仮説のテスト-帰無仮説を「受け入れる」ことができない場合、それを行う意味は何ですか?
GOF検定、Kolmogorov-Smirnov、Anderson-Darling などのさまざまな仮説検定は、次の基本形式に従います。χ2χ2\chi^{2} H0H0H_0:データは指定された分布に従います。 H1H1H_1:データは指定された分布に従っていません。 通常、特定のデータが特定の分布に従っているという主張を評価し、拒否した場合、データは特定のレベルでの特定の分布に適合しません。 αH0H0H_0αα\alpha しかし、拒否しないとますか?私は常に「受け入れる」ことはできないと教えられてきたので、基本的にを拒否する証拠はありません。つまり、データが指定された分布に従うことを拒否するという証拠はありません。H 0 H 0H0H0H_0H0H0H_0H0H0H_0 したがって、私の質問は、データが特定の分布に従うかどうかを結論付けることができない場合、そのようなテストを実行するポイントは何ですか?

2
一般的な適合度テストに相当するベイジアンとは何ですか?
2つのデータセットがあります。1つは物理的観測(温度)のセットからのもので、もう1つは数値モデルのアンサンブルからのものです。モデルのアンサンブルが真の独立したサンプルを表すと仮定し、観測がその分布から引き出されているかどうかを確認するために、完全なモデル分析を行っています。計算した統計は正規化されており、理論的には標準正規分布でなければなりません。もちろん完璧ではないので、適合度をテストしたいと思います。 頻度論的推論を使用して、Cramér-vonMises統計(またはKolmogorov-Smirnovなど)、または同様のものを計算し、テーブルで値を検索してp値を取得し、値がどの程度低いかを判断するのに役立ちます観測値がモデルと同じである場合、参照してください。 このプロセスのベイジアン等価物は何でしょうか?つまり、これら2つの分布(計算された統計値と標準正規分布)が異なるという確信の強さを定量化するにはどうすればよいですか?

3
ロジスティック回帰の評価とHosmer-Lemeshow適合度の解釈
誰もが知っているように、ロジスティック回帰モデルを評価するには2つの方法があり、それらは非常に異なることをテストしています 予測力: 独立変数に基づいて従属変数を予測できる程度を測定する統計を取得します。よく知られたPseudo R ^ 2はMcFadden(1974)とCox and Snell(1989)です。 適合度の統計 このテストは、モデルをより複雑にすることでさらに改善できるかどうかを判断します。これは、実際には非線形性または相互作用があるかどうかをテストすることです。 私のモデルに両方のテストを実装しましたが、 すでに2次および相互作用が追加されています。 >summary(spec_q2) Call: glm(formula = result ~ Top + Right + Left + Bottom + I(Top^2) + I(Left^2) + I(Bottom^2) + Top:Right + Top:Bottom + Right:Left, family = binomial()) Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) 0.955431 8.838584 …

1
離散データを使用したコルモゴロフ-スミルノフ:Rでのdgof :: ks.testの適切な使用とは?
初心者の質問: 2つの個別のデータセットが同じ分布に由来するかどうかをテストします。コルモゴロフ・スミルノフのテストが提案されました。 Conover(Practical Nonparametric Statistics、3d)は、コルモゴロフ-スミルノフ検定をこの目的に使用できると言っているようですが、その動作は離散分布で「保守的」であり、ここで何を意味するのかわかりません。 別の質問に対する DavidRのコメントは、「... KS統計に基づいてレベルα検定を作成することはできますが、シミュレーションなどによって重要な値を取得する他の方法を見つける必要があります。」 dgof Rパッケージ(article、cran)のks.test()のバージョンは、statsパッケージのks.test()のデフォルトバージョンにはない機能を追加します。とりわけ、dgof :: ks.testには次のパラメーターが含まれています。 simulate.p.value:離散適合度検定のみのために、モンテカルロシミュレーションによってp値を計算するかどうかを示す論理値。 Simulate.p.value = Tの目的は、DavidRが提案することを達成することですか? たとえそうであっても、2サンプルテストにdgof :: ks.testを本当に使用できるかどうかはわかりません。連続分布に対して2サンプルのテストのみを提供しているように見えます。 yが数値の場合、xとyが同じ連続分布から引き出されたという帰無仮説の2標本検定が実行されます。 または、yは連続(累積)分布関数(またはそのような関数)を指定する文字列、または離散分布を与えるecdf関数(またはクラスstepfunのオブジェクト)にすることができます。これらの場合、1サンプルテストは、xを生成した分布関数が分布y ...であるというヌルから実行されます。 (背景の詳細​​:厳密に言えば、基礎となる分布は連続的ですが、データは少数のポイントに非常に近い傾向があります。各ポイントはシミュレーションの結果であり、-1から10までの実数の平均です。 1.シミュレーションの終わりまでに、これらの数値はほぼ常に.9または-.9に非常に近いため、平均値はいくつかの値に集中し、それらを離散として扱います。シミュレーションは複雑で、データが既知の分布に従うと考える理由。) 助言?

2
分位点回帰モデルの調整済みようなものはありますか?
論文に変位値回帰モデルを含めたので、査読者は、調整済みのを論文に含めたいと思っています。私の研究で興味のある3つの分位数について、疑似を計算しました(KoenkerとMachadoの1999 JASA論文から)。R2R2R^2R2R2R^2 ただし、分位点回帰用に調整されたについて聞いたことがなく、その計算方法がわかりません。次のいずれかをお願いします。R2R2R^2 好ましくは、分位点回帰の調整済みを有意義に計算する方法に関する式またはアプローチ。R2R2R^2 あるいは、分位点回帰で調整されたようなものがない理由について、レビューアーに提供する説得力のある議論。R2R2R^2

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.