タグ付けされた質問 「diagnostic」

診断指標(残差や残差から計算されたいくつかの要約統計など)は、データへのモデルの適合の品質のある側面を評価するために使用されます。


3
glmモデルの残差診断プロットを解釈しますか?
glmモデルの残差プロットの解釈方法に関するガイドラインを探しています。特にポアソン、負の二項、二項モデル。モデルが「正しい」場合、これらのプロットから何を期待できますか?(たとえば、ポアソンモデルを扱う場合、予測値が増加すると分散が大きくなると予想されます) 答えはモデルに依存することを知っています。参考文献(または考慮すべき一般的なポイント)があれば参考になります。

5
ブートストラップの間隔にひどいカバレッジがあるのはなぜですか?
t間隔をブートストラップ間隔と比較し、両方のカバレッジ確率を計算するクラスのデモを行いたいと思いました。歪んだ分布からデータを取得したいのでexp(rnorm(10, 0, 2)) + 1、シフトした対数正規分布からサイズ10のサンプルとしてデータを生成することにしました。1000個のサンプルを描画するスクリプトを作成し、各サンプルについて、1000回の繰り返しに基づいて95%のt間隔と95%のブートストラップパーセンタイル間隔の両方を計算しました。 スクリプトを実行すると、両方の方法の間隔は非常に似ており、両方のカバレッジ確率は50〜60%です。ブートストラップの間隔の方が良いと思ったので驚きました。 私の質問は コードを間違えた? 間隔の計算を間違えましたか? ブートストラップ間隔がより良いカバレッジプロパティを持つことを期待することでミスを犯しましたか? また、この状況でより信頼性の高いCIを構築する方法はありますか? tCI.total <- 0 bootCI.total <- 0 m <- 10 # sample size true.mean <- exp(2) + 1 for (i in 1:1000){ samp <- exp(rnorm(m,0,2)) + 1 tCI <- mean(samp) + c(1,-1)*qt(0.025,df=9)*sd(samp)/sqrt(10) boot.means <- rep(0,1000) for (j in 1:1000) boot.means[j] …

1
分位回帰にはどのような診断プロットが存在しますか?
OLSに関する私の質問に続いて、私は疑問に思う:分位回帰にはどのような診断プロットが存在するのか?(そしてそれらのR実装はありますか?) 簡単なグーグル検索で、すでにワームのプロット(これまで聞いたことがない)を思い付きました。(それらのうちのどれかが、分位点回帰のために移植されたOLSからのものですか?)

2
Rの尤度比検定
次のように、いくつかの独立変数に対して単変量ロジスティック回帰を行うと仮定します。 mod.a <- glm(x ~ a, data=z, family=binominal("logistic")) mod.b <- glm(x ~ b, data=z, family=binominal("logistic")) このコマンドにより、モデルがnullモデルよりも優れているかどうかを確認するために、モデルの比較(尤度比検定)を行いました。 1-pchisq(mod.a$null.deviance-mod.a$deviance, mod.a$df.null-mod.a$df.residual) 次に、すべての変数を含む別のモデルを作成しました mod.c <- glm(x ~ a+b, data=z, family=binomial("logistic")) 変数が多変量モデルで統計的に有意であるかどうかを確認するために、lrtest次のコマンドを使用しましたepicalc lrtest(mod.c,mod.a) ### see if variable b is statistically significant after adjustment of a lrtest(mod.c,mod.b) ### see if variable a is statistically significant after …
25 r  logistic  diagnostic 

2
MCMC Geweke診断
Metropolisサンプラー(C ++)を実行していますが、以前のサンプルを使用して収束率を推定したいと思います。 私が見つけた診断を実装するのが簡単なのは、2つのサンプル平均の差を推定標準誤差で除算したGeweke診断です。標準誤差は、ゼロでのスペクトル密度から推定されます。 Zn= θ¯A- θ¯B1nASAθ^(0 )+ 1nBSBθ^(0 )−−−−−−−−−−−−−−−−√、Zn=θ¯A−θ¯B1nASθA^(0)+1nBSθB^(0)、Z_n=\frac{\bar{\theta}_A-\bar{\theta}_B}{\sqrt{\frac{1}{n_A}\hat{S_{\theta}^A}(0)+\frac{1}{n_B}\hat{S_{\theta}^B}(0)}}, ここで、、はマルコフ連鎖内の2つのウィンドウです。私はおよびとは何かを研究しましたが、エネルギースペクトル密度とパワースペクトルに関する多くの文献に取りかかりました密度ですが、これらのトピックの専門家ではありません。簡単な答えが必要です。これらの量はサンプル分散と同じですか?そうでない場合、それらを計算するための式は何ですか?AAABBBSAθ^(0 )SθA^(0)\hat{S_{\theta}^A}(0)SBθ^(0 )SθB^(0)\hat{S_{\theta}^B}(0) このGeweke診断に関するもう1つの疑問は、を選択する方法です。上記の文献は、それが何らかの機能的なあり、スペクトル密度存在を暗示すべきだと言っていますが、便宜上、最も簡単な方法はアイデンティティ関数(サンプル自体を使用)。これは正しいです?θθ\thetaθ (X)θ(バツ)\theta(X)SAθ^(0 )SθA^(0)\hat{S_{\theta}^A}(0) R codaパッケージには説明がありますが、値の計算方法も指定されていません。SSS
14 mcmc  diagnostic 

3
信号検出理論から導出されたメトリックを使用せずに信号検出データを分析することは有効ですか?
信号検出実験では、通常、観測者(または診断システム)に信号または非信号を提示し、観測者は提示されたアイテムが信号であるか非信号であるかを報告するよう求められます。このような実験では、2x2行列を満たすデータが生成されます。 信号検出理論は、「信号/非信号」の決定が、信号試行が一般に非信号試行よりも高い値を持つ連続性の信号性に基づいているシナリオを表すようなデータを表します。 「シグナル」を報告する基準値を選択します。 上の図では、緑と赤の分布はそれぞれ「信号」と「非信号」の分布を表し、灰色の線は特定の観測者が選択した基準を表しています。灰色の線の右側の緑の曲線の下の領域はヒットを表し、赤の曲線の下の領域は誤報を表します。灰色の線の左側の緑の曲線の下の領域はミスを表し、赤の曲線の下の領域は正しい拒否を表します。 想像できるように、このモデルによれば、上記の2x2テーブルの各セルに分類される応答の割合は、次のように決定されます。 緑と赤の分布からサンプリングされた試行の相対的な割合(基本レート) オブザーバーが選択した基準 分布間の分離 各分布の分散 分布間の分散の等価性からの逸脱(分散の等価性は上に描かれています) 各分布の形状(両方とも上記のガウス分布) 多くの場合、#5と#6の影響は、オブザーバーにいくつかの異なる基準レベルで決定を下すことによってのみ評価できるため、現時点では無視します。さらに、#3と#4は相互にのみ意味を持ち(例えば、分布の変動性に対する分離の大きさ)、「識別可能性」(d 'としても知られる)の尺度によって要約されます。したがって、信号検出理論は、信号検出データからの2つの特性、つまり基準と識別可能性の推定を禁止しています。 しかし、研究レポート(特に医療分野)が信号検出フレームワークを適用せず、代わりに「陽性的中率」、「陰性的中率」、「感度」、「特異性」などの量を分析しようとすることに気づきました。これらはすべて、上記の2x2の表とは異なる限界値を表しています(詳細については、こちらをご覧ください)。 これらの限界プロパティはどのようなユーティリティを提供しますか?私の傾向は、それらが基準と識別可能性の理論的に独立した影響を混乱させるので、それらを完全に無視することですが、おそらく彼らの利益を考慮するための想像力を欠いています。

1
マハラノビス距離とレバレッジの関係を証明しますか?
ウィキペディアで数式を見てきました。マハラノビスの距離とレバレッジを関連付ける: マハラノビス距離はレバレッジ統計hhhと密接に関連していますが、スケールは異なります:D2=(N−1)(h−1N).D2=(N−1)(h−1N).D^2 = (N - 1)(h - \tfrac{1}{N}). ではリンク先の記事、ウィキペディアは説明するhhhこれらの用語には: 線形回帰モデルでは、のためにレバレッジスコアithithi^{th}データユニットは、次のように定義される:hii=(H)ii,hii=(H)ii,h_{ii}=(H)_{ii},ithithi^{th}ハット行列の対角要素H=X(X⊤X)−1X⊤H=X(X⊤X)−1X⊤H=X(X^{\top}X)^{-1}X^{\top}、⊤は行列転置を表します。⊤⊤^{\top} どこにも証拠が見つかりません。定義から始めようとしましたが、何も進展しません。誰でもヒントを与えることができますか?

3
診断メトリック(
私は自分のモデルを適合させ、それが良いかどうかを理解しようとしています。私はそれを評価するために推奨されるメトリック(R2R2R^2 / AUC /精度/予測誤差/など)を計算しましたが、それらを解釈する方法がわかりません。要するに、私のモデルがメトリックに基づいて良いかどうかはどのようにしてわかりますか?あるR2R2R^2、私は推論やベース科学/ビジネス上の意思決定を描画するために進んでみましょうするのに十分な(例えば)0.6のは? この質問は、メンバーが頻繁に遭遇するさまざまな状況をカバーするために、意図的に広くなっています。このような質問は、この質問の重複として閉じることができます。ここで説明したメトリックを超えて範囲を広げる編集、およびその他の回答、特に他のクラスのメトリックに関する洞察を提供するものは歓迎されます。

1
TBATSモデルの結果とモデル診断を解釈する方法
マルチシーズンの時系列である、30分ごとの需要データを取得しました。私はRのパッケージで使用tbatsしforecast、次のような結果を得ました: TBATS(1, {5,4}, 0.838, {<48,6>, <336,6>, <17520,5>}) それは、シリーズが必ずしもBox-Cox変換を使用する必要がないことを意味し、エラー項はARMA(5、4)であり、季節性を説明するために6、6、および5項が使用されますか?そのダンピングされたパラメーター0.8383は何を意味しますか?それは変換用でもありますか? 以下はモデルの分解プロットです: 私はモデルについて何をしlevel、slope伝えるのか疑問に思っています。「スロープ」はトレンドを伝えますが、どうlevelですか?以下のための明確なプロットを取得する方法session 1とsession 2、それぞれの日常や季節毎週です。 またtbats、RMSE値を除いて、モデルを評価するためにモデル診断を行う方法を知る必要があります。通常の方法は、エラーがホワイトノイズかどうかをチェックすることですが、ここではエラーはARMAシリーズであると想定されています。エラーの「acf」と「pacf」をプロットしましたが、ARMA(5,4)のようには見えません。私のモデルが良くないということですか? acf(resid(model1),lag.max = 1000) pacf(resid(model1),lag.max=1000) 最後の質問RMSEは、適合値と真の値を使用して計算されます。fc1.week$meanモデルを評価するために予測値と真の値を使用するとどうなりますRMSEか?または、これには別の名前がありますか? fc1.week <-forecast(model1,h=48*7) fc1.week.demand<-fc1.week$mean

1
診断は残差に基づいているのはなぜですか?
単純な線形回帰では、推論を行うことができるように特定の仮定が満たされているかどうかを確認することがよくあります(たとえば、残差は正規分布です)。 当てはめられた値が正規分布しているかどうかをチェックすることにより、仮定をチェックすることは妥当ですか?

4
OLSで省略された変数バイアスのテストはありますか?
非線形の依存関係を検出する可能性があるラムジーリセットテストを知っています。ただし、回帰係数の1つ(単に線形依存関係)を捨てただけの場合、相関関係によってはバイアスがかかる可能性があります。これは明らかにリセットテストでは検出されません。 このケースのテストは見つかりませんでしたが、「潜在的な省略された変数を含めることを除いて、OVBをテストすることはできません」というステートメントです。それはおそらく理にかなった陳述でしょうね。

2
lmのデフォルトの診断プロットへの可能な拡張(Rおよび一般的に)?
plot.lm関数を少し掘り始めました。この関数はlmに6つのプロットを提供します。 近似値に対する残差のプロット フィットされた値に対するsqrt(|残差|)のスケール-ロケーションプロット 通常のQQプロット、クックの距離と行ラベルのプロット レバレッジに対する残差のプロット レバレッジ/(1-レバレッジ)に対するクックの距離のプロット そして、私は現在のプロットの他の一般的な/有用な拡張が線形モデルにどのように存在するのか、そしてそれらをRでどのように行うことができるのでしょうか?(パッケージの記事へのリンクも歓迎します) そのため、boxcox関数({MASS}から)は別の有用な診断プロットの例です(そのような答えはすばらしいでしょう)が、Rのlmの既存のデフォルト診断プロットのバリエーション/拡張についてもっと知りたいです(ただし、一般的なトピックに関する他の発言は常に歓迎されます)。 ここに私が意味することのいくつかの簡単な例があります: #Some example code for all of us to refer to set.seed(2542) x1 <- rnorm(100) x2 <- runif(100, -2,2) eps <- rnorm(100,0,2) y <- 1 + 2*x1 + 3*x2 + eps y[1:4] <- 14 # adding some contaminated points fit <- lm(y~x1+x2) …

4
重回帰の残差対近似値プロットの対角直線
私のデータの残差の奇妙なパターンを観察しています: [編集] 2つの変数の部分回帰プロットを次に示します。 [編集2] PPプロットを追加 ディストリビューションは順調に進んでいるようですが(下記参照)、この直線がどこから来ているのかわかりません。何か案は? [更新31.07] 確かに、あなたは完全に正しいことがわかりました。私は、リツイート数が実際に0であるケースがあり、これらの〜15のケースは、これらの奇妙な残差パターンをもたらしました。 残差はずっと良く見えます: 黄土の線を含む部分回帰も含めました。

7
感度または特異性は有病率の関数ですか?
標準的な教育では、感度と特異度はテストの特性であり、有病率とは無関係であると述べています。しかし、これは単なる仮定ではありませんか? ハリソンの内科第19版の原則 感度と特異度は、テストの正確さの有病率に依存しないパラメーターであると長い間主張されてきました。ただし、この統計的に有用な仮定は、臨床的に単純化されています。...テストの感度は入院患者の方が高く、テストの特異性は外来患者の方が高いでしょう。 (一般的に有病率は外来患者よりも入院患者で高い) これらのパラメーターの間に数学的またはおおよそのグラフィカルな関係はありますか? このリンクでさえ、それを「単純化」と呼んでいます。どうして? 編集:私は感度がどのように定義されているか知っています。回答で述べられているように、有病期間は含まれていません。私自身も、これらのテストの特性は、使用されている母集団に影響されないということを主張しています。しかし、私は、この混乱はこれらの値の定義ではなく実際的な計算が原因で発生していると思います。特異性と感度は2x2の表を使用して計算されますが、参照母集団の有病率は重要ですか?彼らが言及しているのはそれですか?もしそうなら、その機能は何ですか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.