タグ付けされた質問 「confidence-interval」

信頼区間は、信頼度で未知のパラメーターをカバーする区間です。信頼区間は、頻度主義の概念です。それらは、ベイジアンアナログである信頼できる間隔と混同されることがよくあります。 (1α)%

14
信頼区間の解釈に関する明確化?
「信頼レベル信頼区間」という概念についての私の現在の理解は、信頼区間を何度も(毎回新鮮なサンプルで)計算しようとすると、正しいパラメーターが含まれることです。時間。1 - α1 - α1−α1 - \alpha1 - α1−α1 - \alpha これは「真のパラメーターがこの間隔にある確率」と同じではないことに気づきましたが、明確にしたいことがあります。 [メジャーアップデート] 95%の信頼区間を計算する前に、計算した区間が真のパラメーターをカバーする95%の確率があります。信頼区間を計算し、特定の区間を取得した後、これを言うことはできません。真のパラメーターがことを95%確信しているというある種の非頻度論的議論さえすることはできません。可能であれば、このような反例と矛盾するからです。正確には、信頼区間とは何ですか?[ a 、b ][ a 、b ][a,b][a,b][ a 、b ][a,b][a,b] これを確率論についての議論にしたくありません。代わりに、特定の間隔が表示される方法と理由について、その間隔を表示する前の95%の確率が正確に変化する(または変化しない)数学的な説明を探しています。あなたは「インターバルを見た後、確率の概念はもはや理にかなっている」と主張していない場合は、罰金、それはここで、確率の解釈での仕事をさせないメイクセンスを。[ a 、b ][a,b][a,b] より正確に: コンピューターをプログラムして95%の信頼区間を計算するとします。コンピューターはいくつかの計算処理を行い、間隔を計算し、パスワードを入力するまで間隔の表示を拒否します。パスワードを入力して間隔を確認する前(ただし、コンピューターが既に計算した後)、間隔に真のパラメーターが含まれる確率はどれくらいですか?95%であり、この部分は議論の余地はありません:これは、この特定の質問に興味がある確率の解釈です(私が抑制している主要な哲学的問題があることを認識し、これは意図的です)。 しかし、パスワードを入力して、コンピューターに計算された間隔を表示させると、確率(間隔に真のパラメーターが含まれる)が変わる可能性があります。この確率が決して変わらないという主張は、上記の反例と矛盾します。この反例では、確率は50%から100%に変化しますが、... 確率が100%または0%以外に変化する例はありますか(編集:もしそうなら、それらは何ですか)。 特定の間隔見ても確率が変わらない例はありますか(つまり、真のパラメーターがある確率はまだ95%です)。[ a 、b ][ a 、b ][a,b][a,b][ a 、b ][a,b][a,b] コンピューターが吐き出す見た後、一般に確率はどのように(そしてなぜ)変化しますか?[ a 、b ][a,b][a,b] [編集] すべての素晴らしい回答と有益な議論をありがとう!

4
なぜ統計学者は、帰無仮説を受け入れるのではなく、有意でない結果は「あなたはヌルを拒否できない」ことを意味すると言うのでしょうか?
2サンプルt検定のような従来の統計的検定は、2つの独立したサンプルの関数に差がないという仮説を排除しようとすることに焦点を当てています。次に、信頼レベルを選択し、平均の差が95%レベルを超えている場合、帰無仮説を棄却できると言います。そうでない場合、「帰無仮説を拒否することはできません」。これは、私たちもそれを受け入れることができないことを暗示しているようです。帰無仮説が正しいかどうかわからないということですか? 次に、2つのサンプルの関数が同じであるという仮説を立てるテストを設計します(これは、2つのサンプルが異なるという仮説である従来の統計検定の反対です)。したがって、私の帰無仮説は、2つのサンプルが異なるというものになります。このようなテストをどのように設計する必要がありますか?p値が5%未満の場合、有意差がないという仮説を受け入れることができると言うのと同じくらい簡単でしょうか?

2
ベルヌーイサンプリングの信頼区間
ベルヌーイ確率変数ランダムサンプルがありますで、はiidrvで、で、は不明なパラメーターです。X i P (X i = 1 )= p pX1...XNX1...XNX_1 ... X_NXiXiX_iP(Xi=1)=pP(Xi=1)=pP(X_i = 1) = pppp 明らかに、一つの推定値を見つけることができ:。P:= (X 1 + ⋯ + X N)/ Npppp^:=(X1+⋯+XN)/Np^:=(X1+⋯+XN)/N\hat{p}:=(X_1+\dots+X_N)/N 私の質問は、信頼区間をどのように構築できますか?ppp

5
中央値の信頼区間
中央値およびその他のパーセンタイルで95%CIを見つける必要があります。私はこれにアプローチする方法がわかりません。私は主にRをプログラミングツールとして使用しています。

3
ブートストラップされたリサンプルから取得した信頼区間の意味は何ですか?
私はこのサイトでブートストラップと信頼区間に関する多くの質問を見てきましたが、私はまだ混乱しています。混乱の原因の1つは、多くの答えを理解できるほど統計知識が十分に進歩していないことでしょう。私は入門的な統計コースのほぼ半分で、数学のレベルは中世代数II程度であるため、そのレベルを超えると混乱を招きます。このサイトの知識のある人が私のレベルでこの問題を説明できれば、非常に役立ちます。 クラスでは、ブートストラップメソッドを使用してリサンプルを取得し、それらを使用して、測定する統計の信頼区間を構築する方法を学習していました。したがって、たとえば、大規模な母集団からサンプルを取得し、40%が候補者Aに投票すると答えたとします。このサンプルは元の母集団をかなり正確に反映していると仮定します。人口について何かを発見するために。したがって、リサンプルを取得し、(95%の信頼レベルを使用して)結果の信頼区間が35%から45%の範囲であることを見つけます。 私の質問は、この信頼区間は実際にはどういう意味ですか? (Frequentist)Confidence Intervalsと(Bayesian)Credible Intervalsには違いがあることを読み続けます。正しく理解すれば、信頼できる間隔は、私たちの状況では真のパラメーターが指定された間隔(35%-45%)内にある95%の可能性があると言い、信頼区間はこれに 95%あると言います状況のタイプ(ただし、必ずしも特定の状況である必要はありません)使用しているメソッドは、真のパラメーターが指定された間隔内にあることを正確に報告します。 この定義が正しいと仮定すると、私の質問は次のとおりです。ブートストラップメソッドを使用して構築された信頼区間を使用する場合に話している「真のパラメーター」とは何ですか。(a)元の母集団の真のパラメーター、または(b)サンプルの真のパラメーターを参照していますか?(a)の場合、95%の確率で、ブートストラップメソッドは元の母集団に関する真のステートメントを正確に報告します。しかし、どうしてそれを知ることができるのでしょうか?ブートストラップ方法全体が仮定に基づいていないか元のサンプルは、それが取られた母集団の正確な反映であると?(b)の場合、信頼区間の意味がまったくわかりません。サンプルの真のパラメーターは既にわかっていませんか?それは簡単な測定です! 私はこれを先生と話しましたが、彼女はとても役に立ちました。しかし、私はまだ混乱しています。

6
信頼できる地域とベイジアン仮説検定の関係は何ですか?
頻繁な統計では、信頼区間とテストの間には密接な関係があります。約推論使用におけるN (μ 、σ 2)一例として分布を、1 - α信頼区間 ˉ X ± T α / 2(N - 1 )⋅ S / √μμ\muN (μ 、σ2)N(μ,σ2)\rm N(\mu,\sigma^2)1 - α1−α1-\alpha は、有意水準αでt検定によって拒否されないμのすべての値が含まれます。バツ¯± tα / 2(n−1)⋅s/n−−√x¯±tα/2(n−1)⋅s/n\bar{x}\pm t_{\alpha/2}(n-1)\cdot s/\sqrt{n}μμ\mutttαα\alpha この意味で、頻繁な信頼区間は逆のテストです。(ちなみに、私たちは解釈できることを、この手段の最小値として-値αパラメータのNULL値が含まれるであろうために1 - α。信頼区間は、私は、これは何を説明するのに便利な方法であることができることを見つけますp値は、実際には少しの統計を知っている人向けです。)pppαα\alpha1 - α1−α1-\alphappp ベイズの信頼できる領域の決定理論的基礎について読んで、私は信頼できる領域とベイズのテストの間に同様の接続/同等性があるかどうか疑問に思い始めました。 一般的な接続はありますか? 一般的な接続がない場合、接続がある例はありますか? 一般的な接続がない場合、どのようにこれを見ることができますか?

2
エフェクトパッケージを通じてlmerオブジェクトの信頼区間はどの程度信頼できますか?
Effectspackageは、packageを通じて取得した線形混合効果モデルの結果をプロットするための非常に高速で便利な方法を提供しlme4ます。このeffect関数は信頼区間(CI)を非常に迅速に計算しますが、これらの信頼区間はどの程度信頼できますか? 例えば: library(lme4) library(effects) library(ggplot) data(Pastes) fm1 <- lmer(strength ~ batch + (1 | cask), Pastes) effs <- as.data.frame(effect(c("batch"), fm1)) ggplot(effs, aes(x = batch, y = fit, ymin = lower, ymax = upper)) + geom_rect(xmax = Inf, xmin = -Inf, ymin = effs[effs$batch == "A", "lower"], ymax = effs[effs$batch == …


3
ロジスティック回帰の95%信頼区間を手動で計算することと、Rでconfint()関数を使用することに違いがあるのはなぜですか?
皆さん、私は説明できない奇妙なことに気づきました、できますか?要約すると、ロジスティック回帰モデルで信頼区間を計算する手動のアプローチとR関数confint()は異なる結果をもたらします。 Hosmer&LemeshowのApplied Logistic Regression(第2版)を行ってきました。第3章には、オッズ比と95%の信頼区間を計算する例があります。Rを使用すると、モデルを簡単に再現できます。 Call: glm(formula = dataset$CHD ~ as.factor(dataset$dich.age), family = "binomial") Deviance Residuals: Min 1Q Median 3Q Max -1.734 -0.847 -0.847 0.709 1.549 Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) -0.8408 0.2551 -3.296 0.00098 *** as.factor(dataset$dich.age)1 2.0935 0.5285 3.961 7.46e-05 *** --- Signif. codes: 0 ‘***’ 0.001 …
34 r  regression  logistic  confidence-interval  profile-likelihood  correlation  mcmc  error  mixture  measurement  data-augmentation  r  logistic  goodness-of-fit  r  time-series  exponential  descriptive-statistics  average  expected-value  data-visualization  anova  teaching  hypothesis-testing  multivariate-analysis  r  r  mixed-model  clustering  categorical-data  unsupervised-learning  r  logistic  anova  binomial  estimation  variance  expected-value  r  r  anova  mixed-model  multiple-comparisons  repeated-measures  project-management  r  poisson-distribution  control-chart  project-management  regression  residuals  r  distributions  data-visualization  r  unbiased-estimator  kurtosis  expected-value  regression  spss  meta-analysis  r  censoring  regression  classification  data-mining  mixture 

2
線形回帰の信頼帯の形状と計算の理解
OLS線形回帰に関連付けられた曲線の信頼帯の形の起源と、回帰パラメーター(勾配と切片)の信頼区間との関係を理解し​​ようとしています。たとえば(Rを使用): require(visreg) fit <- lm(Ozone ~ Solar.R,data=airquality) visreg(fit) バンドは、2.5%インターセプト、97.5%勾配、および97.5%インターセプト、2.5%勾配(完全ではありませんが)で計算された線の限界に関連しているようです。 xnew <- seq(0,400) int <- confint(fit) lines(xnew, (int[1,2]+int[2,1]*xnew)) lines(xnew, (int[1,1]+int[2,2]*xnew)) 私が理解していないのは2つのことです: 2.5%の勾配と2.5%の切片、および97.5%の勾配と97.5%の切片の組み合わせはどうですか?これらは、明らかにプロットされたバンドの外側にある線を与えます。信頼区間の意味が理解できないかもしれませんが、95%のケースで私の推定が信頼区間内にある場合、これらは可能な結果のように見えますか? 上限と下限の間の最小距離(つまり、2本の線が交差する点の近く)を決定するものは何ですか? これらのバンドが実際にどのように計算されるかわからないので、両方の疑問が生じると思います。 回帰パラメーターの信頼区間を使用して(predict()または同様の関数に手作業で依存せずに)上限と下限を計算するにはどうすればよいですか?Rのpredict.lm関数を解読しようとしましたが、コーディングは私を超えています。関連する文献や統計の初心者に適した説明へのポインタをいただければ幸いです。 ありがとう。


2
評価の信頼区間を見つける方法は?
Evan Millerの「平均評価でソートしない方法」では、信頼区間の下限を使用して、評価されたアイテムの実用的な集計「スコア」を取得することを提案しています。ただし、ベルヌーイモデルでは機能しています。評価は「いいね」または「いいね」です。 アイテムの評価の数が少ないと仮定して、離散スコアを星に割り当てる評価モデルに使用する合理的な信頼区間とは何ですか?k111kkk 私は、ウィルソンとアグレスチ-クール間隔の中心をどのように適応させるかを見ることができると思います p~=∑ni=1xi+z2α/2p0n+z2α/2p~=∑i=1nxi+zα/22p0n+zα/22\tilde{p} = \frac{\sum_{i=1}^n{x_i} + z_{\alpha/2}^2\; p_0}{n + z_{\alpha/2}^2} ここで、または(おそらくより良い)すべてのアイテムの平均評価です。ただし、間隔の幅を調整する方法がわかりません。私の(改訂された)最高の推測はp0=k+12p0=k+12p_0 = \frac{k+1}{2} p〜± zα / 2n〜∑ni = 1(x私−p〜)2+ zα / 2(p0−p〜)2n〜−−−−−−−−−−−−−−−−−−−−−−−−−√p〜±zα/2n〜∑私=1n(バツ私−p〜)2+zα/2(p0−p〜)2n〜\tilde{p} \pm \frac{z_{\alpha/2}}{\tilde{n}} \sqrt{\frac{\sum_{i=1}^n{(x_i - \tilde{p})^2} + z_{\alpha/2}(p_0-\tilde{p})^2}{\tilde{n}}} 、私は以上のようことを取る、Agresti-Coullのアナロジーとして手振ると正当化することができませんn〜= n + z2α / 2n〜=n+zα/22\tilde{n} = n + z_{\alpha/2}^2 見積もり(X¯)± zα / 2n〜見積もり(Var (X))−−−−−−−−−−−−−−−√見積もり(バツ¯)±zα/2n〜見積もり(ヴァール(バツ))\text{Estimate}(\bar{X}) \pm \frac{z_{\alpha/2}}{\tilde{n}} \sqrt{\text{Estimate}(\text{Var}(X))} 適用される標準的な信頼区間はありますか?(私はジャーナルの購読や大学図書館への簡単なアクセスを持っていないことに注意してください;必ず適切な参考文献を与えてください、しかし実際の結果を補足してください!)


1
結合信頼区間を計算するためのガウス相関不等式の結果
Quanta Magazineのこの非常に興味深い記事によると、「長い間求められていた証拠、発見され、ほとんど失われた」、- 多変量ガウス分布を持つベクトルが与えられたことが証明されました。そして間隔所与I 1、... 、Iはn個の対応する構成要素の手段を中心Xを、次いで、x=(x1,…,xn)x=(x1,…,xn)\mathbf{x}=(x_1,\dots,x_n)I1,…,InI1,…,InI_1,\dots,I_n xx\mathbf{x} p(x1∈I1,…,xn∈In)≥∏i=1np(xi∈Ii)p(x1∈I1,…,xn∈In)≥∏i=1np(xi∈Ii)p(x_1\in I_1, \dots, x_n\in I_n)\geq \prod_{i=1}^n p(x_i\in I_i) (ガウス相関不等式またはGCI。より一般的な定式化については、https: //arxiv.org/pdf/1512.08776.pdfを参照してください)。 これは本当に素晴らしく簡単に思えますが、記事は、それが共同信頼区間に結果をもたらすと述べています。しかし、それに関しては私にはまったく役に立たないようです。我々はパラメータ推定されていると仮定 、我々は推定した^ θ 1、... 、^ θ n個ある(多分漸近的に)共同ノーマル(例えば、MLE推定)。次に、各パラメーターの95%信頼区間を計算すると、GCIはハイパーキューブI 1 × … I nが(θ1,…,θnθ1,…,θn\theta_1,\dots,\theta_nθ1^,…,θn^θ1^,…,θn^\hat{\theta_1},\dots,\hat{\theta_n}I1×…InI1×…InI_1\times\dots I_n ...これは、適度な nでもかなり低いカバレッジです。(0.95)n(0.95)n(0.95)^n nnn したがって、共信頼領域を見つける賢い方法ではないようです。多変量ガウス、つまり超楕円体の通常の信頼領域は、共分散行列が既知で、よりシャープであるかどうかを見つけるのは難しくありません。共分散行列が不明な場合に信頼領域を見つけることが役立つかもしれませんか?GCIと共同信頼領域の計算との関連性の例を教えてください。

5
信頼区間は精度について何と言っていますか(もしあれば)?
Morey et al(2015)は、信頼区間は誤解を招くものであり、それらの理解に関連する複数のバイアスがあると主張しています。とりわけ、彼らは精度の誤precisionを次のように説明しています: 精度の誤り 信頼区間の幅は、パラメーターに関する知識の精度を示します。狭い信頼区間は正確な知識を示し、広い信頼誤差は不正確な知識を示します。 推定の精度と信頼区間のサイズの間に必要な関係はありません。これを確認する1つの方法は、2人の研究者(上級研究者と博士課程の学生)がデータを分析していることを想像することです505050実験から 50人の参加者のです。博士課程の学生の利益のための演習として、上級研究者は参加者をランダムに 2セットに分割し、252525それぞれがデータセットの半分を個別に分析できるようにすることを決定します。後続の会議で、2人は互いに平均のスチューデントのttt信頼区間を共有します。博士課程の学生の95%95%95\% CIは52±252±252 \pm 2であり、上級研究員の 95 % CIは95%95%95\%CIはです。53±453±453 \pm 4 上級研究員は、結果がほぼ一貫しており、それぞれの2つのポイント推定値の均等に重み付けされた平均値真の平均値の全体的な推定値として使用できることに注目しています。52.552.552.5 しかし、博士課程の学生は、2つの平均を均等に重み付けすべきではないと主張します。彼女は、CIの幅が半分であると指摘し、推定がより正確であるため、より重く重み付けする必要があると主張します。彼女のアドバイザーは、2つの平均の不均等な重み付けからの推定値は、完全なデータセットの分析からの推定値とは異なるため、でなければならないため、これは正しいとは言えないと指摘します。博士課程の学生の間違いは、CIがデータ後の精度を直接示すと仮定していることです。52.552.552.5 上記の例は誤解を招くようです。サンプルをランダムに半分に2つのサンプルに分割すると、サンプル平均と標準誤差の両方が近くなると予想されます。このような場合、加重平均の使用(たとえば、逆誤差による加重)と単純な算術平均の使用に違いはありません。ただし、推定値が異なり、サンプルの1つのエラーが著しく大きい場合、そのようなサンプルの「問題」を示唆している可能性があります。 明らかに、上記の例では、サンプルサイズが同じであるため、平均をとることでデータを「結合」することは、サンプル全体を平均することと同じです。問題は、サンプル全体が最初に部分に分割され、最終的な推定のために再び結合されるという不明確なロジックに従っているということです。 この例を言い換えると、まったく逆の結論に導くことができます。 研究者と学生は、データセットを2つに分割し、個別に分析することにしました。その後、彼らは彼らの推定値を比較し、サンプルは彼らが計算したものが非常に異なっていることを意味し、さらに学生の推定値の標準誤差ははるかに大きかったようでした。学生はこれが彼の推定の精度の問題を示唆することを恐れていましたが、研究者は信頼区間と精度の間に関連性がないことを暗示したので、両方の推定は等しく信頼でき、ランダムに選択されたそれらのいずれかを公開できます、最終的な見積もりとして。 より正式に述べると、スチューデントのような「標準」信頼区間はエラーに基づいていますttt x¯±c×SE(x)x¯±c×SE(x) \bar x \pm c \times \mathrm{SE}(x) どこ、いくつかの定数です。そのような場合、それらは精度に直接関係していますよね。ccc だから私の質問は次のとおり です。信頼区間は精度について何と言っていますか? Morey、R.、Hoekstra、R.、Rouder、J.、Lee、M.、&Wagenmakers、E.-J. (2015)。信頼区間に信頼を置くという誤り。Psychonomic Bulletin&Review、1–21。https://learnbayes.org/papers/confidenceIntervalsFallacy/

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.