タグ付けされた質問 「confidence-interval」

信頼区間は、信頼度で未知のパラメーターをカバーする区間です。信頼区間は、頻度主義の概念です。それらは、ベイジアンアナログである信頼できる間隔と混同されることがよくあります。 (1α)%

5
信頼区間は役に立ちますか?
頻出統計では、95%信頼区間は、時間を生成する手順であり、無限の回数を繰り返すと、95%の時間で真のパラメーターが含まれます。なぜこれが便利なのですか? 信頼区間はしばしば誤解されます。これらは、パラメーターが含まれていることを95%確実にすることができる間隔ではありません(同様のベイズ信頼性間隔を使用している場合を除く)。信頼区間は、私にとって餌とスイッチのように感じます。 私が考えることができる1つの使用例は、パラメーターがその値であるという帰無仮説を棄却できなかった値の範囲を提供することです。p値はこの情報を提供しませんか?それほど誤解を招くことなく、 つまり、信頼区間が必要なのはなぜですか?正しく解釈すると、それらはどのように役立ちますか?

2
多項式回帰(MLR)の信頼区間の形状を理解する
多項式回帰の信頼区間の形状を把握するのが困難です。 これは人工的な例であり、です。左の図はUPV(スケーリングされていない予測分散)を示し、右のグラフは、信頼区間と、X = 1.5、X = 2、X = 3での(人工)測定ポイントを示しています。Y^= A + B ⋅ X+ C ⋅ X2Y^=a+b⋅X+c⋅X2\hat{Y}=a+b\cdot X+c\cdot X^2 基礎となるデータの詳細: データセットは3つのデータポイント(1.5; 1)、(2; 2.5)および(3; 2.5)で構成されています。 各ポイントは10回「測定」され、各測定値は属します。結果の30のポイントで多項式モデルを使用したMLRが実行されました。y± 0.5y±0.5y \pm 0.5 信頼区間は式 および (両方の式は、Myers、Montgomery、Anderson-Cook、「Response Surface Methodology」第4版、407および34ページから取得されます)、Y(X0)-TUPV= Va r [ y^(x0)]σ^2= x』0(X』バツ)− 1バツ0UPV=Var[y^(x0)]σ^2=x0′(X′X)−1x0 UPV=\frac{Var[\hat{y}(x_0)]}{\hat{\sigma}^2}=x_0'(X'X)^{-1}x_0 ≤μY| X0≤Y(X0)+Tα/2、DF(ERROR)√y^(x0)− tα / 2 、df(E R R O R )σ^2⋅ …

1
モードの信頼区間を計算していますか?
モード(一般的に)の信頼区間の計算に関するリファレンスを探しています。ブートストラップは自然な最初の選択のように思えるかもしれませんが、Romano(1988)によって説明されているように、標準のブートストラップはモードに対して失敗し、単純なソリューションを提供しません。このペーパー以降、何か変更はありましたか?モードの信頼区間を計算する最良の方法は何ですか?ブートストラップベースの最良のアプローチは何ですか?関連する参照を提供できますか? ロマーノ、JP(1988)。モードのブートストラップ。Institute of Statistical Mathematics、40(3)、565-586。

1
ノンパラメトリックブートストラップのp値と信頼区間
環境 これはこの質問にいくぶん似ていますが、完全に重複しているとは思いません。 ブートストラップ仮説検定の実行方法に関する指示を探すとき、通常、信頼区間には経験分布を使用しても問題はないが、p-値。例として、この質問に対する承認済みの回答をご覧ください。インターネットでの一般的な検索では、ほとんど同じような答えが見つかるようです。 経験分布に基づくp値を使用しない理由は、ほとんどの場合、変換不変性がないためです。 例 短い例を挙げましょう。コインがあり、片側テストを実行して、ヘッドの頻度が0.5より大きいかどうかを確認します 試行を実行し、頭を取得します。この検定の真のp値は、です。n = 20n=20n = 20k = 14k=14k = 14p = 0.058p=0.058p = 0.058 一方、20ヘッドのうち14ヘッドをブートストラップする場合、およびの二項分布から効果的にサンプリングします。0.2を差し引いてこの分布をシフトすると、得られた経験的分布に対して0.7の観測値をテストすると、かろうじて有意な結果が得られます。n = 20n=20n = 20p = 1420= 0.7p=1420=0.7p = \frac{14}{20}=0.7 この場合、差異は非常に小さくなりますが、テストした成功率が1に近づくと大きくなります。 質問 さて、私の質問の真のポイントに行きましょう。まったく同じ欠陥が信頼区間にも当てはまります。実際、信頼区間が指定された信頼水準持つ場合、帰無仮説のもとでパラメーターを含まない信頼区間は、有意水準で帰無仮説を棄却することと同等です。αα\alpha1 - α1−α1- \alpha 経験的分布に基づく信頼区間が広く受け入れられ、p値が受け入れられないのはなぜですか? より深い理由はありますか、それとも人々は信頼区間でそれほど保守的ではありませんか? この答えでピーター・ダルガードは私の議論に同意するように見える答えを出します。彼は言う: この推論の行については特に問題はなく、少なくともCIの計算ほど悪くはありません。 どこから来たのですか?その方法でp値を生成することは少し悪いことを意味しますが、要点については詳しく説明しません。 最終的な考え また、EfronとTibshiraniによるブートストラップの概要では、適切な帰無仮説分布の下で生成されない限り、p値ではなく、信頼区間に多くのスペースを費やしています。ただし、順列検定に関する章の信頼区間とp値。 リンクした最初の質問にも戻りましょう。Michael Chernickの答えには同意しますが、経験的ブートストラップ分布に基づく信頼区間とp値の両方は、いくつかのシナリオでは等しく信頼できないと彼は主張しています。間隔が適切であると多くの人が言う理由を説明していませんが、p値はそうではありません。

2
偏ったブートストラップ:観測された統計を中心にCIを中心にしても大丈夫ですか?
これはブートストラップに似ています:推定は信頼区間外です 母集団の遺伝子型の数を表すデータがいくつかあります。Shannonのインデックスを使用して遺伝的多様性を推定し、ブートストラップを使用して信頼区間も生成したいと考えています。ただし、ブートストラップによる推定は非常に偏りがちであり、信頼区間が私の観察した統計の範囲外にあることに気づきました。 以下に例を示します。 # Shannon's index H <- function(x){ x <- x/sum(x) x <- -x * log(x, exp(1)) return(sum(x, na.rm = TRUE)) } # The version for bootstrapping H.boot <- function(x, i){ H(tabulate(x[i])) } データ生成 set.seed(5000) X <- rmultinom(1, 100, prob = rep(1, 50))[, 1] 計算 H(X) ## [1] 3.67948 …

2
サンプルサイズが増加すると、信頼区間はどの設定で改善されませんか?
でブログの記事、私はその主張を発見しました 「私はWGコクランが最初の指摘(およそ1970年代)を信じて、観測設定の信頼区間では、サンプルサイズが小さいと、カバレッジがゼロに近く、十分に大きいサンプルでカバレッジが良くなると思います。」 ここで、サンプルサイズが大きくなるとCI幅が0に近づくと想定しますが、カバレッジが同時に悪化するという考えは私には納得できません。これは本当ですか、そしてどのような状況下ですか?それとも私はそれを誤解していますか? 私は、10000から1000000のサンプルサイズ(1サンプルのt検定、95%CI)のランダムな正規分布データを使用してシミュレーションを実行しました。サンプルサイズごとに1000回実行し、高いサンプルサイズではカバレッジは悪化しませんでした。 (代わりに、予想されるほぼ一定の約5%のエラー率が見つかりました)。

1
ggplotまたはellipseパッケージで95%CI楕円をプロットすると異なる結果が得られる
protoclust{protoclust}データの分類に使用される変数のペアごとにスキャッタープロットを作成し、クラスごとに色を付け、各クラスの95%信頼区間の楕円を重ねることで(で作成された)クラスタリングの結果を視覚化したいelipses-classesは、変数の各ペアの下で重複しています。 楕円の描画を2つの異なる方法で実装しましたが、結果の楕円が異なります!(最初の実装では楕円が大きくなります!)軸の中心と角度はどちらも似ているように見えるので、アプリオリはサイズが異なるだけです(多少のスケーリング?)。私はそれらの1つ(両方ではないことを願っています!)、または引数を使用して何か間違ったことをしているに違いないと思います。 誰かが私が間違っていることを教えてもらえますか? ここに2つの実装のコードがあります。どちらも、データ楕円をどのようにしてggplot2散布図に重ね合わせることができるかという答えに基づいています。 ### 1st implementation ### using ellipse{ellipse} library(ellipse) library(ggplot2) library(RColorBrewer) colorpal <- brewer.pal(10, "Paired") x <- data$x y <- data$y group <- data$group df <- data.frame(x=x, y=y, group=factor(group)) df_ell <- data.frame() for(g in levels(df$group)){df_ell <- rbind(df_ell, cbind(as.data.frame(with(df[df$group==g,], ellipse(cor(x, y),scale=c(sd(x),sd(y)),centre=c(mean(x),mean(y))))),group=g))} p1 <- ggplot(data=df, aes(x=x, y=y,colour=group)) + geom_point() + …


1
混合効果モデルの残差をブートストラップすると、なぜ保守的な信頼区間が得られないのですか?
私は通常、複数の個人がそれぞれ2つ以上の条件のそれぞれで複数回測定されるデータを扱います。私は最近、条件間の差異の証拠を評価するために混合効果モデリングを試しindividual、ランダム効果としてモデリングしています。そのようなモデリングからの予測に関する不確実性を視覚化するために、私はブートストラップを使用しており、ブートストラップの各反復で、個体と観測内の条件内の両方が置換でサンプリングされ、新しい混合効果モデルが予測から計算されます取得されます。これは、ガウス誤差を仮定するデータに対しては正常に機能しますが、データが2項式の場合、各反復で比較的計算集中型の2項式混合効果モデルを計算する必要があるため、ブートストラップに非常に長い時間がかかる可能性があります。 私が考えていたのは、元のモデルの残差を使用して、ブートストラップの生データの代わりにこれらの残差を使用できるため、ブートストラップの各反復でガウス混合効果モデルを計算できるというものでした。生データの二項モデルからの元の予測を残差からのブートストラップ予測に追加すると、元の予測の95%CIが生成されます。 ただし、私は最近、このアプローチの簡単な評価をコード化し、2つの条件の差をモデル化せず、95%信頼区間にゼロを含めることができなかった時間の割合を計算しました。上記の残差ベースのブートストラップ手順では、かなり強い反保守的な間隔(ゼロを除外するのは、時間の5%以上)。さらに、元のガウシアンであるデータに適用した場合と同様に、このアプローチの同様の評価をコード化し(以前と同じリンク)、同様に(極端ではないが)反保守的なCIを取得しました。これがなぜなのか、何か考えはありますか?

2
信頼区間で交互作用プロットを描画する方法は?
私の試み: 私は信頼区間を得ることができませんでした interaction.plot() 一方plotmeans()、「gplot」パッケージからは2つのグラフが表示されません。さらに、plotmeans()デフォルトでは軸が異なるため、2つのグラフを重ね合わせることができませんでした。 plotCI()パッケージ「gplot」からの使用と2つのグラフの重ね合わせに成功しましたが、それでも軸の一致は完全ではありませんでした。 信頼区間を使用して交互作用プロットを作成する方法に関するアドバイスはありますか?1つの関数、または重ね合わせ方法plotmeans()やplotCI()グラフに関するアドバイス。 コードサンプル br=structure(list(tangle = c(140L, 50L, 40L, 140L, 90L, 70L, 110L, 150L, 150L, 110L, 110L, 50L, 90L, 140L, 110L, 50L, 60L, 40L, 40L, 130L, 120L, 140L, 70L, 50L, 140L, 120L, 130L, 50L, 40L, 80L, 140L, 100L, 60L, 70L, 50L, 60L, 60L, 130L, 40L, 130L, 100L, …

1
基本的なブートストラップ信頼区間のカバレッジ確率
現在取り組んでいるコースについて次の質問があります。 モンテカルロ研究を実施して、標準の通常のブートストラップ信頼区間と基本的なブートストラップ信頼区間のカバレッジ確率を推定します。正規母集団からサンプリングし、サンプル平均の経験的カバレッジレートを確認します。 標準の通常のブートストラップCIのカバレッジ確率は簡単です。 n = 1000; alpha = c(0.025, 0.975); x = rnorm(n, 0, 1); mu = mean(x); sqrt.n = sqrt(n); LNorm = numeric(B); UNorm = numeric(B); for(j in 1:B) { smpl = x[sample(1:n, size = n, replace = TRUE)]; xbar = mean(smpl); s = sd(smpl); LNorm[j] = xbar + …

6
20,000のトスからの10,000の頭が無効なデータを示唆する理由に関する統計的議論
公正なコインを繰り返し投げているとしましょう。表と裏の数はほぼ同じであることがわかっています。合計20回のトスで10の表と10の表のような結果が表示された場合、その結果を信じており、コインは公正であると考えています。 まあ、合計20000回のトスで頭が10000、尾が10000のような結果が表示された場合、実際には結果の妥当性に疑問を呈します(実験者がデータを偽造したのでしょうか)。 10093頭と9907尾。 私の直感の背後にある統計的議論は何ですか?

4
アルファとベータが大きいベータ分布の値を(数値的に)概算するにはどうすればよいですか?
大きな整数のアルファ、ベータ(たとえば、アルファ、ベータ> 1000000)のベータ分布の値を計算するための数値的に安定した方法はありますか? 実際、モードの周りに99%の信頼区間が必要なだけです。 追加:申し訳ありません。私の質問は、思ったほど明確に記述されていませんでした。私がやりたいのはこれです。コンベヤーベルト上の製品を検査する機械があります。これらの製品の一部は機械によって拒否されます。ここで、機械オペレーターが検査設定を変更した場合、彼/彼女の推定不合格率と、現在の推定値の信頼性についてのヒントを表示します。 したがって、実際の拒否率を確率変数Xとして扱い、拒否されたオブジェクトNと受け入れられたオブジェクトMの数に基づいてその確率変数の確率分布を計算すると思いました。Xの一様分布を仮定すると、これはNとMに依存するベータ分布。この分布をユーザーに直接表示するか、間隔[l、r]を見つけて、実際の棄却率がp> = 0.99でこの間隔に収まるように(shabbychefの用語を使用)、これを表示できます。間隔。M、Nが小さい場合(パラメーターの変更直後)、分布を直接計算し、間隔[l、r]を概算できます。ただし、M、Nが大きい場合、x ^ N *(1-x)^ Mは小さすぎて倍精度の浮動小数点数として表されるため、この単純なアプローチではアンダーフローエラーが発生します。 私の最善の策は、小さなM、Nに単純なベータ分布を使用し、M、Nがしきい値を超えるとすぐに同じ平均と分散の正規分布に切り替えることです。それは理にかなっていますか?

1
片側信頼区間は95%のカバレッジを持つことができますか
アルファレベルがの片側(片側)仮説が与えられたとしたら.05、95%の 信頼区間について話し合えるのでしょうか。 たとえば、片側Zまたはt検定に対して「片側」および「両側」の信頼区間を別々に構築できますか?片側検定が与えられた場合、これらの各信頼区間の「解釈」は何でしょうか? これについて少し混乱していますか?

1
逆変換された信頼区間
この議論に出くわしたので、私は逆変換された信頼区間の規則に関する質問を提起しています。 この記事によると、対数正規確率変数の平均の名目カバレッジ逆変換CIは次のとおりです。 UCL(X)=exp(Y+var(Y)2+zvar(Y)n+var(Y)22(n−1)−−−−−−−−−−−−√) UCL(X)=exp⁡(Y+var(Y)2+zvar(Y)n+var(Y)22(n−1))\ UCL(X)= \exp\left(Y+\frac{\text{var}(Y)}{2}+z\sqrt{\frac{\text{var}(Y)}{n}+\frac{\text{var}(Y)^2}{2(n-1)}}\right) LCL(X)=exp(Y+var(Y)2−zvar(Y)n+var(Y)22(n−1)−−−−−−−−−−−−√) LCL(X)=exp⁡(Y+var(Y)2−zvar(Y)n+var(Y)22(n−1))\ LCL(X)= \exp\left(Y+\frac{\text{var}(Y)}{2}-z\sqrt{\frac{\text{var}(Y)}{n}+\frac{\text{var}(Y)^2}{2(n-1)}}\right) /素朴ではない /exp((Y)+zvar(Y)−−−−−−√)exp⁡((Y)+zvar(Y))\exp((Y)+z\sqrt{\text{var}(Y)}) さて、次の変換のためのそのようなCIは何ですか? x−−√x\sqrt{x}およびx1/3x1/3x^{1/3} arcsin(x−−√)arcsin(x)\text{arcsin}(\sqrt{x}) log(x1−x)log⁡(x1−x)\log(\frac{x}{1-x}) 1/x1/x1/x 確率変数自体の許容範囲はどうですか(つまり、母集団からランダムに抽出された単一のサンプル値を意味します)?逆変換された間隔で同じ問題はありますか、それとも名目カバレッジがありますか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.