タグ付けされた質問 「confidence-interval」

信頼区間は、信頼度で未知のパラメーターをカバーする区間です。信頼区間は、頻度主義の概念です。それらは、ベイジアンアナログである信頼できる間隔と混同されることがよくあります。 (1α)%

2
混合モデルのパラメトリック、セミパラメトリック、ノンパラメトリックブートストラップ
以下の移植片は、この記事から引用したものです。私はブートストラップの初心者であり、R bootパッケージを使用した線形混合モデルのパラメトリック、セミパラメトリック、ノンパラメトリックのブートストラップブートストラップを実装しようとしています。 Rコード これが私のRコードです: library(SASmixed) library(lme4) library(boot) fm1Cult <- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=Cultivation) fixef(fm1Cult) boot.fn <- function(data, indices){ data <- data[indices, ] mod <- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=data) fixef(mod) } set.seed(12345) Out <- boot(data=Cultivation, statistic=boot.fn, R=99) Out ご質問 …
9 r  mixed-model  bootstrap  central-limit-theorem  stable-distribution  time-series  hypothesis-testing  markov-process  r  correlation  categorical-data  association-measure  meta-analysis  r  anova  confidence-interval  lm  r  bayesian  multilevel-analysis  logit  regression  logistic  least-squares  eda  regression  notation  distributions  random-variable  expected-value  distributions  markov-process  hidden-markov-model  r  variance  group-differences  microarray  r  descriptive-statistics  machine-learning  references  r  regression  r  categorical-data  random-forest  data-transformation  data-visualization  interactive-visualization  binomial  beta-distribution  time-series  forecasting  logistic  arima  beta-regression  r  time-series  seasonality  large-data  unevenly-spaced-time-series  correlation  statistical-significance  normalization  population  group-differences  demography 

3
観察に基づく頻繁な推論と条件付け(Wagenmakersらの例)
私は統計の専門家ではありませんが、確率の「頻度」または「ベイジアン」の解釈が「正しい」ものであるかどうかについては意見の相違があります。Wagenmakersら。al p。183: 平均がで幅が一様分布を考えます。この分布から2つの値をランダムに描画し、最小値と最大値にラベルを付け、平均がと間にあるかどうかを確認します。この手順が何度も繰り返される場合、平均のは、ケースの半分でと間にあります。したがって、は、に対して50%の頻度信頼区間を与えます。しかし、特定のドローについて、およびと仮定します。1 S L μ S L μ S L (S 、L )μ S = 9.8 、L = 10.7 0.9 S L S &lt; μ &lt; Lμμ\mu111ssslllμμ\mussslllμμ\mussslll(s 、l )(s,l)(s, l)μμ\mus = 9.8s=9.8s = 9.8l = 10.7l=10.7l = 10.7。これらの値の差はで、これは分布の範囲の9/10をカバーしています。したがって、とこれらの特定の値については、頻度主義の信頼区間では50%だけの確信があるはずだと信じ込ませても、であると100%確信できます。0.90.90.9sssllls &lt; μ &lt; ls&lt;μ&lt;ls < \mu < l このケースでは50%の信頼しかないと信じている人はいますか、それともストローマンですか? より一般的には、この本は、「与えられたおよび 、 …

1
ブートストラップt法または単にブートストラップによって平均の信頼区間を推定しますか?
平均の信頼区間を推定するとき、ブートストラップt法とノンパラメトリックブートストラップ法の両方を適用できると思いますが、前者はもう少し計算が必要です。 通常のノンパラメトリックブートストラップに対するブートストラップtの長所と短所は何ですか?どうして? これを説明するための参考資料はありますか?

4
メタ分析でプールされた奇数比の信頼区間を計算する方法は?
ゲノムワイド関連研究からの2つのデータセットがあります。利用できる唯一の情報は、遺伝子型別の各SNPの奇数比と信頼区間(95%)です。これらの2つのオッズ比を比較するフォレストプロットを生成したいのですが、合計の信頼区間を計算して要約効果を視覚化する方法が見つかりません。プログラムPLINKを使用して固定効果を使用したメタ分析を実行しましたが、プログラムはこれらの信頼区間を表示しませんでした。 このような信頼区間を計算するにはどうすればよいですか? 利用可能なデータは次のとおりです。 各研究の奇数比、 95%信頼区間と 標準エラー。

4
2 X 3テーブルで複数の事後カイ2乗検定を実行する方法
私のデータセットは、沿岸、ミッドチャネル、オフショアの3つのサイトタイプでの生物の全死亡率または生存率で構成されています。下の表の数字は、サイトの数を表しています。 100% Mortality 100% Survival Inshore 30 31 Midchannel 10 20 Offshore 1 10 100%の死亡率が発生したサイトの数がサイトのタイプに基づいて重要かどうかを知りたいです。2 x 3カイ2乗を実行すると、重要な結果が得られます。実行できる事後的なペアワイズ比較はありますか、または実際にロジスティックANOVAまたは二項分布の回帰を使用する必要がありますか?ありがとう!

1
離散関数:信頼区間カバレッジ?
離散間隔カバレッジを計算する方法は? 私が行う方法を知っています: 連続モデルがある場合、予測値ごとに95%の信頼区間を定義し、実際の値が信頼区間内にある頻度を確認できます。私の95%の信頼区間が実際の値をカバーしていたのは、88%の時間だけであることがわかります。 私がどうすればいいかわからない: poissonやgamma-poissonなどの離散モデルでこれを行うにはどうすればよいですか?このモデルで私が持っているのは次のとおりです。単一の観測を行います(生成する予定の100,000以上のうち:)。 観察番号:(任意) 予測値:1.5 0の予測確率:.223 1の予測確率:.335 2の予測確率:.251 3の予測確率:.126 4の予測確率:.048 5の予測確率:.014 [および5以上は.019] ...(等) 100の予測確率(またはその他の非現実的な数値):.000 実際の値( "4"などの整数) 上記のポアソン値を指定しましたが、実際のモデルでは、予測値1.5は、観測ごとに0、1、... 100の異なる予測確率を持つ可能性があることに注意してください。 値の離散性に混乱しています。"5"は明らかに95%間隔の外にあります。これは、0.019が5以上で、0.025未満であるためです。しかし、4はたくさんあります-個別に4つありますが、4の数をより適切に共同で評価するにはどうすればよいですか? なぜ気にするのですか? 私が調べているモデルは、集計レベルでは正確であるが、個々の予測が不十分であると批判されています。貧弱な個々の予測が、モデルによって予測された本質的に広い信頼区間よりもはるかに悪いことを知りたいです。経験的なカバレッジが悪化することを期待しています(たとえば、値の88%が95%の信頼区間内にあることがわかるかもしれません)が、少しだけ悪くなることを願っています。

3
順列検定のパラメーターの信頼区間をどのように作成しますか?
順列検定は、元のデータからランダムに抽出された順列リサンプルに基づく有意性検定です。置換で描画されるブートストラップサンプルとは対照的に、置換リサンプルは置換なしで描画されます。ここで私はRで行った例、単純な並べ替え検定のは。(あなたのコメントは大歓迎です) 順列テストには大きな利点があります。正規性などの特定の母集団の形状は必要ありません。これらは、帰無仮説の下で単純な分布を持つ統計だけでなく、さまざまな統計に適用されます。母集団の形状とサイズに関係なく、非常に正確なp値を提供できます(十分な順列が使用されている場合)。 また、テストと共に信頼区間を与えることがしばしば役立つことも読んだ。これは、順列再サンプリングではなくブートストラップ再サンプリングを使用して作成される。 信頼区間がどのように構成されているか(つまり、上記の例の2つのサンプルの平均値の差について)説明できますか(または、Rコードを指定してください)? 編集 グーグルで調べた後、この興味深い読み物を見つけました。

4
イベントの総数の信頼区間を見つける方法
ある確率pでイベントを検出する検出器があります。検出器がイベントが発生したと言った場合、それは常に当てはまるので、誤検知はありません。しばらく実行した後、k個のイベントが検出されました。発生したイベントの総数が何であるか、検出されたか、その他の方法で計算したいと思います。ある程度の自信を持って、たとえば95%です。 たとえば、13個のイベントが検出されたとします。13から19までのイベントがあり、pに基づいて95%の信頼性があると計算できるようにしたいと思います。 これが私がこれまでに試したことです: 合計がnの場合、k個のイベントを検出する確率は次のとおりです。 binomial(n, k) * p^k * (1 - p)^(n - k) kから無限大までのnの合計は、次のとおりです。 1/p つまり、合計n個のイベントが存在する確率は次のとおりです。 f(n) = binomial(n, k) * p^(k + 1) * (1 - p)^(n - k) したがって、95%になりたい場合f(k) + f(k+1) + f(k+2) ... + f(k+m)は、少なくとも0.95である最初の部分合計を見つける必要があり[k, k+m]ます。答えはです。これは正しいアプローチですか?また、答えには閉じた式がありますか?

1
パーセンタイルと信頼区間の関係(平均)
この質問は、パーセンタイルと信頼区間の関係を誰かが私に尋ねたときに仕事で出てきました、そして私は私の考えを明確にするのに非常に苦労しました。コンテキストは、サンプル平均の95%信頼区間の推定に関する非常に単純な質問でした。 中心極限定理は、サンプルサイズが十分に大きければ、任意の独立した確率変数の平均の標本分布は正常またはほぼ正常になると述べていることを理解しています。したがって、標本平均は正規分布持ちます。ここで、は標本標準偏差です。sN(x¯、s / n−−√)N(x¯,s/n)N(\bar{x}, s/\sqrt{n})sss ここで、帰無仮説が真であるとしましょう。次に、帰無仮説の下では、標本平均の周りの95%信頼区間はμ ˉ X ± 1.96 * S / √H0:μバツ¯= μH0:μx¯=μH_0: \mu_{\bar{x}} = \muμバツ¯± 1.96 ∗ s / n−−√μx¯±1.96∗s/n\mu_{\bar{x}} \pm 1.96 * s/\sqrt{n} 私の同僚からの質問は、具体的には次のとおりでした。標準誤差は、平均の標本分布の単なる標準偏差です。したがって、は、サイズ多くのサンプルのサンプル平均を計算することによって作成された分布の97.5パーセンタイルに相当しますか? nμバツ¯+ 1.96 ∗ s / n−−√μx¯+1.96∗s/n\mu_{\bar{x}} + 1.96 * s/\sqrt{n}んnn パーセンタイルと信頼区間は2つの別々の概念であり、同僚の質問は2つの間の関係について尋ねていたので、質問は本当に奇妙でした。非常に混乱しましたが、私のポイントを明確にすることはできませんでした。 どんな助けでも大歓迎です!

3
仮説検定。サンプリング分布をH0に集中させるのはなぜですか?
p値は、帰無仮説()が真であると仮定した場合に、サンプルデータで観測された統計と少なくとも同じくらい極端な統計を取得する確率です。H0H0H_0 これは、仮定した場合に取得されるであろうサンプリング分布の下のサンプル統計によって定義された領域にグラフィカルに対応し。H0H0H_0 ただし、この想定される分布の形状は実際にはサンプルデータに基づいているため、を中心とする分布は私には奇妙な選択のように思えます。 代わりに統計の標本分布を使用する場合、つまり標本統計に分布を集中させる場合、仮説検定は標本が与えられた場合のの確率の推定に対応します。μ 0μ0μ0\mu_0μ0μ0\mu_0 その場合、p値は、上記の定義の代わりに、データが与えられたときにと少なくとも同じくらい極端な統計を取得する確率です。μ0μ0\mu_0 さらに、このような解釈には信頼区間の概念によく関連するという利点があります。 有意水準仮説検定は、がサンプリング分布の信頼区間内にあるかどうかを確認することと同等です。μ 0(1 - α )αα\alphaμ0μ0\mu_0(1−α)(1−α)(1-\alpha) したがって、分布をせることは、不必要に複雑になる可能性があると感じています。 私が考慮しなかったこのステップの重要な正当化はありますか?μ0μ0\mu_0

2
中央値の信頼区間
それぞれに少数の値(未満)のサンプルの分布があります。各サンプルの中央値を計算しました。モデルと比較して、モデルと各サンプルの中央値の差を求めます。一貫した結果を得るには、この違いについてエラーが必要です。101010 そのような場合に標準偏差を見つけることは、少なくとも私のようなプロではない人にとっては非常に困難になる可能性があります(たとえば、こちらを参照してください)。 公式リファレンスが引用されていなくても、中央値の信頼区間を計算する方法を説明するこのWebサイトを見つけました。 それは私には理にかなっているように見えますが、私は本当に判断することができないので、私は知りたいのです: それらの式は正しいですか? そのためのリファレンスはありますか? CIを検索したい場合はどうなりますか?95%95%95\% 前もって感謝します 編集:私はまた、非ガウスデータのブートストラップのこの例を見つけました。今、私はブートストラップについてはあまり知りませんが、その有効性についてのアドレスを持つことは良いことです。

1
ベイジアン95%予測区間の解釈
次の二変量回帰モデルを仮定 IIDであるのために。U 、I N (0 、σ 2 = 9 )I = 1 、... 、n個y私= βバツ私+ u私、yi=βxi+ui, y_i = \beta x_i + u_i, あなた私uiu_iN(0 、σ2= 9 )N(0,σ2=9)N(0, \sigma^2 = 9)i = 1 、… 、ni=1,…,ni = 1,\ldots, n noninformative前想定、のための事後PDFことを示すことができるである ここでβ P (β | Y)= (18 π )- 1p (β)∝ 定数p(β)∝constantp(\beta) \propto \text{constant}ββ\beta …

1
ガワーの類似性が変更された図心の信頼区間
いくつかの多変量サンプル(堆積物コアからのコミュニティデータ)間のGowerの類似性に基づいて、重心の95%信頼区間を取得したいと考えています。私はこれまでvegan{}、R内のパッケージを使用して、コア間の変更されたGowerの類似性を取得しました(Anderson 2006に基づくvegdist()。誰かが、修正されたガワー類似度に基づいて、たとえばサンプリングサイトの重心の95%信頼区間を計算する方法を知っていますか? さらに、可能であれば、重心を示すPCOでこれらの95%CIをプロットしたいので、それらが重なっているかどうかは明らかです。 変更されたガワーの類似性を取得するために、私は以下を使用しました: dat.mgower &lt;- vegdist(decostand(dat, "log"), "altGower") しかし、私が知る限り、から重心は得られませんvegdist()。重心を取得し、次に95%のCIを取得してからプロットする必要があります。 アンダーソン、MJ、KEエリンセン、B​​Hマッカードル。2006.ベータ多様性の尺度としての多変量分散。Ecology Letters 9:683–693。

5
ANCOVA in Rは異なるインターセプトを示唆していますが、95%のCIは重複しています…これはどのように可能ですか?
2つの共変量とカテゴリカルグループ化変数を含むデータセットがあり、異なるグループ化変数に関連付けられている共変量間で勾配または切片に有意差があるかどうかを知りたいと考えています。anova()とlm()を使用して、3つの異なるモデルの適合を比較しました:1)単一の勾配と切片、2)各グループの異なる切片、および3)勾配と各グループの切片。anova()の一般的な線形テストによると、2番目のモデルは3つのうち最も適切です。各グループに個別の切片を含めることにより、モデルに大幅な改善があります。ただし、これらのインターセプトの95%信頼区間を見ると、これらはすべて重複しており、インターセプト間に有意差がないことを示唆しています。これら2つの結果をどのように調整できますか?モデル選択法の結果を解釈する別の方法は、切片間に少なくとも1つの有意差がなければならないということであると考えましたが、おそらくこれは正しくありませんか? 以下は、この分析を再現するためのRコードです。dput()関数を使用しているので、取り組んでいるのとまったく同じデータを操作できます。 # Begin R Script # &gt; dput(data) structure(list(Head = c(1.92, 1.93, 1.79, 1.94, 1.91, 1.88, 1.91, 1.9, 1.97, 1.97, 1.95, 1.93, 1.95, 2, 1.87, 1.88, 1.97, 1.88, 1.89, 1.86, 1.86, 1.97, 2.02, 2.04, 1.9, 1.83, 1.95, 1.87, 1.93, 1.94, 1.91, 1.96, 1.89, 1.87, 1.95, 1.86, 2.03, 1.88, 1.98, …

1
パラメータまたは分布のブートストラップ信頼区間?
ブートストラップに関して明白な質問となる可能性のあるものをすみません。私はベイジアンの世界に早くから夢中になり、必要以上に実際にブートストラップを探索したことはありませんでした。 私は、著者が障害データまでの時間に関連する生存分析に興味を持っている分析に出くわしました。彼らは約100点を持ち、回帰を使用してワイブル分布をデータに適合させました。この結果、彼らはスケールと形状パラメータの推定値を取得しました。非常に伝統的なアプローチ。ただし、次に彼らは元のデータセットからサンプリングするためにブートストラップを使用し、新しいサンプルごとに回帰を実行し、新しいワイブル分布を考え出しました。次に、ブートストラップの結果を使用して、生存分布の信頼区間を作成しました。 私の直感は少し矛盾しています。パラメータの信頼区間のブートストラップについてはよく知っていますが、分布の信頼区間の構築に使用されているのを見たことはありません。 誰かが私にいくつかの洞察を提供するかもしれない参照/ソースに向けることができますか?前もって感謝します。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.