タグ付けされた質問 「credible-interval」

信頼できる区間とは、ベイジアン統計の区間であり、確率でパラメーターの真の値を含みます。信頼できる間隔は、間隔を固定値として扱い、パラメーターをランダムとして扱います。 (1α)%


6
信頼できる地域とベイジアン仮説検定の関係は何ですか?
頻繁な統計では、信頼区間とテストの間には密接な関係があります。約推論使用におけるN (μ 、σ 2)一例として分布を、1 - α信頼区間 ˉ X ± T α / 2(N - 1 )⋅ S / √μμ\muN (μ 、σ2)N(μ,σ2)\rm N(\mu,\sigma^2)1 - α1−α1-\alpha は、有意水準αでt検定によって拒否されないμのすべての値が含まれます。バツ¯± tα / 2(n−1)⋅s/n−−√x¯±tα/2(n−1)⋅s/n\bar{x}\pm t_{\alpha/2}(n-1)\cdot s/\sqrt{n}μμ\mutttαα\alpha この意味で、頻繁な信頼区間は逆のテストです。(ちなみに、私たちは解釈できることを、この手段の最小値として-値αパラメータのNULL値が含まれるであろうために1 - α。信頼区間は、私は、これは何を説明するのに便利な方法であることができることを見つけますp値は、実際には少しの統計を知っている人向けです。)pppαα\alpha1 - α1−α1-\alphappp ベイズの信頼できる領域の決定理論的基礎について読んで、私は信頼できる領域とベイズのテストの間に同様の接続/同等性があるかどうか疑問に思い始めました。 一般的な接続はありますか? 一般的な接続がない場合、接続がある例はありますか? 一般的な接続がない場合、どのようにこれを見ることができますか?

6
信頼できる間隔にフラットな事前分布がある場合、95%の信頼区間は95%の信頼できる間隔に等しいですか?
私はベイジアン統計に非常に新しいので、これはばかげた質問かもしれません。それでも: 一様分布を指定する事前確率を使用した信頼できる間隔を検討します。たとえば、0から1で、0から1は効果の可能な値の全範囲を表します。この場合、95%の信頼区間は95%の信頼区間に等しいでしょうか?

2
最高密度領域(HDR)とは何ですか?
で統計的推論、問題9.6b、「最高密度領域(HDR)」が言及されています。しかし、私は本でこの用語の定義を見つけませんでした。 1つの類似した用語は、最高後方密度(HPD)です。しかし、9.6bは事前分布については何も言及していないため、このコンテキストには適合しません。提案された解決策では、「明らかにc (y)c(y)c(y)はHDRである」としか書かれていません。 または、HDRはpdfのモードを含む領域ですか? 最高密度領域(HDR)とは何ですか?

2
医療関係者の信頼できる間隔を要約する方法
スタンおよびフロントエンドパッケージを使用するrstanarmかbrms、以前のような混合モデルで行ったように、ベイジアン方式でデータを簡単に分析できますlme。Kruschke-Gelman-Wagenmakers-etcの本や記事のほとんどを私の机に置いていますが、これらは、ベイジアンの怒りのSkyllaとメディカルレビュアーのCharybdisの間で引き裂かれた、医療聴衆のために結果を要約する方法を教えてくれません( 「拡散的なものではなく、重要なものが必要です」)。 例:胃の頻度(1 /分)は3つのグループで測定されます。健康なコントロールが基準です。参加者ごとにいくつかの測定値がありますので、頻繁に使用する次の混合モデルを使用しましたlme。 summary(lme(freq_min~ group, random = ~1|study_id, data = mo)) わずかに編集された結果: Fixed effects: freq_min ~ group Value Std.Error DF t-value p-value (Intercept) 2.712 0.0804 70 33.7 0.0000 groupno_symptoms 0.353 0.1180 27 3.0 0.0058 groupwith_symptoms 0.195 0.1174 27 1.7 0.1086 簡単にするために、2 * stdエラーを95%CIとして使用します。 頻繁な文脈では、私はこれを次のように要約したでしょう。 対照群では、推定頻度は2.7 /分でした(ここにCIを追加することもできますが、絶対CIと差分CIによって生じる混乱のために、これを避けることがあります)。 no_symptomsグループでは、頻度は0.4 /分、CI(0.11〜0.59)/分、p = …

2
ベイズの信頼できる区間手順の決定理論的正当化とは何ですか?
(これを書いた理由を見るには、この質問に対する私の答えの下にあるコメントをチェックしてください。) タイプIIIエラーと統計的決定理論 間違った質問に正しい答えを与えることは、タイプIIIエラーと呼ばれることもあります。統計的決定理論は、不確実性の下での意思決定の形式化です。タイプIIIエラーの回避に役立つ概念的なフレームワークを提供します。フレームワークの重要な要素は損失関数と呼ばれます。これには2つの引数があります。1つ目は(関連するサブセットの)世界の真の状態です(たとえば、パラメーター推定問題では、真のパラメーター値θθ\theta)。2番目は、可能なアクションのセットの要素です(たとえば、パラメーター推定問題では、推定θ^)θ^)\hat{\theta})。出力は、世界のあらゆる可能な真の状態に関するあらゆる可能なアクションに関連する損失をモデル化します。たとえば、パラメータ推定問題では、いくつかのよく知られている損失関数は次のとおりです。 絶対誤差損失L(θ,θ^)=|θ−θ^|L(θ,θ^)=|θ−θ^|L(\theta, \hat{\theta}) = |\theta - \hat{\theta}| 二乗誤差損失L(θ,θ^)=(θ−θ^)2L(θ,θ^)=(θ−θ^)2L(\theta, \hat{\theta}) = (\theta - \hat{\theta})^2 Hal VarianのLINEX損失L(θ,θ^;k)=exp(k(θ−θ^))−k(θ−θ^)−1, k≠0L(θ,θ^;k)=exp⁡(k(θ−θ^))−k(θ−θ^)−1, k≠0L(\theta, \hat{\theta}; k) = \exp(k(\theta - \hat{\theta})) - k(\theta - \hat{\theta}) - 1,\text{ } k \ne0 答えを調べて質問を見つける 正しい損失関数の定式化に焦点を合わせ、決定論的アプローチの残りの部分を進めることで、タイプIIIのエラーを回避しようとする場合があります(ここでは詳しく説明しません)。簡単なことではありません。結局のところ、統計学者は、こうしたアプローチから派生していなくても、うまく機能する多くの手法と方法を十分に備えています。しかし、最終結果は、統計学者の大多数が統計的決定理論を知らず、気にしないということであり、見逃していると思います。それらの統計学者にとって、タイプIIIエラーを回避するという点で統計的決定理論が有益であると考える理由は、提案されたデータ分析手順を求めるフレームワークを提供するためだと主張します。プロシージャはどの損失関数(もしあれば)に最適に対処しますか?つまり、どのような意思決定状況において、正確に、それが最良の答えを提供しますか? 事後予想損失 ベイジアンの観点からは、損失関数だけが必要です。私たちはかなり決定理論の残りの部分をスキップすることができます-ほとんどの定義により、行うための最善のことは、損失を最小限事後期待している、あること、行動見つけるaaaその最小化L~(a)=∫ΘL(θ,a)p(θ|D)dθL~(a)=∫ΘL(θ,a)p(θ|D)dθ\tilde{L}(a) = \int_{\Theta}L(\theta, a)p(\theta|D)d\theta。 ?具体的には、ワルドの- (非ベイズ視点まあ用として、それはfrequentist決定理論の定理である完全なクラス定理こと- 最適なアクションが常にすることになりますベイズ事後予想損失を最小限に抑えるに関していくつか)(おそらく不適切この結果の難しさは、それが存在する定理が使用する前にどのガイダンスについても与えないことであるが、それは私たちがどの質問であるかを正確に把握するために「反転」できる手順のクラスを実に制限する特に、非ベイジアン手順を逆変換する最初のステップは、どのベイジアン手順を複製または近似するか(ある場合)を把握することです。) ねえ、シアン、これはQ&Aサイトだよね? 最後に統計的な質問に私をもたらします。ベイジアン統計では、単変量パラメーターの間隔推定値を提供する場合、2つの一般的な信頼できる間隔手順は、分位に基づく信頼できる間隔と最高事後密度の信頼できる間隔です。これらの手順の背後にある損失関数は何ですか?

2
「ランダムな」信頼性または信頼できる間隔を使用するのはなぜですか?
私は最近、自信と信頼できる間隔にランダム性を組み込んだ論文を読んでいたのですが、これが標準かどうか(そしてそうであれば、なぜそれが妥当なことなのか)疑問に思いました。表記法を設定するには、データがあり、パラメーター区間を作成することに関心があると仮定します。私は、関数を構築することによって構築される信頼/信頼区間に慣れています:θ ∈ ΘX ∈ Xバツ∈バツx \in Xθ ∈ Θθ∈Θ\theta \in \Theta fバツ:Θ → { 0 、1 }fバツ:Θ→{0、1}f_{x} : \Theta \rightarrow \{0,1\} 間隔をます。私= { θ ∈ Θ:fバツ(θ)= 1 }私={θ∈Θ:fバツ(θ)=1}I = \{ \theta \in \Theta \, : \, f_{x}(\theta) = 1\} これは、データに依存するという意味でランダムですが、データに条件があるのは単なる間隔です。このペーパーでは、代わりに gバツ:Θ → [ 0 、1 ]gバツ:Θ→[0、1]g_{x} : \Theta \rightarrow [0,1] …

3
いつ信頼区間が「意味をなす」が、対応する信頼区間はそうではないのか?
多くの場合、95%のカバレッジの信頼区間は、95%の事後密度を含む信頼区間と非常によく似ています。これは、前者が均一であるか、後者の場合にほぼ均一であるときに起こります。したがって、信頼区間を近似するために信頼区間を使用することがよくあります。重要なことは、これから、信頼区間としての信頼区間のひどく間違った誤解は、多くの単純なユースケースにとって実際的重要性がほとんどないか、まったくないということを結論付けることができます。 これが起こらない場合の例はたくさんありますが、それらはすべて、頻繁なアプローチに何か問題があることを証明しようとして、ベイジアン統計の支持者によって厳選されているようです。これらの例では、信頼区間に不可能な値などが含まれており、それらがナンセンスであることを示しています。 これらの例や、ベイジアン対フリークエンティストの哲学的議論に戻りたくありません。 私はちょうど反対の例を探しています。信頼区間と信頼区間が大幅に異なり、信頼手順によって提供される区間が明らかに優れている場合はありますか? 明確にするために:これは、信頼できる区間が通常、対応する信頼区間と一致すると予想される状況、つまり、フラット、均一などの事前分布を使用する状況についてです。誰かが勝手に悪い事前を選択する場合には興味がありません。 編集: 以下の@JaeHyeok Shinの回答に応じて、彼の例が正しい尤度を使用していることに同意しなければなりません。近似ベイズ計算を使用して、以下のRのシータの正しい事後分布を推定しました。 ### Methods ### # Packages require(HDInterval) # Define the likelihood like <- function(k = 1.2, theta = 0, n_print = 1e5){ x = NULL rule = FALSE while(!rule){ x = c(x, rnorm(1, theta, 1)) n = length(x) x_bar = mean(x) rule = …

1
95%の信頼できる間隔を見つける方法
次の事後分布の95%の信頼できる間隔を計算しようとしています。Rの関数を見つけることができませんでしたが、以下のアプローチは正しいですか? x <- seq(0.4,12,0.4) px <- c(0,0, 0, 0, 0, 0, 0.0002, 0.0037, 0.018, 0.06, 0.22 ,0.43, 0.64,0.7579, 0.7870, 0.72, 0.555, 0.37, 0.24, 0.11, 0.07, 0.02, 0.009, 0.005, 0.0001, 0,0.0002, 0, 0, 0) plot(x,px, type="l") mm <- sum(x*px)/sum(px) var <- (sum((x)^2*px)/sum(px)) - (mm^2) cat("95% credible interval: ", round(mm -1.96*sqrt(var),3), "-", …

1
予測間隔=信頼できる間隔?
予測間隔と信頼できる間隔が同じことを評価するかどうか疑問に思っています。 たとえば、線形回帰の場合、近似値の予測区間を推定するとき、値が下がると予想される区間の限界を推定します。信頼区間とは逆に、平均値などの分布パラメーターに焦点を合わせるのではなく、説明変数が特定のX値に対して取ることができる値に焦点を合わせます(と想定)。Y = +のB 。バツ(1 - α )%(1−α)%(1-\alpha)\% Y= a + b 。バツ Y=a+b。バツ\ Y = a + b.X ベイジアンフレームワーク内の特定の値の近似値を事後確率分布から推定する場合、信頼できる区間を推定できます。この間隔は、近似値について同じ情報を提供しますか?バツバツX

1
信頼区間と信頼区間が一致する場合の例
信頼できる間隔に関するウィキペディアの記事で、それは言う: 単一のパラメータと単一の十分な統計に要約できるデータの場合、未知のパラメータが位置パラメータである場合、信頼できる区間と信頼区間が一致することを示すことができます(つまり、前方確率関数はPr(x |μ)= f(x −μ))、事前分布は均一なフラット分布です; [5]また、未知のパラメーターがスケールパラメーターである場合(つまり、前方確率関数はPr(x | s)= f(x / s))、ジェフリーズの事前[5] —後者は、そのようなスケールパラメーターの対数を取ると、均一な分布を持つ位置パラメーターに変わるためです。しかし、これらは明らかに(特別ではありますが)特別なケースです。一般に、そのような同等性を作ることはできません。」 人々はこれの具体的な例を示すことができますか?95%CIが実際に「95%確率」に対応し、CIの一般的な定義に「違反」するのはいつですか?

1
信頼区間が正しいのに、なぜこの多項式回帰ではベイジアンの信頼できる区間が偏っているのですか?
以下のようにデータをシミュレーションした下のプロットを考えてみます。1になる真の確率が黒い線で示されているバイナリの結果を調べます。共変量xとp (y o b s = 1 | x )の間の関数関係は、ロジスティックリンクを持つ3次多項式です(したがって、双方向で非線形です)。yobsyobsy_{obs}xxxp(yobs=1|x)p(yobs=1|x)p(y_{obs}=1 | x) 緑の線はGLMロジスティック回帰近似で、は3次多項式として導入されています。破線の緑の線は、予測の周りの95%信頼区間であるP (Y O B S = 1 | X 、β)ここで、βフィット回帰係数。私はこれを使用しました。xxxp(yobs=1|x,β^)p(yobs=1|x,β^)p(y_{obs}=1 | x, \hat{\beta})β^β^\hat{\beta}R glmpredict.glm 同様に、プルプルラインは、均一な事前分布を使用したベイジアンロジスティック回帰モデルのについて95%信頼できる区間をもつ事後の平均です。私はこのために機能付きのパッケージを使用しました(設定により、事前に情報のない均一な情報が提供されます)。p(yobs=1|x,β)p(yobs=1|x,β)p(y_{obs}=1 | x, \beta)MCMCpackMCMClogitB0=0 赤い点は、のデータセット内の観測を示し、黒い点はy o b s = 0 の観測です。分類/離散分析では一般的ですが、pではなくy (y o b s = 1 | x )が観察されることに注意してください。yobs=1yobs=1y_{obs}=1yobs=0yobs=0y_{obs}=0yyyp(yobs=1|x)p(yobs=1|x)p(y_{obs}=1 | x) いくつかのことがわかります。 左側でがスパースであることを意図的にシミュレーションしました。情報(観察)が不足しているため、ここでは信頼と信頼できる間隔を広くしてほしい。xxx …

3
ベイジアンモデルの選択と信頼できる区間
3つの変数を含むデータセットがあり、すべての変数は量的変数です。それを、x 1、x 2と呼びましょう。私はMCMCを介してベイジアンの視点で回帰モデルをフィッティングしていますyyyx1x1x_1x2x2x_2rjags 私は探索的分析を行い、散布図は、2次項を使用する必要があることを示唆しています。それから私は2つのモデルを取り付けましたy×x2y×x2y\times x_2 (1)y=β0+β1∗x1+β2∗x2y=β0+β1∗x1+β2∗x2y=\beta_0+\beta_1*x_1+\beta_2*x_2 (2)y=β0+β1∗x1+β2∗x2+β3∗x1x2+β4∗x21+β5∗x22y=β0+β1∗x1+β2∗x2+β3∗x1x2+β4∗x12+β5∗x22y=\beta_0+\beta_1*x1+\beta_2*x_2+\beta_3*x_1x_2+\beta_4*x_1^2+\beta_5*x_2^2 モデル1では、各パラメーターの効果サイズは小さくなく、95%の信頼できる間隔には値が含まれていません。000 モデル2のパラメータの効果の大きさは、及びβ 4が小さいものであり、全てのパラメータの信頼区間のそれぞれに含まれる0。β3β3\beta_3β4β4\beta_4000 信頼できる間隔にが含まれているという事実は、パラメーターが重要ではないと言うのに十分ですか?000 次に、次のモデルを調整しました (3)y=β0+β1∗x1+β2∗x2+β3∗x22y=β0+β1∗x1+β2∗x2+β3∗x22y=\beta_0+\beta_1*x_1+\beta_2*x_2+\beta_3*x^2_2 β1β1\beta_1000 ベイジアン統計で変数選択を行う正しい方法はどれですか? log(σ)=−δδXlog(σ)=−δδXlog(\sigma)=-\pmb{\delta}Xδδδδ\pmb{\delta}δδδδ\pmb{\delta} βjβj\beta_jδjδj\delta_j ガウスモデルの推定値は次のとおりです。 Mean SD Naive SE Time-series SE B[1] -1.17767 0.07112 0.0007497 0.0007498 B[2] -0.15624 0.03916 0.0004128 0.0004249 B[3] 0.15600 0.05500 0.0005797 0.0005889 B[4] 0.07682 0.04720 0.0004975 0.0005209 delta[1] -3.42286 0.32934 0.0034715 0.0034712 delta[2] …

1
信頼区間ではなく信頼できる区間を報告する必要がありますか?
統計の教科書でその概念に出くわした後、私はそれについて頭を抱えてみましたが、最終的に、これまでに見たすべての説明に当てはまるように思える結論に至りました。間隔です。 私のような1時間前からの違いを知らない人のための余談 データを観察し、そこからいくつかのパラメーターを予測した場合、たとえば平均であるとすると、信頼できる区間は、であり、 95%muが確実に中に入る(または別のレベルを使用した場合は95%以外の数)。入門統計クラスで教えられる信頼区間は、信頼できる区間と重複する可能性がありますが、必ずしも十分に重複するとは限りません。説明を勇敢にしたい場合は、これとこの質問をCross Validatedで読んでみてください。多くの頭を悩ませた後、私が最終的に理解したのはこの答えでした。μμ\mu[ μ分、μ 最高][μmin, μmax][\mu_{\text{min}},\ \mu_{\text{max}}] 私の結果では信頼区間よりも信頼できる区間を使用することが科学的に望ましいという意味ですか?はいの場合、それを使用している出版物を見なかったのはなぜですか? それはコンセプトを使用する必要があるからなのですが、測定科学者はまだ正しい統計手法に追いついていませんか? あるいは、元の信頼区間の意味は、実証研究の結果を説明するのに適していますか? それとも実際には、それらはあまり重要ではないほど重複していることが多いのですか? 選択は、データについて想定している統計分布に依存しますか?多分ガウス分布で、それらは常に数値的に重複するので、純粋な統計の外の誰もが違いを気にしません(私が読んだ多くの研究は、どんな種類の間隔も計算しませんし、おそらく約1%は考えにスペースを与えますそれらのデータが正常に配布されない可能性があること)。 それは私たちの科学理論の立場に依存しますか?例えば、信頼区間は実証主義者の仕事で、信頼できる区間は解釈主義者の仕事で使用されるべきだと感じますが、この感覚が正しいかどうかはわかりません。

1
ベイジアン95%予測区間の解釈
次の二変量回帰モデルを仮定 IIDであるのために。U 、I N (0 、σ 2 = 9 )I = 1 、... 、n個y私= βバツ私+ u私、yi=βxi+ui, y_i = \beta x_i + u_i, あなた私uiu_iN(0 、σ2= 9 )N(0,σ2=9)N(0, \sigma^2 = 9)i = 1 、… 、ni=1,…,ni = 1,\ldots, n noninformative前想定、のための事後PDFことを示すことができるである ここでβ P (β | Y)= (18 π )- 1p (β)∝ 定数p(β)∝constantp(\beta) \propto \text{constant}ββ\beta …

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.