タグ付けされた質問 「bayesian」

ベイズ推定は、モデルパラメータを確率変数として扱い、ベイズの定理を適用して、観測されたデータセットを条件とするパラメータまたは仮説に関する主観的な確率ステートメントを推定することに依存する統計的推定の方法です。





3
ベイズの事前分布と事後分布の理解を助けてください
学生のグループでは、18人のうち2人が左利きです。情報価値のない事前分布を仮定して、人口の左利きの学生の事後分布を見つけます。結果を要約します。文献によると、5-20%の人が左利きです。事前にこの情報を考慮し、新しい事後を計算します。 私が知っているベータ分布は、ここで使用する必要があります。まず、αα\alphaとββ\beta値を1にして?事後の資料で見つけた方程式は π(r|Y)∝r(Y+−1)×(1−r)(N−Y+−1)π(r|Y)∝r(Y+−1)×(1−r)(N−Y+−1)\pi(r \vert Y ) \propto r^{(Y +−1)} \times (1 − r)^{(N−Y +−1)} \\ Y=2Y=2Y=2、N=18N=18N=18 なぜそのrrrは方程式にあるのですか?(rrrは左利きの人々の割合を示します)。不明ですが、この方程式にはどのように当てはまりますか?私には計算にばかげrrr与えられたYYY、その使用rrr与える式でrrr。さて、サンプルとr=2/18r=2/18r=2/18の結果であった0,00190,00190,0019。fff私がそれから推測する必要がありますか? 期待値を与える式RRR知られて与えられたYYYとNNN、より良い仕事をしてくれました0,150,150,15権利について鳴ります。方程式は、値はおよび割り当てられます。事前情報を考慮するために、とにどの値を指定する必要がありますか?E(r|X,N,α,β)=(α+X)/(α+β+N)E(r|X,N,α,β)=(α+X)/(α+β+N)E(r | X, N, α, β) = (α + X)/(α + β + N)111αααβββαααβββ いくつかのヒントをいただければ幸いです。事前分布と事後分布に関する一般的な講義も害になりません(私はそれらが何であるかを曖昧に理解していますが、曖昧です)高度な数学はおそらく私の頭の上を飛ぶでしょう。

13
XKCDのフリークエンティスト対ベイジアンコミックの何が問題になっていますか?
このxkcdコミック(フリークエンティスト対ベイジアン)は、明らかに間違った結果を導き出す頻度の高い統計学者をからかいます。 しかし、彼の推論は標準的な頻度主義の方法論に従うという意味で実際に正しいように思えます。 私の質問は、「彼は頻繁な方法論を正しく適用しているのですか?」です。 「いいえ」の場合:このシナリオで正しい頻度の推論は何ですか?太陽熱安定性に関する「事前知識」を頻繁な方法論に統合するには? はいの場合:wtf?;-)

8
ASAは
すでにp値としてタグ付けされた複数のスレッドがあり、それらについての多くの誤解が明らかになっています。10か月前、p値を「禁止」した心理学雑誌pppについてのスレッドがありましたが、現在は米国統計協会(2016)の分析では「値の計算で終わるべきではない」と言われています。ppp 米国統計協会(ASA)は、値の適切な使用と解釈の根底にあるいくつかの広く合意された原則を明確にする正式な声明から科学界が利益を得ることができると考えています。ppp 委員会は、値の可能な代替手段または補足として他のアプローチをリストします。ppp 値の一般的な誤用および誤解を考慮して 、一部の統計学者はp値を他のアプローチで補完するか、さらには置き換えることを好み ます。これらには、信頼性、信頼性、予測間隔など、テストよりも推定を重視する方法が含まれます。ベイジアン法; 尤度比やベイズ因子などの証拠の代替手段。意思決定理論モデリングや誤発見率などの他のアプローチ。これらの測定とアプローチはすべて、さらなる仮定に依存していますが、効果のサイズ(および関連する不確実性)または仮説が正しいかどうかにより直接対処する場合があります。pppppp それでは、値後の現実を想像してみましょう。ASAは、p値の代わりに使用できるいくつかのメソッドをリストしていますが、なぜより良いのですか?すべての人生でp値を使用した研究者にとって、実際の代替物となるのはどれですか?私が質問のこの種のことを想像するだろう後に表示されたpので、多分のは、一歩先にそれらのことを試してみましょう、-values現実。すぐに適用できる合理的な代替手段は何ですか?このアプローチが主任研究者、編集者、または読者を説得するのはなぜですか?pppppppppppp このフォローアップブログエントリが示唆しているように、値はそのシンプルさにおいて無敵です。ppp p値には、保持する帰無仮説の下での統計の振る舞いの統計モデルのみが必要です。「良い」統計(p値の構築に使用される)を選択するために対立仮説のモデルが使用される場合でも、この代替モデルは、p値が有効であり、有用です(つまり、実際の効果を検出するためのパワーを提供しながら、希望するレベルでタイプIエラーを制御します)。対照的に、尤度比、効果サイズ推定、信頼区間、ベイジアン法などの他の(驚くほど有用な)統計的手法はすべて、テストされたヌルの下だけでなく、より広い範囲の状況を保持するための仮定モデルを必要とします。 それとも、それとも真実ではないのでしょうか? 私は知っていますが、これは広範ですが、主な質問は簡単です:代替として使用できる値に代わる最良の(そしてなぜ)実際の代替物は何ですか?ppp ASA(2016)。統計的有意性と値に関するASAステートメント。PPP アメリカの統計学者。(印刷中)

12
ベイジアンとは?
統計に興味を持つようになると、「フリークエンティスト」と「ベイジアン」の二分法がすぐに一般的になります(とにかく、ネイトシルバーの「シグナルとノイズ」を読んでいない人はいますか?)。講演と入門コースでは、視点は圧倒的に頻繁(MLE、値)ですが、ベイズの公式を賞賛し、通常は接線で事前分布の概念に触れることに専念する時間はごくわずかである傾向があります。ppp ベイジアン統計を議論するために採用されたトーンは、その概念的基盤の尊重と、高尚な目標間の溝に関する懐疑主義のヒントと、事前分布の選択における意性、または結局は頻繁な数学の最終的な使用との間で振動します。 「もしあなたがハードコアベイジアンなら...」などの文はたくさんあります。 問題は、今日のベイジアンは誰ですか?彼らは、あなたがそこに行けば、あなたがベイジアンになることを知っているいくつかの学術機関ですか?もしそうなら、彼らは特別に求められていますか?尊敬されている統計学者や数学者だけに言及していますか? それらは、これらの純粋な「ベイジアン」としても存在しますか?彼らはラベルを喜んで受け入れますか?それはいつもお世辞の区別ですか?彼らは、会議で特異なスライドを持ち、値と信頼区間を奪われ、パンフレットで簡単に見つけられる数学者ですか?ppp どのくらいのニッチが「ベイジアン」であるか?私たちは少数の統計学者に言及していますか? または、現在のベイジアン主義は機械学習アプリケーションと同一視されていますか? ...またはもっと可能性が高いのは、ベイジアン統計は統計の枝ではなく、むしろ確率計算の範囲を超えて科学哲学へと向かう認識論的運動でしょうか?この点で、すべての科学者は本質的にベイジアンになります...しかし、頻繁なテクニック(または矛盾)に不浸透性の純粋なベイジアン統計学者のようなものはありません。


6
ベイズの信頼できる区間が明らかに頻度の高い信頼区間よりも低い例はありますか
信頼と信頼できる間隔の違いに関する最近の質問から、私はそのトピックに関するエドウィンジェーンズの記事を読み直すことになりました。 ジェインズ、ET、1976年。「信頼区間対ベイジアン区間」、確率理論、統計的推論、および科学の統計理論の基礎、WL HarperおよびCA Hooker(eds。)、D。Reidel、Dordrecht、p。175; (pdf) 要約では、Jaynesは次のように書いています。 ...信頼区間に関連する6つの一般的な統計問題(同じ推論に基づく有意性検定を含む)に対するベイジアンおよび正統解を示します。いずれの場合も、状況はまったく逆であることがわかります。つまり、ベイジアン法の方が適用が簡単で、同じまたはより良い結果が得られます。実際、オーソドックスな結果は、ベイジアンの結果と密接に(または正確に)一致する場合にのみ満足のいくものです。反対の例はまだ作成されていません。 (エンファシス鉱山) この論文は1976年に出版されたので、恐らく物事は進んでいるでしょう。私の質問は、頻繁な信頼区間がベイジアンの信頼区間より明らかに優れている例はありますか(Jaynesによって暗黙的に行われた挑戦による)。 誤った事前仮定に基づく例は、異なるアプローチの内部一貫性について何も述べていないため、受け入れられません。

3
例:バイナリ結果にglmnetを使用したLASSO回帰
私は興味のある結果が二分されglmnetているLASSO回帰の使用に手を出し始めています。以下に小さな模擬データフレームを作成しました。 age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67, 0.91, 0.29, 0.88) m_edu <- c(0, 1, 1, 2, 2, 3, 2, 0, 1) p_edu <- c(0, 2, 2, ...
77 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 

4
「情報価値のない事前」とは何ですか?本当に情報のないものはありますか?
この質問からのコメントに触発されました: 事前情報で「情報価値のない」と考えるものと、情報価値のない事前情報に含まれている情報は何ですか? 私は通常、ベイジアン分析からいくつかの素晴らしい部分を借りようとする頻繁なタイプの分析である分析で事前を参照します(「それが最もホットなこと」に至るまでのいくつかの簡単な解釈である)、指定された事前分布は均一0を中心とした効果測定の境界を横切って分布しかしアサートする前に形状を-ただ平坦であることを起こります。 使用する前に、より有益な情報がありますか?
73 bayesian  prior 

14
(もしあれば)頻繁なアプローチがベイジアンよりも実質的に優れているのはいつですか?
背景:私はベイジアン統計の正式なトレーニングは受けていませんが(詳細については非常に興味がありますが)、多くの人がフリークエンティスト統計よりも好ましいと感じる理由の要点を理解するのに十分なことを知っています。私が教えている導入統計(社会科学)クラスの大学生でさえ、ベイジアンのアプローチが魅力的であることがわかります。「なぜnullが与えられた場合、データの確率を計算することに関心があるのでしょうか? ??帰無仮説または代替仮説と私も読んだ糸のようなこれらのほかベイズ統計の経験的な利点を証明する、しかし、私はブラスコによって、この引用に出くわした(2001;強調を追加します)。: 動物の飼育者が帰納に関連する哲学的問題に興味がなく、問題を解決するためのツールに興味がある場合、ベイジアンと頻繁な推論の両方の学校が確立されており、どちらの学校が好まれるのかを正当化する必要はありません。一部の複雑なケースを除き、どちらにも運用上の問題はありません... どちらの学校を選択するかは、一方の学校に他の学校が提供していない解決策があるかどうか、問題がどれだけ簡単に解決できるかに関連する必要があります、そして科学者が表現結果の特定の方法でどれほど快適に感じるか。 質問:Blascoの引用は、Frequentistのアプローチが実際にベイジアンのアプローチよりも好ましい場合があることを示唆しているようです。それで、私は好奇心が強いです:ベイジアンのアプローチよりも頻繁なアプローチがいつ望ましいか?私は、概念的に(つまり、帰無仮説に基づいたデータの確率が特に有用かどうかを知っているのはいつか)、そして経験的に(つまり、どのような条件下で頻度論的手法が優れているか、ベイジアンか)の両方の問題に取り組む回答に興味があります また、回答ができるだけアクセスしやすいものになっている場合も望ましいでしょう-クラスに回答を返して生徒と共有するのは良いことです(ある程度の専門性が必要であることは理解していますが)。 最後に、Frequentist統計の通常のユーザーであるにもかかわらず、私は実際にBayesianが全面的に勝つ可能性にオープンです。

11
モデルが間違っているのに、なぜベイジアンである必要があるのですか?
編集:簡単な例を追加しました:平均の推論。また、信頼区間と一致しない信頼区間が悪い理由を少し明らかにしました。XiXiX_i かなり敬devなベイジアンの私は、ある種の信仰の危機の真っただ中にいます。 私の問題は次のとおりです。IIDデータを分析したいとします。私がやることは:XiXiX_i 最初に、条件付きモデルを提案します: p(X|θ)p(X|θ) p(X|\theta) 次に、上の前を選択し: P (θ )θθ\thetap(θ)p(θ) p(\theta) 最後に、ベイズの規則を適用し、事後を計算します:(または計算できない場合は近似)、についてのすべての質問に答えますθp(θ|X1…Xn)p(θ|X1…Xn)p(\theta | X_1 \dots X_n )θθ\theta これは賢明なアプローチです。データ真のモデルが条件付きの「内部」にある場合(値対応する場合)、統計的決定理論を呼び出して、メソッドが許容可能であると言うことができます(Robert詳細については「ベイジアン選択」、「統計のすべて」も関連する章で明確に説明しています)。θ 0をXiXiX_iθ0θ0\theta_0 しかし、誰もが知っているように、私のモデルが正しいと仮定することはかなり慢です。なぜ私が検討したモデルの箱の中に自然がきちんと収まるのでしょうか?これは、データの実際のモデルと仮定することははるかに現実的である異なりのすべての値に対して。これは通常、「誤って指定された」モデルと呼ばれます。p (X | θ )θptrue(X)ptrue(X)p_{true}(X)p(X|θ)p(X|θ)p(X|\theta)θθ\theta 私の問題は、このより現実的な誤って指定されたケースでは、単純に最尤推定量(MLE)を計算するのと比べて、ベイジアンであること(つまり、事後分布の計算)についての良い議論がないことです: θ^ML=argmaxθ[p(X1…Xn|θ)]θ^ML=arg⁡maxθ[p(X1…Xn|θ)] \hat \theta_{ML} = \arg \max_\theta [ p(X_1 \dots X_n |\theta) ] 実際、Kleijn、vd Vaart(2012)によると、誤って指定された場合、事後分布は次のとおりです。 として、を中心とするディラック分布に収束しθ M Ln→∞n→∞n\rightarrow \infty θ^MLθ^ML\hat \theta_{ML} 事後の信頼できる区間が信頼区間に一致することを保証するために、正しい分散がありません(2つの値が偶然同じでない限り)。(信頼区間は明らかにベイジアンが過度に気にしないものですが、これは定性的には、事後分布が本質的に間違っていることを意味します。これは、信頼区間が正しいカバレッジを持たないことを意味します)θθ\theta したがって、追加のプロパティがない場合、計算プレミアム(一般にベイジアン推論はMLEよりも高価です)を支払います。 したがって、最後に、私の質問:モデルが誤って指定されている場合に、より単純なMLEの代替案に対してベイジアン推論を使用するための理論的または経験的な議論はありますか? (私の質問はしばしば不明瞭であることを知っているので、あなたが何かを理解しないならば、私に知らせてください:私はそれを言い換えようとします) 編集:簡単な例を考えてみましょう:ガウスモデルの下での平均を推測します(さらに単純化するために既知の分散を使用)。ガウス事前分布を考えます。事前平均、事前の逆分散でます。してみましょうの経験的な平均こと。最後に注意してください:。 ...

10
ベイジアン対頻繁な議論の*数学的な*根拠はありますか?
ウィキペディアでは次のように述べています: [確率の]数学は、確率の解釈とはほとんど無関係です。 質問:私たちは数学的に正しいことをしたい場合はその後、我々は禁止すべきではない任意の確率の解釈を?すなわち、ベイジアンと頻度の両方が数学的に間違っていますか? 私は哲学が好きではありませんが、数学は好きです。コルモゴロフの公理の枠組みの中で独占的に働きたいです。これが私の目標である場合、ウィキペディアでベイジアン主義と頻度主義の両方を拒否すべきであると言っていることに従うべきでしょうか?概念が純粋に哲学的であり、数学的なものではない場合、最初に統計に表示されるのはなぜですか? 背景/コンテキスト: このブログ投稿ではまったく同じことを言っていませんが、テクニックを「ベイジアン」または「フリークエンシー」に分類しようとすることは、実際的な観点からは逆効果であると主張しています。 ウィキペディアからの引用が真である場合、哲学的観点から統計的方法を分類しようとすることも逆効果であるように思われます-方法が数学的に正しい場合、基礎となる数学の仮定の際に方法を使用することは有効ですそうでなければ、数学的に正しくない場合、または仮定が成り立たない場合、それを使用することは無効です。 一方、多くの人が確率論(つまりコルモゴロフの公理)で「ベイジアン推論」を特定しているように見えますが、その理由はよくわかりません。いくつかの例は、ジェームズ・ストーンの本「ベイズ・ルール」と同様に、「確率」と呼ばれるベイズ推論に関するジェインズの論文です。したがって、これらの主張を額面どおりに受けた場合、それはベイジアン主義を好むべきであることを意味します。 しかし、Casella and Bergerの本は、最尤推定量について説明しているが、最大事後推定量を無視しているため、頻繁に使用されているように見えますが、その中のすべてが数学的に正しいようにも見えます。 それでは、統計的に数学的に正しいバージョンのみが、ベイジアン主義と頻度主義に関して完全に不可知ではないことを拒否するということになるのではないでしょうか?両方の分類のメソッドが数学的に正しい場合、正確で明確に定義された数学よりも曖昧で不明確な哲学を優先するため、他のものよりもいくつかを好むのは不適切な実践ではありませんか? 要約:要するに、ベイジアン対頻繁な議論の数学的根拠が理解できず、議論の数学的根拠がない場合(これはウィキペディアが主張するものです)、なぜそれが容認されるのか分かりませんすべてが学術的な談話です。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.