タグ付けされた質問 「bayesian」

ベイズ推定は、モデルパラメータを確率変数として扱い、ベイズの定理を適用して、観測されたデータセットを条件とするパラメータまたは仮説に関する主観的な確率ステートメントを推定することに依存する統計的推定の方法です。

0
Jaynesの分布
ジェーンズの著書「確率論:科学の論理」では、ジェーンズは「分布と継承のルール」というタイトルの章(Ch 18)を持ち、この章で分布の概念を紹介しています。ApApA_pApApA_p [...]これを見るには、新しい情報を取得する効果を想像してください。コインを5回投げると、毎回テールが現れます。次の投球での頭の確率は何ですか?私はまだ1/2と言います。ただし、火星に関するもう1つの事実を教えていただければ、[ 火星にかつて生命が存在したという ] 確率の割り当てを完全に変更する準備ができています。私の信念の状態をペニーの場合非常に安定させるが、火星の場合非常に不安定にする何かがあります これは、論理としての確率論に対する致命的な反対のように思えるかもしれません。おそらく、命題に、妥当性を表す1つの数字だけでなく、2つの数値を関連付ける必要があります。そして、ある種の二価理論が必要になるでしょう。[...] 彼は、よう な新しい命題を導入しApApA_pP(A|ApE)≡pP(A|ApE)≡pP(A|A_pE) ≡ p 「ここで、Eは、追加の証拠である、我々はレンダリングしなければならなかった場合。口頭声明として、それはこのようなものを出してくるでしょう: 関係なく、あなたが言われたかもしれない何か他のものの、Aの確率はPです。」ApApA_pApApA_p ≡≡≡ 私は、これらの基準を満たすベータ分布を使用するだけで、2つの数字のアイデア(「信頼性、および新しい証拠に直面した場合の安定性」)の違いを見ようとしています。 図18.2は(say)を使用するのと非常に似ていますが、火星ではBeta(1 / 2,1 / 2)であり、信念の状態は「非常に不安定」ですα=β=100α=β=100\alpha=\beta=100 オリジナル命題は、上記の、ベータ(かもしれない非常に大きいため)よう /(。そうすれば、との分布を変える証拠はありませんApApA_pα,βα,β\alpha,\betaα,βα,β\alpha,\betaαα\alphaα+β)=pα+β)=p\alpha+\beta)=ppppP(A|ApE)≡pP(A|ApE)≡pP(A|A_pE) ≡ p 本全体でベータ分布について説明しているので、ここでの区別が微妙であり、新しい理論(分布)を保証していることをますか?彼は次の段落で「「確率の確率」について話しているかのように見える」と述べています。ApApA_p

2
一般的な適合度テストに相当するベイジアンとは何ですか?
2つのデータセットがあります。1つは物理的観測(温度)のセットからのもので、もう1つは数値モデルのアンサンブルからのものです。モデルのアンサンブルが真の独立したサンプルを表すと仮定し、観測がその分布から引き出されているかどうかを確認するために、完全なモデル分析を行っています。計算した統計は正規化されており、理論的には標準正規分布でなければなりません。もちろん完璧ではないので、適合度をテストしたいと思います。 頻度論的推論を使用して、Cramér-vonMises統計(またはKolmogorov-Smirnovなど)、または同様のものを計算し、テーブルで値を検索してp値を取得し、値がどの程度低いかを判断するのに役立ちます観測値がモデルと同じである場合、参照してください。 このプロセスのベイジアン等価物は何でしょうか?つまり、これら2つの分布(計算された統計値と標準正規分布)が異なるという確信の強さを定量化するにはどうすればよいですか?

4
Ziliak(2011)は、p値の使用に反対し、いくつかの代替案に言及しています。彼らは何ですか?
「Matrixx v。SiracusanoおよびStudent v。Fisher 統計的有意性」(DOI:10.1111 / j.1740-9713.2011.00511.x)と呼ばれる、統計的推論のためにp値に依存するデメリットを議論する最近の記事では、 Stephen T. Ziliakは、p値の使用に反対しています。最後の段落で彼は言う: データは、私たちがすでに知っていることの1つであり、確かです。私たちが実際に知りたいのは、まったく異なるものです。データが与えられた場合、仮説が真である(または少なくとも実用的に有用である)確率です。入手可能な証拠があれば、2つの薬物が異なる確率、およびその程度を知りたいと思います。転置された条件の誤fall、フィッシャーが陥ったtrapに基づいた有意性テストは、その確率を教えてくれません。パワー関数、予想損失関数、およびスチューデントとジェフリーズから派生した多くの意思決定理論およびベイジアン手法は、現在広く利用可能でオンラインで無料です。 べき関数、予想損失関数、および「その他の決定理論およびベイズ法」とは何ですか?これらの方法は広く使用されていますか?Rで利用できますか?これらの新しい推奨方法はどのように実装されますか?たとえば、これらの方法を使用して、従来の2標本のt検定とp値を使用するデータセットで仮説をテストする方法を教えてください。

4
モデルの不確実性への対処
CrossValidatedコミュニティのベイジアンがモデルの不確実性の問題をどのように見ているのか、そしてどのようにそれを処理することを好むのかと思いまして。私は2つの部分で質問を投げかけます。 モデルの不確実性に対処することは(あなたの経験/意見において)どのくらい重要ですか?機械学習コミュニティでこの問題を扱った論文を見つけていないので、なぜだろうと思っています。 モデルの不確実性を処理するための一般的なアプローチは何ですか(参照を提供する場合のボーナスポイント)?ベイジアンモデルの平均化について聞いたことがありますが、このアプローチの具体的な手法や制限についてはよく知りません。他に何があり、なぜあなたは別のものよりも1を好むのですか?

1
経験的ベイズはどのように有効ですか?
だから私はちょうど素晴らしい本入門の経験的ベイズを読み終えました。この本は素晴らしいと思いましたが、データからの事前作成は間違っていると感じました。分析計画を立て、データを収集し、分析計画で以前に決定した仮説をテストするように訓練されました。すでに収集したデータを分析すると、選択後の推論が行われ、「重要」と呼ばれるものをより厳しくする必要があります。こちらを参照してください。機械学習には、テストとトレーニングセットを設定する前に予測子を選択することを意味する「チェリーピッキング」と呼ばれる類似したものがあると思います(統計学習の概要)。 私が以前に学んだことを考えると、経験的なベイズは弱い基盤に基づいているように思えます。データが受動的に生成された設定でのみ使用されますか?もしそうなら、これは正当かもしれませんが、厳密な実験計画を行うときにそれを使用するのは正しくないようですが、ブラッド・エフロンは一般に非常にNHST分野である生物統計学のために経験的ベイズを使用することを知っています。 私の質問は: 経験的ベイズはどのように有効ですか? どのような状況で使用されますか? どのような状況で経験的ベイズアプローチの使用を避ける必要がありますか?その理由は? 人々は生物統計学以外の分野でそれを使用していますか?もしそうなら、どのような状況でそれを使用していますか?

1
変分オートエンコーダーとは何ですか?また、どの学習タスクに使用されますか?
ごとに 、このと、この答えは、オートエンコーダは、次元削減のためのニューラルネットワークを使用する技術であるように見えます。さらに、変分オートエンコーダー(「従来の」オートエンコーダーとの主な違い/利点)、およびこれらのアルゴリズムが使用される主な学習タスクも知りたいと思います。

3
情報価値のない先行理論の歴史
私はベイズ統計学コース(経済学修士課程)で情報価値のない事前の短い理論エッセイを書いており、この理論の発展におけるステップを理解しようとしています。 これまでに、私のタイムラインは、ラプラスの無関心の原則(1812)、非不変の事前分布(ジェフリーズ(1946))、ベルナルドの参照事前(1979)の3つの主要なステップで構成されています。 私の文献レビューから、無関心の原理(ラプラス)は以前の情報の欠如を表すために使用される最初のツールであったが、ジェフリーズが彼の方法を導入した40代まで不変性の欠落した要件がその放棄につながったことを理解しました不変性の望ましい特性。70年代の不適切な事前の不注意な使用に起因する周辺化のパラドックスの発生により、ベルナルドはこの問題に対処するために彼の参照事前理論を練り上げました。 文献を読んで、すべての著者は異なる貢献を引用します:Jaynesの最大エントロピー、BoxおよびTiaoのデータ変換された尤度、Zellner、... あなたの意見では、私が欠けている重要なステップは何ですか? 編集:誰かが必要な場合は、(メイン)参照を追加します: 1)フォーマルルールによる事前選択、Kass、Wasserman 2)非情報的事前分布のカタログ、Yang、Berger 3)情報量の少ないベイジアンの事前解釈と構造とアプリケーションの問題

1
半コーシー分布の特性は何ですか?
現在、状態空間モデルのマルコフ連鎖モンテカルロ(MCMC)アルゴリズムを開発する必要がある問題に取り組んでいます。 この問題を解決するために、次の確率でが与えられました:p()= 2I( > 0)/(1+)。はの標準偏差です。τ τ τ 2 τ Xττ\tauττ\tauττ\tauτ2τ2\tau^2ττ\tauバツバツx だから今、私はそれが半分コーシー分布であることを知っています、なぜなら私は例を見てからそれを認識し、そして私がそう言われたからです。しかし、なぜそれが「半コーチ」分布であり、どの特性がそれに伴うのかを完全には理解していません。 プロパティの観点から、私は何が欲しいのかよくわかりません。私はこのタイプの計量経済学理論にかなり慣れていない。そのため、状態空間モデルのコンテキストでの分布と使用方法を理解することがより重要です。モデル自体は次のようになります。 ytバツt + 1at + 1p (σ2)p (τ)= xt+ et= xt+ at + 1〜N (0 、τ2)∝ 1 / σ2= 2 I(τ> 0 )π(1 + τ2)yt=バツt+etバツt+1=バツt+at+1at+1〜 N(0、τ2)p(σ2)∝1/σ2p(τ)=2私(τ>0)π(1+τ2)\begin{align} y_t &= x_t + e_t \\ x_{t+1} &= x_t + a_{t+1} \\[10pt] a_{t+1} …

1
MCMCサンプルからの限界尤度の計算
これは、定期的な質問(参照で、この記事、この記事とこの記事を)が、私は別のスピンを持っています。 一般的なMCMCサンプラーからのサンプルがたくさんあるとします。各サンプルについて、対数尤度および前の対数の値を知っています。役立つ場合は、データポイントごとの対数尤度の値も知っています(この情報は、WAICやPSIS-LOOなどの特定の方法で役立ちます)。θθ\thetalogf(x|θ)log⁡f(x|θ)\log f(\textbf{x} | \theta)logf(θ)log⁡f(θ)\log f(\theta)logf(xi|θ)log⁡f(xi|θ)\log f(x_i | \theta) 私が持っているサンプルと、場合によっては他のいくつかの関数評価を使用して(ただし、アドホック MCMC を再実行せずに)限界尤度の(粗)推定値を取得したい。 まず、テーブルをクリアしましょう。私たちは皆、高調波推定器が史上最悪の推定器であることを知っています。次へ移りましょう。事前形式と事後条件を閉じた形式でギブスサンプリングを行う場合は、Chibの方法を使用できます。しかし、これらのケース以外で一般化する方法がわかりません。サンプリング手順を変更する必要がある方法もあります(後回しなど)が、ここでは興味がありません。 私が考えているアプローチは、基礎となる分布をパラメトリック(またはノンパラメトリック)形状で近似し、正規化定数を1次元最適化問題(つまり、誤差を最小にする間及びのサンプルで評価)。最も単純な場合、後部がほぼ多変量正規であると仮定すると、を多変量正規として近似し、ラプラス近似に似たものを得ることができます(いくつかの追加の関数評価を使用して、モード)。ただし、として使用できますg(θ)g(θ)g(\theta)ZZZZZZZg(θ)Zg(θ)Z g(\theta)f(x|θ)f(θ)f(x|θ)f(θ)f(\textbf{x}|\theta) f(\theta)g(θ)g(θ)g(\theta)g(θ)g(θ)g(\theta)多変量分布の変分混合など、より柔軟なファミリ。ttt 私は、このメソッドは場合にのみ機能することを認めるへの合理的な近似である、それはに非常に賢明だろう理由のいずれかの理由や訓話しますか?お勧めの読書はありますか?Zg(θ)Zg(θ)Z g(\theta)f(x|θ)f(θ)f(x|θ)f(θ)f(\textbf{x}|\theta) f(\theta) 完全なノンパラメトリックアプローチでは、ガウスプロセス(GP)などのノンパラメトリックファミリを使用して、(またはそのような他の非線形変換など)を近似し平方根として)、およびベイジアン求積法で潜在的なターゲットを暗黙的に統合します(こちらとこちらをご覧ください)。これは興味深い代替アプローチのように見えますが、精神的には類似しています(また、私の場合、GPは扱いにくいことに注意してください)。logf(x|θ)+logf(θ)log⁡f(x|θ)+log⁡f(θ)\log f(\textbf{x}|\theta) + \log f(\theta)

1
Multinomial(1 / n、…、1 / n)は、離散化されたディリクレ(1、..、1)として特徴付けられますか?
そのため、この質問は少し厄介ですが、それを補うためにカラフルなグラフを含めます!最初に背景、次に質問。 バックグラウンド あなたが持っていると言う以上の等しいprobailitesと次元の多項分布カテゴリを。してみましょう正規化数(可能:つまり、その分布から)、N π = (π 1、... 、π N)Cnnnnnnπ= (π1、… 、πn)π=(π1,…,πn)\pi = (\pi_1, \ldots, \pi_n)ccc (c1、… 、cn)〜多項(1 / n 、… 、1 / n )π私= c私n(c1,…,cn)∼Multinomial(1/n,…,1/n)πi=cin(c_1, \ldots, c_n) \sim \text{Multinomial}(1/n, \ldots, 1/n) \\ \pi_i = {c_i \over n} 現在、を介した分布は -simplexをサポートしていますが、個別のステップがあります。たとえば、場合、この分布には次のサポートがあります(赤い点):N 、N = 3ππ\pinnnn = 3n=3n = 3 同様のサポートを備えた別の分布は、次元の分布、つまり単位シンプレックス上の均一な分布です。たとえば、次は3次元の 1、1、1)からのランダムな描画です。ディリクレ(1 、... 、1 …


3
ベイジアンは分布をどのように比較しますか?
ですから、私は、頻度論的確率と統計分析の基本を十分に理解していると思います(そして、それがどれほどひどく使用できるのか)。頻度論の世界では、「この分布はその分布とは異なる」というような質問をするのは理にかなっています。なぜなら、分布は現実的で客観的で不変(少なくとも特定の状況では)であると想定されているからです。 1つのサンプルが別のサンプルのような形状の分布から引き出される可能性を確認します。 ベイジアンの世界観では、過去の経験を考えると、私たちが見ることを期待するだけです(この部分についてはまだ少しあいまいですが、ベイジアン更新の概念は理解しています)。もしそうなら、ベイジアンは「このデータのセットはそのデータのセットとは異なる」とどのように言えますか? この質問の目的のために、私は統計的有意性、または同様の違いを気にかけません。パラメトリック分布とノンパラメトリック分布にも等しく興味があります。

2
John Snow Choleraの問題を解決するために使用できる統計モデルまたはアルゴリズムは何ですか?
John Snow Choleraのアウトブレイクのデータに基づいて、ある種の震源地の地理的近似を作成する方法を学ぶことに興味があります。井戸の位置を事前に知らなくても、このような問題を解決するためにどの統計モデリングを使用できますか。 一般的な問題として、時間、既知のポイントの位置、およびオブザーバーの歩行経路を利用できます。私が探している方法は、これら3つのことを使用して「発生」の震源地を推定します。

2
ベイジアンバッティング平均事前
私は、ベータ配布の直感に関する質問に対する優れた答えに触発された質問をしたかった。バッティングアベレージの事前分布の導出をより良く理解したかったのです。デビッドは平均値と範囲からパラメータをバックアウトしているようです。 平均であるという仮定の下では0.270.270.27と標準偏差は0.180.180.18あなたがバックアウトすることができ、αα\alphaおよびββ\betaこれら二つの方程式を解くことによって: αα+β=0.27α⋅β(α+β)2⋅(α+β+1)=0.182αα+β=0.27α⋅β(α+β)2⋅(α+β+1)=0.182\begin{equation} \frac{\alpha}{\alpha+\beta}=0.27 \\ \frac{\alpha\cdot\beta}{(\alpha+\beta)^2\cdot(\alpha+\beta+1)}=0.18^2 \end{equation}
23 bayesian  prior 

2
「統計」とはどういう意味ですか(統計の文脈で)。
Googleで "fisher" "fiducial" ...私は確かに多くのヒットを得ますが、私が従ったものはすべて私の理解を完全に超えています。 これらすべてのヒットには共通点が1つあるように見えます。それらはすべて、染められた統計学者、理論、実践、歴史、および統計の知識に徹底的に浸されている人々のために書かれています。(したがって、これらの説明のどれも、フィッシャーが「基準」によって意味することを、専門用語の海に頼ったり、いくつかの古典的または他の数学的統計文献に負けずに説明したり、説明することさえしません。) まあ、私は主題で見つけたもののために利益を得ることができる選択された聴衆に属していません、そしてこれはおそらくフィッシャーが「基準」によって意味するものを理解しようとする私の試みのすべてが壁に衝突した理由を説明しています不可解な意味不明な言葉。 プロの統計学者ではない人に、フィッシャーが「基準」とはどういう意味かを説明しようとする試みを知っている人はいますか? PSフィッシャーは、「基準」が意味するものを特定することになると、少し動いているターゲットであることがわかりますが、この用語は意味の「一定の核」を持たなければならないことを理解しています。する)分野内で一般的に理解されている用語として。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.