タグ付けされた質問 「bayesian」

ベイズ推定は、モデルパラメータを確率変数として扱い、ベイズの定理を適用して、観測されたデータセットを条件とするパラメータまたは仮説に関する主観的な確率ステートメントを推定することに依存する統計的推定の方法です。

7
いくら支払う?実用的な問題
これは在宅での質問ではなく、当社が直面している本当の問題です。 ごく最近(2日前)、10000個の製品ラベルの製造をディーラーに注文しました。ディーラーは独立した人です。彼はラベルを外部から製造し、会社はディーラーに支払いをします。各ラベルの費用は会社にとって1ドルです。 昨日、ディーラーにはラベルが付属していましたが、ラベルはそれぞれ100ラベルのパケットにバンドルされていました。このように、合計100個のパケットがあり、各パケットには10​​0個のラベルが含まれていたため、合計10000個のラベルがありました。ディーラーに10000ドルの支払いを行う前に、数個のパケットをカウントして、各パケットに100個のラベルが正確に含まれるようにしました。ラベルを数えると、100ラベルに満たないパケットが見つかりました(97ラベルが見つかりました)。これが偶然ではなく意図的に行われたことを確認するために、さらに5つのパケットをカウントし、各パケット(最初のパケットを含む)で次の数のラベルを見つけました。 Packet Number Number of labels 1 97 2 98 3 96 4 100 5 95 6 97 すべてのパケットを数えることは不可能だったため、平均ベースで支払いを行うことにしました。したがって、6つのパケットのラベルの平均数は97.166であるため、合計支払い額は9716ドルでした。 統計学者がそのようなタイプの問題にどのように対処しなければならないかを知りたいだけです。 さらに、ラベル全体の実際の数を超えて支払われていないことを95%保証するために、いくら支払うべきかを知りたいと思います。 追加情報: P(100個を超えるラベルを含むパケット)= 0 P(90個未満のラベルを含むパケット)= 0 = {パケットの重みが小さいため、パケットのカウント中に90未満のラベルが簡単に検出されます} 編集: ディーラーはそのような不正行為を単に否定した。これらのディーラーは、会社が支払っている金額についてメーカーから受け取る特定のコミッションに基づいて機能していることがわかりました。メーカーに直接連絡したところ、メーカーでもディーラーの欠陥でもないことがわかりました。製造業者は、「シートのサイズが標準化されていないためラベルが短くなり、1枚のシートから何枚でも切り取ってパケットにまとめます」と述べています。 さらに、追加の情報で与えられた最初のアサーションが検証されます。これは、製造業者がシートのサイズのわずかな増加から、追加のラベルをカットできないこと、また、シートのサイズのわずかな縮小からはカットできないことを認めたためですまったく同じサイズの100個のラベル。

8
p値が有用な良い説得力のある例は何ですか?
タイトルの私の質問は自明ですが、コンテキストを与えたいと思います。 ASAは今週、「p値に関するコンテキスト、プロセス、目的」に関する声明を発表し、p値に関するさまざまな一般的な誤解の概要を示し、コンテキストと思考なしに使用しないように注意を促しています統計的な方法、本当に)。 ASAに応えて、Matloff教授は150年後、ASAはp-valuesにノーと言うブログ投稿を書きました。その後、ベンジャミニ教授(および私)は、「p値の誤りではない -最近のASAステートメントに関する考察」というタイトルの応答投稿を書きました。それに応えて、マトロフ教授はフォローアップの投稿で尋ねました: 私が見たいのは[...は] -p値が有用である、説得力のある良い例です。それは本当に一番下の行でなければなりません。 値の有用性に対する彼の 2つの主要な議論を引用するには:ppp サンプル数が多い場合、有意性検定は、帰無仮説からの重要ではないわずかな逸脱に飛びつきます。 現実世界では帰無仮説がほとんどないので、それらに対して有意性検定を実行するのはばかげて奇妙です。 私は、他の相互検証されたコミュニティのメンバーがこの質問/議論についてどう考えているか、そしてそれに対する良い反応を構成するものに非常に興味があります。

9
ベイジアンアプローチがよりシンプル、より実用的、またはより便利な状況のリスト
ベイジアンとフリークエンティストの間の統計には多くの議論がありました。私は一般的に、これらはむしろ不快なものだと思っています(しかし、私はそれが死んだと思いますが)。一方、私はこの問題について完全に実用的な見方をする複数の人々に会いました。頻繁な分析を行う方が便利な場合もあれば、ベイジアン分析を実行する方が簡単な場合もあります。この視点は実用的で新鮮だと思います。 そのような場合のリストを用意しておくと役立つと思います。統計分析が多すぎるため、そして頻繁に分析を行うのが通常より実用的であると仮定しているため(WinBUGSでt検定をコーディングすることは、R 、たとえば)、ベイジアンのアプローチが頻繁なアプローチよりも単純で、より実用的で、および/またはより便利な状況のリストがあるといいでしょう。 (私が興味のない2つの答えは、「常に」と「決して」ではありません。人々は強い意見を持っていることを理解していますが、ここで放映しないでください。ここでの私の目標は、仕事をするアナリストに役立つリソースを開発することであり、粉砕するxではありません。) 人々は複数のケースを提案することを歓迎しますが、それぞれの状況を個別に評価(投票/議論)できるように、個別の回答を使用して提案してください。回答が表示されるはずです:(1)どのような状況の性質があり、かつ(2)なぜベイジアンアプローチは、この場合には簡単です。いくつかのコード(たとえば、WinBUGSに)分析が行われるだろう、なぜベイジアンバージョンが理想的であるより実用的であるが、私はあまりにも面倒になります期待して方法を示します。簡単にできる場合は感謝しますが、その理由を含めてください。 最後に、あるアプローチが別のアプローチよりも「簡単」であるということの意味を定義していないことを認識しています。真実は、あるアプローチが他のアプローチよりも実用的であることの意味が完全にはわからないということです。私はさまざまな提案を受け入れています。あなたが議論する状況でベイジアン分析がより便利である理由を説明するときに、あなたの解釈を指定するだけです。

8
ベイジアン:尤度関数の奴隷?
Larry Wasserman教授は、彼の著書「統計のすべて」で、次の例を示しています(11.10、188ページ)。ような密度があり、は既知の(非負の積分可能な)関数であり、正規化定数は不明であるとします。ffff(x)=cg(x)f(x)=cg(x)f(x)=c\,g(x)c > 0gggc>0c>0c>0 計算できない場合に興味があります。たとえば、が非常に高次元のサンプル空間でのpdfである場合があります。c=1/∫g(x)dxc=1/∫g(x)dxc=1/\int g(x)\,dxfff が未知であってもからサンプリングできるシミュレーション手法があることはよく知られています。したがって、パズルは次のとおりです。このようなサンプルからをどのように推定できますか。fffcccccc 教授ワッサーマンは、次のベイズソリューションについて説明します聞かせてのためのいくつかの前にである。尤度は したがって、事後 はサンプル値依存しません。したがって、ベイジアンはサンプルに含まれる情報を使用してに関する推論を行うことはできません。ππ\picccπ (C | X )αのC nは π (Cは)xは1、... 、X nは CをLx(c)=∏i=1nf(xi)=∏i=1n(cg(xi))=cn∏i=1ng(xi)∝cn.Lx(c)=∏i=1nf(xi)=∏i=1n(cg(xi))=cn∏i=1ng(xi)∝cn. L_x(c) = \prod_{i=1}^n f(x_i) = \prod_{i=1}^n \left(c\,g(x_i)\right) = c^n \prod_{i=1}^n g(x_i) \propto c^n \, . π(c∣x)∝cnπ(c)π(c∣x)∝cnπ(c) \pi(c\mid x) \propto c^n \pi(c) x1,…,xnx1,…,xnx_1,\dots,x_nccc Wasserman教授は、「ベイジアンは尤度関数の奴隷です。尤度がおかしくなると、ベイジアン推論もそうなります」と指摘しています。 私の仲間のスタッカーに対する私の質問は、この特定の例に関して、ベイズの方法論で何が間違っていたのか(もしあれば)? PSワッサーマン教授が答えで親切に説明したように、この例はエドジョージによるものです。


6
頻度の高いベイジアンの議論はどこへ行ったのですか?
統計の世界は、フリークエンシーとベイジアンに分かれていました。最近では、誰もが両方を少しやっているようです。どうすればいいの?異なるアプローチが異なる問題に適している場合、統計の創設者はなぜこれを見なかったのですか?あるいは、頻度論者が議論に勝ち、真の主観的なベイジアンが決定理論に移行したのでしょうか?

2
ベイズ回帰:標準回帰と比較してどのように行われますか?
ベイジアン回帰についていくつか質問がありました。 として標準回帰をます。これをベイジアン回帰に変更したい場合、と両方の事前分布が必要ですか(またはこの方法では機能しませんか)?y=β0+β1x+εy=β0+β1x+εy = \beta_0 + \beta_1 x + \varepsilonβ0β0\beta_0β1β1\beta_1 標準回帰では、残差を最小化しておよび単一の値を取得しようとします。これはベイズ回帰でどのように行われますか?β0β0\beta_0β1β1\beta_1 私はここで本当に苦労しています: posterior=prior×likelihoodposterior=prior×likelihood \text{posterior} = \text{prior} \times \text{likelihood} 尤度は現在のデータセットから得られます(したがって、それは私の回帰パラメーターですが、単一の値としてではなく、尤度分布としてですよね?)。事前は、以前の研究から得られます(言いましょう)。だから私はこの方程式を得ました: y=β1x+εy=β1x+ε y = \beta_1 x + \varepsilon 私の可能性または後部であること(または、これは単に完全に間違っていますか)? β1β1\beta_1 標準回帰がベイズ回帰に​​どのように変換されるのか、単純に理解できません。

10
常連客は誰ですか?
我々はすでに求めてスレッドを持っていたBayesiansある人、もう1つは尋ねfrequentistsがBayesiansであれば、しかし直接尋ねるどのスレッドがなかったfrequentistsている人は?これは、@ whuber がこのスレッドへのコメントとして尋ねた質問であり、回答を求めています。それらは存在しますか?たぶん、彼らは主流の統計を批判するときに責めるためにスケープゴートを必要としたベイジアンによって作られたのでしょうか? すでに与えられた答えへのメタコメント:対照的に、ベイジアン統計は、ベイズの定理の使用(非ベイジアンも使用する)だけで定義されているわけではなく、確率の主観主義的解釈の使用についても定義されていません(素人とは呼ばないでしょう)「確率は50:50未満だと思います!」と言っています)-頻度の採用は、確率の採用された解釈に関してのみ定義できますか?また、統計確率を適用し≠≠\ne、そのfrequentismの定義は、単に確率の解釈に集中する必要がありますか?

5
異なる答えを与えるベイジアンおよび頻繁なアプローチの例
注:私は午前の意識哲学的ベイズとfrequentist統計との違い。 たとえば、「テーブル上のコインが頭である確率」は、すでに頭または尾を上陸させているため、頻繁な統計では意味がありません。確率については何もありません。そのため、この質問には、頻繁な表現では答えがありません。 しかし、そのような違いは、具体的に私が尋ねている種類の違いではありません。 むしろ、上で述べた例のような理論的/哲学的な違いを除いて、整形式の質問に対する彼らの予測が実際にどのように異なるかを知りたいと思います。 言い換えれば: 頻度の高い統計とベイジアン統計の両方で答えられる質問の例は何ですか?その答えは2つで異なりますか? (たとえば、それらの1つが特定の質問に対して「1/2」と答え、他の1つが「2/3」と答える場合があります。) そのような違いはありますか? もしそうなら、いくつかの例は何ですか? そうでない場合、特定の問題を解決するときにベイジアン統計と頻度統計のどちらを使用するかによって、実際に違いが生じるのはいつですか? なぜ一方が他方を支持して避けるのですか?



6
ベイジアン統計チュートリアル
ベイジアン統計で速度を上げようとしています。私は少し統計の背景(STAT 101)を持っていますが、あまり多くはありません-事前、事後、および可能性を理解できると思います:D。 まだベイジアンの教科書を読みたくありません。私はすぐに私を立ち上げるソース(ウェブサイトが望ましい)から読みたいです。このようなものですが、詳細があります。 何かアドバイス?

2
なぜベイジアンは残差を見ることができないのですか?
記事「ディスカッション:エコロジストはベイジアンになるべきか?」ブライアンデニスは、ベイジアン統計について驚くほどバランスの取れた前向きな見解を示しています。しかし、ある段落では、引用や正当化なしで、彼は言います: ご覧のとおり、ベイジアンは残差を見ることができません。モデルの下でどれだけ極端かによって結果を判断する可能性の原則に違反します。ベイジアンにとって、悪いモデルはなく、悪い信念だけです。 なぜベイジアンは残差を見ることを許されないのでしょうか?これに適切な引用は何でしょうか(つまり、彼は誰を引用していますか)? デニス、B。 ディスカッション:生態学者はベイジアンになるべきか? 生態アプリケーション、アメリカ生態学会、1996、6、1095年から1103年

2
共分散行列の逆数はデータについて何と言っていますか?(直感的に)
の性質に興味があります。「がデータについて何と言っているか」について、誰でも直観的に話せますか?Σ−1Σ−1\Sigma^{-1}Σ−1Σ−1\Sigma^{-1} 編集: 返信ありがとう いくつかの素晴らしいコースを受講した後、いくつかのポイントを追加したいと思います。 つまり、は方向沿った情報量です。xTΣ−1xxTΣ−1xx^T\Sigma^{-1}xxxx 双対性:のでそうである、正定である、我々は正則化最小二乗問題のためFenchelデュアルを導き出すことができるように、彼らはドット積規範ですので、より正確に、彼らはお互いのデュアル規範あり、二重問題の最大化を行います。条件に応じて、どちらかを選択できます。ΣΣ\SigmaΣ−1Σ−1\Sigma^{-1} ヒルベルト空間:と列(および行)は同じ空間にます。したがって、または表現の間に利点はありません(これらの行列のいずれかが悪条件の場合)Σ−1Σ−1\Sigma^{-1}ΣΣ\SigmaΣ−1Σ−1\Sigma^{-1}ΣΣ\Sigma ベイジアン統計:ノルムは、ベイジアン統計で重要な役割を果たします。それは我々が前に持っているどのくらいの情報決定すなわち、例えば、前の密度の共分散が似ているとき 我々は(前またはおそらくジェフリーズ)非有益持っていますΣ−1Σ−1\Sigma^{-1}∥Σ−1∥→0‖Σ−1‖→0\|\Sigma^{-1}\|\rightarrow 0 頻度統計: Cramér–Raoバウンドを使用して、フィッシャー情報と密接に関連しています。実際、フィッシャー情報マトリックス(対数尤度とそれ自体の勾配の外積)は、Cramér–Raoによってバインドされています。つまり、Σ−1⪯FΣ−1⪯F\Sigma^{-1}\preceq \mathcal{F}(wrt正半正円錐、iewrt濃度)楕円体)。したがって、Σ−1=FΣ−1=F\Sigma^{-1}=\mathcal{F}の場合、最尤推定量は効率的です。つまり、データに最大の情報が存在するため、頻度主義体制が最適です。簡単な言葉で言えば、いくつかの尤度関数(尤度の関数形式は、データを生成する推定モデル、別名生成モデルに純粋に依存することに注意)の場合、最尤法は効率的で一貫した推定量であり、ボスのようなルールです。(それをやりすぎて申し訳ありません)

3
対数変換された予測子および/または応答の解釈
従属変数のみ、従属変数と独立変数の両方、または独立変数のみが対数変換されるかどうかの解釈に違いがあるのか​​と思います。 の場合を考えます log(DV) = Intercept + B1*IV + Error IVはパーセントの増加として解釈できますが、 log(DV) = Intercept + B1*log(IV) + Error または私が持っているとき DV = Intercept + B1*log(IV) + Error ?
46 regression  data-transformation  interpretation  regression-coefficients  logarithm  r  dataset  stata  hypothesis-testing  contingency-tables  hypothesis-testing  statistical-significance  standard-deviation  unbiased-estimator  t-distribution  r  functional-data-analysis  maximum-likelihood  bootstrap  regression  change-point  regression  sas  hypothesis-testing  bayesian  randomness  predictive-models  nonparametric  terminology  parametric  correlation  effect-size  loess  mean  pdf  quantile-function  bioinformatics  regression  terminology  r-squared  pdf  maximum  multivariate-analysis  references  data-visualization  r  pca  r  mixed-model  lme4-nlme  distributions  probability  bayesian  prior  anova  chi-squared  binomial  generalized-linear-model  anova  repeated-measures  t-test  post-hoc  clustering  variance  probability  hypothesis-testing  references  binomial  profile-likelihood  self-study  excel  data-transformation  skewness  distributions  statistical-significance  econometrics  spatial  r  regression  anova  spss  linear-model 

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.