ベイジアン統計でパワー解析は必要ですか?


19

私は最近、ベイジアンの古典統計に関する見解を研究しています。ベイズ因子について読んだ後、この統計の観点で電力分析が必要かどうか疑問に思っていました。これを疑問に思う主な理由は、ベイズ因子が実際に尤度比であるように見えることです。25:1になったら、夜と呼べるように思えます。

私は遠いですか?さらに学ぶために私ができる他の読書はありますか?現在この本を読んでいます: WM BolstadによるBayesian Statisticsの紹介(Wiley-Interscience; 2nd ed。、2007)。



回答:


10

将来の研究では、パワーは約p <0.05(アルファ)の長期確率です。ベイズでは、研究Aの証拠が研究Bなどの優先順位に反映されます。したがって、頻繁な統計で定義されているパワーは実際には存在しません。


12
それほど制限されていない力の見方では、0-1損失関数のリスク曲線の表現と見なします。ベイジアン分析は、そのリスクを事前の確率に統合します。ただし、優れたベイジアン分析では、事前分布の選択に対する結果の感度が考慮されます。それは、電力分析の領域に私たちを取り戻すように思われるでしょう。その名前ではなく、異なる方法で計算される場合もありますが、目的は同じです。つまり、研究目的を確実に満たすために取得するサンプルの大き
whuber

2
これは非常に良い点です。ただし、これが電力計算の唯一の理由ではなく、多くのベイジアンは、Nを事前に決定する必要がない(間違い)ため、これは不要であると主張します。
ジョン

5
N

2
私はアイデアを思いつきませんでした。ベイズ人は、テストや追加手順が機能しない頻繁なテストとは対照的に、決定を下すのに十分な証拠を得るまで被験者を追加できると主張する論文がいくつかあります。私が思うに参考文献を調べることができました。最も顕著なのは、臨床試験でデータを分析する方法を提案することです。
ジョン

8
N

14

ベイズ統計を使用して仮説検定を実行できます。たとえば、事後密度の95%以上がゼロより大きい場合、効果はゼロより大きいと結論付けることができます。または、ベイズ因子に基づいた何らかの形式のバイナリ決定を採用することもできます。

このような意思決定システムを確立すると、特定のデータ生成プロセスとサンプルサイズを想定した統計的検出力を評価できます。シミュレーションを使用して、特定のコンテキストでこれを容易に評価できます。

そうは言っても、ベイジアンのアプローチは、多くの場合、ポイントの推定よりも信頼区間に重点を置いており、バイナリ決定ではなく信念の程度に焦点を当てています。推論に対するこのより継続的なアプローチを使用すると、代わりに、設計の推論に対する他の効果を評価できます。特に、特定のデータ生成プロセスとサンプルサイズの信頼区間の予想サイズを評価することができます。


3

この問題は、ベイジアン統計を使用して頻繁に質問するため、多くの誤解を招きます。たとえば、人々はバリアントBがバリアントAよりも優れているかどうかを判断したいと考えています。2つの事後分布(BA)の差の95%最高密度間隔が0またはaより大きいかどうかを判断することで、ベイジアン統計でこの質問に答えることができますただし、ベイジアン統計を使用して頻繁な質問に答える場合でも、頻繁なエラーを犯す可能性があります:タイプI(誤検知; opps-Bは実際には良くない)とタイプII(ミス;実現に失敗する)そのBは本当に優れている)。

消費電力分析のポイントは、タイプIIエラーを減らすことです(たとえば、効果が存在する場合、少なくとも80%の確率で効果を見つけることができます)。また、ベイジアン統計を使用して上記のような頻繁な質問をする場合は、電力分析も使用する必要があります。

消費電力分析を使用せず、収集中にデータを繰り返し覗き、有意な差が見つかった場合にのみ停止すると、予想よりも多くのタイプI(誤報)エラーが発生します。 -頻繁な統計を使用していた場合と同じです。

チェックアウト:

https://doingbayesiandataanalysis.blogspot.com/2013/11/optional-stopping-in-data-collection-p.html

http://varianceexplained.org/r/bayesian-ab-testing/

注意-ベイジアン手法の中には、タイプIエラー(たとえば、適切な情報事前確率)を行う確率を減らすことはできますが、なくすことはできません。


0

たとえば、臨床試験での検出力分析の必要性は、治療効果が存在する場合に(特定の最小サイズの)治療効果を見つける機会を得るために募集する参加者の数を計算/推定できるようにすることです。最初は時間の制約のため、2番目はコストの制約のため、無数の患者を募集することは不可能です。

それで、我々が前記臨床試験にベイジアンアプローチを取っていると想像してください。理論的にはフラットな事前確率は可能ですが、残念ながら、複数のフラット事前確率が利用できるため、事前確率に対する感度をお勧めします(実際、完全な不確実性を表現する方法は1つだけであるため、これは奇妙に思えます)。

したがって、さらに、感度分析を行うことを想像してください(モデルだけでなく、事前モデルもここで精査中です)。これには、「真実」のもっともらしいモデルからのシミュレーションが含まれます。古典的/周波数主義統計では、ここで「真実」の候補が4つあります。H0、mu = 0。H1、mu!= 0の場合、エラーが発生した場合(実世界の場合)またはエラーが発生しなかった場合(観測できない実世界の場合)ベイジアン統計では、ここで「真実」の候補が2つあります。muはランダム変数です(観測不可能な現実の世界のように)。muは、ランダム変数です(不確かな個人の観点から見ると、観測可能な現実の世界のように)。

ですから、A)トライアルで、B)感度分析で納得させようとしている人次第です。同じ人でない場合、それは非常に奇妙です。

実際に問題になっているのは、真実とは何か、具体的な証拠を実証するものについてのコンセンサスです。共有されている理由は、署名確率分布が実際の観測可能な世界で観測可能であり、何らかの方法で偶然にまたは偶然に偶然に発生する潜在的な数学的な真理を何らかの形で明らかにしていることです。これはアートのページではなく、科学のページであるか、それが私の理解であるため、そこで停止します。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.