タグ付けされた質問 「power」

仮説検定法の特性です。偽の場合の帰無仮説を棄却する確率、つまりタイプIIエラーを発生させない確率です。検定の検出力は、標本サイズ、効果サイズ、および検定の有意性()レベルに依存します。 α

2
サンプルサイズが等しくない:呼び出すタイミングが終了する
私は学術雑誌の記事を査読していますが、著者は推論統計を報告しないことの正当性として次のように書いています(2つのグループの性質を明確にしました)。 合計で、2,349人中25人(1.1%)がXを報告しました。グループXとグループY(他の2,324人の参加者)を統計的に比較する分析を提示することは適切に控えます。これらの結果は偶然によって大きく引き起こされる可能性があるためです。 私の質問は、この研究の著者は、グループの比較に関してタオルを投げ入れることを正当化するのか?そうでない場合、私は彼らに何をお勧めしますか?

1
反復測定ANOVAに必要なサンプルサイズの決定方法
繰り返し測定ANOVAについての助けが必要です。 一部の病棟における血流感染(BSI)率の低下に対する何らかの介入の効果を調査しています。BSIレート情報は、毎月、最初は介入なしで12か月、次に介入ありで12か月で取得する予定です。 時系列または反復測定ANOVAのいずれかを実行することを考えています。最初の分析ではあまり考えないうちに、後の分析を選択します(追加の質問:時間点が少なすぎますか?)。別の問題として、BSI率に対する介入の統計的に有意な効果があることを示すために、いくつの病棟が必要ですか? 「介入前」と「介入中」の2つのANOVAを行うと思います。また、「介入前」のANOVAに有意なF比検定を行うべきではないと思います。 「サンプルサイズ」という用語は、病棟の数または繰り返し測定の数のいずれかで、2次元で考慮します。

2
一貫性のない最尤推定量の例
私は論文へのコメントを読んでおり、著者は、推定量(MLまたは最大準尤度によって検出された)が一貫していない場合でも、尤度比または準尤度比検定の力はまだ収束する可能性があると述べています1観測されたデータの数が無限になる傾向があるため(テストの一貫性)。これはいつどのように起こりますか?いくつかの参考文献を知っていますか?

1
バイオマーカー研究用の電力計算/サンプルサイズ
患者に癌があるかどうかを予測するための潜在的なバイオマーカーがあります。バイオマーカーのテスト結果は、正または負のバイナリです。このバイオマーカーが良い予測因子であるかどうかを判断するためにテストする必要のある患者の数をある程度把握したいと思います。 インターネットで読むと、感度(ケースの数)と特異性(コントロールの数)を調べることが方法のようです。この状況を1サンプルの割合検定として扱うことをお勧めしますが、感度がどのようなもので、どの範囲を除外するかを推定する方法は不明です。感度が0.8を超えるバイオマーカーを「良好」とみなす場合、2つの変数をどのように設定しますか?私の帰無仮説がバイオマーカーであることが、ランダムな割り当て、つまり感度が0.5であるより良くないことを望みます。誰でもこれを行うための最良の方法の例を与えることができます(特にRの場合)。
13 r  power 

3
lmモデルのカスタム消費電力解析をシミュレートする方法(Rを使用)
ここにあった最近の質問に従って。 線形モデルのシミュレーションに基づいてカスタム消費電力解析を実行するために、誰かがRコードを見つけた、または共有できるかどうかを知りたいと思いましたか? 後で、より複雑なモデルに拡張したいのは明らかですが、lmは開始するのに適した場所のようです。ありがとう。

2
選択した偽陽性/偽陰性のエラー率と基礎となるコスト比を厳密に正当化する方法は?
環境 社会科学者と統計学者のグループ(Benjamin et al。、2017)は、最近、「統計的有意性」を決定するためのしきい値として使用される典型的な偽陽性率( = .05)をより保守的なしきい値(α = .005)。競合する社会科学者と統計学者のグループ(Lakens et al。、2018)が回答し、これまたはその他の任意の閾値の使用に反対しました。以下は、レーケンズらからの引用です。(p。16)それは私の質問の主題を例示するのに役立ちます:αα\alphaαα\alpha 理想的には、アルファレベルは、決定理論を使用して効用関数に対してコストと利点を比較することによって決定されます。この費用便益分析(およびアルファレベル)は、入手が困難なサンプルからデータを収集する場合と比較して、大きな既存のデータセットを分析する場合に異なります。科学は多様であり、使用することを決定したアルファレベルを正当化するのは科学者次第です。...研究は、ヒューリスティックおよび任意の包括的しきい値ではなく、厳密な科学の原則に基づいて行う必要があります。 質問 Lakens et al。のように、選択されたアルファを「厳密な科学の原則に導かれる」方法で正当化する方法を考えているのです。ほとんどの社会科学の文脈(つまり、最適化するために利益などのより具体的な品質がある特定のケース以外)で提案しますか? Lakensらの普及に続いて、私は研究者がこの決定を下すのを助けるためにオンライン計算機が循環しているのを見始めました。それらを使用する場合、研究者は偽陽性と偽陰性のエラーの「コスト比」を指定する必要があります。ただし、この計算機が示唆しているように、このようなコスト比率の決定には、多くの定量的な推測作業が含まれます。 いくつかのエラーコストは金銭的に簡単に定量化できます(直接コスト)が、他のエラーコストを1ドル(間接コスト)にすることは困難です。...定量化するのは困難ですが、それらに数字を付ける努力をする必要があります。 たとえば、レイケンズなど。アルファを正当化する際に考慮する可能性のある要因として到達困難なサンプルを検討することを提案しますが、そのサンプルがどれだけ到達困難であるかを推測し、それによってアルファの選択をそれに応じて調整する方法を推測しているようです。別の例として、誤った推論を前提とする研究の追求に他の人が後でどれだけの時間/お金を費やすかという観点から、偽陽性の公開のコストを定量化することは私には難しいように思われます。 このコスト比の決定が主に主観的な最善の推測の問題である場合、これらの決定が(再び、利益のようなものの最適化以外で)「正当化」できるかどうか疑問に思っています。つまり、サンプリング、トレードオフ、影響などについて行われた仮定の外に存在する方法で?このように、偽陽性/偽陰性エラーのコスト比を決定することは、ベイジアン推論で事前分布を選択することに似ているように思われます。 -合理的な比較かどうかはわかりませんが。 概要 私の質問を具体的にするには: 偽陽性/偽陰性率とそのコスト比は、ほとんどの社会科学の文脈で「厳密に」正当化されることはありますか? もしそうなら、これらの分析の選択を正当化するために従うことができる一般化可能な原則は何ですか(そしておそらくそれらのうちの1つまたは2つの例) そうでない場合、コスト比を選択する際の潜在的な主観性(ベイジアンの事前選択に似ている)の私の類推は合理的なものですか? 参照資料 Benjamin、DJ、Berger、J.、Johannesson、M.、Nosek、BA、Wagenmakers、E。、... Johnson、V.(2017年7月22日)。統計的有意性を再定義します。psyarxiv.com/mky9jから取得 Lakens、D.、Adolfi、FG、Albers、CJ、Anvari、F.、Apps、MA、... Zwaan、RA(2018、January 15)。あなたのアルファを正当化します。psyarxiv.com/9s3y6から取得

1
ガウス線形モデルのF検定が最も強力なのはなぜですか?
線形モデルガウス用μは、いくつかのベクトル空間にあると仮定されると標準正規分布で有するの統計のための検定ここで、はベクトル空間であり、逸脱統計量の増加する1対1関数です: f = \ phi \ left(2 \ log \ frac {\ sup _ {\ mu \ in W、\ sigma> 0} L(\ mu、\ sigma | y)} {\ sup _ {\ mu \ in U、\ sigma> 0} L(\ mu、\ sigma | y)} \ right)。 この統計がH_0の最も強力なテストを提供することをどのようにして知ることができますかY=μ+σGY=μ+σGY=\mu+\sigma Gμμ\muG R N F H 0:{ …

1
F検定のサンプルサイズの式
F検定に適用されるLehrの式のようなサンプルサイズの式があるかどうか疑問に思っていますか?t検定のための徐冷炉の式は、Δは、効果の大きさである(例えば、Δ = (μ 1 - μ 2)/ σ)。これは、に一般化することができるN = C / Δ 2 cは式I率、所望の電力に依存する定数であり、1つは、片面または両面の試験を行っているかどうか。n=16/Δ2n=16/Δ2n = 16 / \Delta^2ΔΔ\Delta Δ=(μ1−μ2)/σΔ=(μ1−μ2)/σ\Delta = (\mu_1 - \mu_2) / \sigman=c/Δ2n=c/Δ2n = c / \Delta^2ccc F検定の同様の式を探しています。私の検定統計量を有する非中心Fのように、代替の下で、配布され自由と非中心性パラメータの程度N λ、λは唯一未知であるが、いくつかの値を取ることが仮定されている人口のパラメータに依存します。パラメータkは実験によって固定され、nはサンプルサイズです。理想的には、n = cの形式の(できればよく知られている)式を探してい ますk,nk,nk,nnλnλn \lambdaλλ\lambdakkknnn ここで、cはタイプIレートと電力のみに依存します。n=cg(k,λ)n=cg(k,λ)n = \frac{c}{g(k,\lambda)}ccc サンプルサイズが満たすべき ここで、Fは(X 、K 、N 、δ )以外のCDFでありますk 、n dofおよび非心度パラメーターδを持つ中央F 、およびα 、βはタイプIおよびタイプIIのレートです。想定できるF(F−1(1−α;k,n,0);k,n,nλ)=β,F(F−1(1−α;k,n,0);k,n,nλ)=β, F(F^{-1}(1-\alpha;k,n,0);k,n,n\lambda) = …

2
ゲルマンとカーリンを理解する「パワー計算を超えて:…」(2014)
GelmanとCarlinの「パワー計算を超えて:タイプS(符号)およびタイプM(マグニチュード)エラーの評価」(2014)を読んでいます。私は主なアイデア、主な理解を理解しようとしていますが、混乱しています。誰かが私に本質を蒸留するのを手伝ってくれる? 紙はこのようなものになります(私が正しく理解した場合)。 心理学の統計的研究は、しばしば小さなサンプルに悩まされます。 特定の研究における統計的に有意な結果を条件として、 (1)真の効果サイズは大幅に過大評価される可能性が高く、 (2)効果の符号は高い確率で反対になる可能性があります(サンプルサイズが十分に大きい場合を除く)。 上記は、母集団における効果サイズの以前の推測を使用して示され、その効果は通常小さいと見なされます。 私の最初の問題は、なぜ統計的に有意な結果の条件なのか、です。それは出版バイアスを反映することですか?しかし、そうではないようです。では、なぜでしょうか。 私の第二の問題は、私は自分自身を勉強をすれば、私は私がするために使用しています異なったよりも、私の結果を扱うべきである(I行うfrequentist統計、ベイズに精通していませんか)?たとえば、データのサンプルを取り、モデルを推定し、関心のある効果とその周りの信頼限界の点推定を記録します。私は今、自分の結果を不信にすべきですか?それとも統計的に有意である場合、それを誤解する必要がありますか?与えられた以前の変化はどうですか? (1)統計調査の「プロ​​デューサー」にとって、および(2)応用統計論文の読者にとっての主な要点は何ですか? 参照: ゲルマン、アンドリュー、ジョンカーリン。「パワー計算を超えて:タイプS(符号)およびタイプM(マグニチュード)エラーの評価。」 心理学の展望 9.6(2014):641-651。 PSここで私にとっての新しい要素は、以前の情報を含めることだと思います。これは、(頻繁なパラダイムから来た)処理方法がわかりません。

1
尤度比検定の「望ましい」統計的特性は何ですか?
その方法が完全に尤度比検定に基づいている記事を読んでいます。著者は、一方的な代替案に対するLRテストはUMPであると述べています。彼はそれを主張することによって進みます 「... [LRテスト]が一律で最も強力であると示すことができない場合でも、LRテストは望ましい統計的特性を備えていることがよくあります。」 ここでどのような統計的特性が意味されているのでしょうか。筆者がこれらを言及していることを考えると、それらは統計学者の間の共通の知識であると思います。 私がこれまでに見つけるために管理している唯一の望ましい特性はの漸近カイ二乗分布である(いくつかの規則性の条件の下で)、λは LR比です。− 2 ログλ−2log⁡λ-2 \log \lambdaλλ\lambda 私は、それらの望ましい特性について読むことができる古典的なテキストへの参照にも感謝します。

4
病院ベースのRCTでの滞在期間データの分析に最適な方法は?
RCTからの入院期間(LOS)データを分析する最適な方法についてコンセンサスがあるかどうか知りたいです。これは通常、非常に右に歪んだ分布であり、ほとんどの患者は数日から1週間以内に退院しますが、残りの患者は非常に予測できない(時にはかなり長い)滞在をしていて、分布の右端を形成します。 分析のオプションは次のとおりです。 t検定(存在しない可能性が高い正常性を想定) マンホイットニーUテスト ログランク検定 グループ割り当てに関する条件付きCox比例ハザードモデル これらの方法のどれかが明らかに高い力を持っていますか?

4
研究が過剰に行われるとはどういう意味ですか?
研究が過剰に行われるとはどういう意味ですか? 私の印象では、サンプルサイズが非常に大きく、ごくわずかな効果サイズを検出できるということです。これらの効果サイズはおそらく非常に小さいため、変数間の(必ずしも直接ではない)因果関係よりも、サンプリングプロセスのわずかなバイアスから生じる可能性が高くなります。 これは正しい直感ですか?もしそうなら、結果がそのように解釈され、見積もられた効果サイズが「意味のある」ほど十分に大きいかどうかを手動でチェックして確認する限り、私は大したことが何であるかわかりません。 何か不足していますか?このシナリオで何をすべきかについてより良い推奨事項はありますか?

1
クロステーブル分析のどのテスト:BoschlooまたはBarnard?
30人の患者の小さなデータセットから2x2テーブルを分析しています。私たちは、どの治療法を選ぶべきかについてのヒントを与えるいくつかの変数を遡及的に見つけようとしています。変数(obs normal / strange)と処理決定(A / B)は特に興味深いので、データは次のようになります。 Obs/Tr. Dec.normalstrangeA12012B1351825530Obs/Tr. Dec.ABnormal121325strange055121830\begin{array} {|r|r|r|r|} \hline \text{Obs/Tr. Dec.} &\text{A} &\text{B}\\ \hline \text{normal} &12 &13 &25\\ \hline \text{strange} &0 &5 &5\\ \hline &12 &18 &30\\ \hline \hline \end{array} 明らかに、1つのセルは、カイ2乗検定を除外するエントリに欠けており、フィッシャーの正確確率検定は飽和p値を与えません(ただし、まだ<10%)。したがって、私の最初のアイデアは、より強力なテストを見つけることでした。私はブログを読んで おり、この記事では、バーナードのテストとボクロスのテストについて、一般に、強力なテストにつながる3つのシナリオがあります。 列と行の合計を修正フィッシャーの正確確率検定→→\rightarrow 列または(xclusive)行合計が固定 Barnardの正確検定→→\rightarrow 何も修正されていない Boschloosの正確な検定→→\rightarrow 上記の記事は、治療Aと治療Bの合計が以前にほとんど知られていないため、フィッシャーの正確確率検定を除外できることを指摘しました。しかし、他の選択肢はどうですか?正常なコントロールがある場合のコントロールでは、コントロールできる数のプラセボとverumグループをコントロールできるため、2を選択します:Barnard。私の場合、私にはわかりません。一方で、同様の数学的な問題(プラセボ/バームの合計に等しい観測レベルの合計)があるため、バーナードにつながりますが、デザインを変えることができません。 nr。3につながるサンプルを取得する前の観察の正常/奇妙さ:Boschloo。 それでは、どのテストを使用する必要がありますか。その理由は何ですか。もちろんハイパワーが欲しいです。 (私が知りたいもう1つの質問はchisq.test、rの場合に使用する方が良いprop.test(x, alternative = "greater")かどうかです。理論的な側面については、ここで説明します。)

1
効果サイズの一般的な定義はありますか?
effect-sizeタグにはWikiを持っていません。効果の大きさについてのWikipediaのページには、正確な一般的な定義を提供していません。そして、私はエフェクトサイズの一般的な定義を見たことがありません。しかし、このような議論を読んでいると、統計的検定の文脈において、人々が効果の大きさの一般的な概念を頭に持っているという印象を受けます。標準化された平均は、標準モデルの効果サイズ呼ばれ、標準化された平均差N(μ 、σ 2)θ = (μ 1 - μ 2)/ σθ = μ / σθ=μ/σ\theta=\mu/\sigmaN(μ 、σ2)N(μ,σ2){\cal N}(\mu,\sigma^2)θ = (μ1- μ2)/ σθ=(μ1−μ2)/σ\theta=(\mu_1-\mu_2)/\sigma「2ガウス平均」モデルの場合。しかし、一般的な定義はどうですか?上記の2つの例に共通する興味深い特性は、私が見る限りで は、パワーはを介してのみパラメーターに依存し、増加関数であることです| θ |θθ\theta| θ ||θ||\theta|最初のケースではの通常のテストを検討し、2番目のケースではをます。 H 0:{ μ 1 = μ 2 }H0:{ μ = 0 }H0:{μ=0}H_0:\{\mu=0\}H0:{ μ1= μ2}H0:{μ1=μ2}H_0:\{\mu_1=\mu_2\} このプロパティは、エフェクトサイズの概念の背後にある基本的なアイデアですか?つまり、効果のサイズは単調な1対1の変換まで定義されるということでしょうか。または、より正確な一般的な定義はありますか?

3
帰無仮説がある場合の二項データの検出力分析
対 2項データから単一サンプルの電力分析を実行したいと思います。ここで、は母集団内の成功の割合です。場合、項の正規近似または -testのいずれかを使用できますが、場合、どちらも失敗します。この分析を行う方法があるかどうか知りたいです。提案、コメント、または参考資料をいただければ幸いです。どうもありがとう!H 1:P = 0.001 、P 0 &lt; P &lt; 1 χ 2、P = 0H0:p=0H0:p=0H_0: p = 0H1:p=0.001H1:p=0.001H_1: p = 0.001ppp0&lt;p&lt;10&lt;p&lt;10 < p <1χ2χ2\chi^2p=0p=0p =0

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.