タグ付けされた質問 「power-analysis」

特定の状況下で、検出力(偽であると仮定して帰無仮説を棄却する確率)を計算することによる、統計的検定の質の調査。電力分析は、通常、電力の公称レベルを達成するために必要なサンプルサイズを決定するための調査を計画するときに使用されます(たとえば、80)特定の効果サイズ。多くの場合、理論計算は扱いにくいので、電力分析はシミュレーションによって行われます。

1
プロテオミクスの力?
多くの場合、助成金は、提案されたサンプルサイズをサポートするために電力分析を必要とします。プロテオミクス(およびほとんどの-omics)では、数十のサンプル(たぶん100ですが、ありそうもない)で測定された数百から数千の機能/変数があります。また、これらの測定単位の一部(たとえば、タンパク質のスペクトル数)は正規分布していないことがわかっているため、分析にはノンパラメトリック検定を使用します。単一の測定とt検定を仮定して決定されたサンプルサイズの検出力を見てきましたが、これは完全に正しいとは思いません。特にスペクトルカウントのもう1つの問題は、100のフィーチャのそれぞれが非常に異なるスケールであり、エラーが大きく異なることです(値が大きいほどエラーが少なくなります)。[この問題は、限界倍数変更モデル、Mutch et al。、2002でうまく説明されています] FDRのいくつかの仮定と許容可能な倍率変化を考慮して、提案されたサンプルサイズの検出力を決定する適切な方法は何ですか?ここでツールを使用して、次のことを判断できました。 300遺伝子 3誤検知 1.4倍の違い 0.8の望ましい出力 0.7 stdev グループあたり49のサンプルサイズが必要です。 これは、50v50の設計を提案していること、1.4倍の変更がかなり受け入れられていること、1%のFDRが適切であること、そしてこの実験ではおそらく300のタンパク質を測定することを知っているので便利でした。この検出力またはサンプルサイズの計算の問題は引き続き発生するため、参照アプローチを導入するとよいでしょう。 編集: 私は同僚が、Wald検定が後に続く尤度関数を使用して負の二項分布からスペクトルカウントをモデル化することを提案した場所を読みました。基本的には、予備データを使用してタンパク質の分散の推定値を取得し、各分位点についてグループ間の検出可能な倍数変化を計算します。FDR(アルファ)入力もあります。そのため、80%を超える検出力とサンプルサイズを設定すると、25%の最小分散、50%の小さい分散、25%の最大分散の検出可能な倍数変化を決定できます。問題は、彼らがどうやってこれをしたのか私が知らないことです。このアプローチを共有することで、考えられる答えがだれにでも役立つかどうかはわかりません。

1
非心度パラメータ-それは何ですか、それは何をしますか、推奨される値は何ですか?
特にサンプルサイズの決定と統計的検出力の分析に関して、統計の知識を磨くように努めています。でも、もっと読めば読むほど読まなければならないようです。 とにかく、私は必要なすべてを行うように見えるG * Powerと呼ばれるツールを見つけましたが、非中心性パラメーター、それは何ですか、それは何をするのか、何が推奨値になるのかなどを理解するのに問題がありますか? ウィキペディアなどの情報が不完全であるか、それを理解するのがあまり上手ではありません。 それが何らかの助けになれば、私は一連の2つの尾のあるz検定を実施しています。 PS誰もがこの質問にもっと良いタグを追加できますか?

2
SDが平均より大きく、負でないスケール
私の研究室で実行したい研究と非常によく似た研究を報告する記事を受け取りました。しかし、関心のある変数である期間について、SDは平均よりも大きいことに気付きました...これは分単位で測定される期間であるため、負になることはなく、これは私には非常に奇妙に見えます。これは報告された2つの研究で起こりました、以下は1つです。 それを超えて、これは混合デザインです。コントロールv処理(グループ間)、およびTime1、Time2、Time3(繰り返し測定)。ここに平均(SD)があります、N> 200 Time1 Time2 Time3 Control 15.1 (14.6) 14.4 (14.8) 13.3 (15.7) Treatment 14.8 (13.2) 10.0 (12.2) 8.2 (9.9) ...彼らは分散分析を実行し、p <.001を報告しました。 これを電力分析の基礎として使用して、私たちの研究のサンプルサイズを決定するように依頼されました。これはデータが通常ではないか異常値を持っていることを示していると確信しており、これに基づいてサンプルサイズを決定するのに不安があります。私はちょうどベースから外れていますか?

3
正規性テストの力の評価(R)
Rのさまざまなサンプルサイズでの正規性検定の精度を評価したい(正規性検定が誤解を招く可能性があることを理解しています)。たとえば、Shapiro-Wilkテストを確認するために、次のシミュレーション(および結果のプロット)を実行しています。サンプルサイズが増加すると、nullを拒否する確率が減少すると予想されます。 n <- 1000 pvalue_mat <- matrix(NA, ncol = 1, nrow = n) for(i in 10:n){ x1 <- rnorm(i, mean = 0, sd = 1) pvalue_mat[i,] <- shapiro.test(x1)$p.value } plot(pvalue_mat) 私の考えでは、サンプルサイズが大きくなると、拒否率は低くなるはずですが、かなり均一に見えます。私はこれを誤解していると思います-どんな考えでも歓迎します。

2
2つの異なる最小nを生成する不等サイズグループのt検定電力分析を実行できますか?
通常、Power Analysisを計算するためにaを実行するのは簡単ですminimum sample size。特に、私のお気に入りの統計計算環境であるRでは、簡単です。 ただし、私が行ったものやオンラインで参照できるものとは少し異なる電力分析を実施するように求められています。私が求められていることがさらに可能/有効かどうか疑問に思っています。 プロジェクトには基本的に2つunequal groupsの状態があり、これらの2つのグループは結果変数(顧客への電話の継続時間)に関して大幅に異なるという仮説があります。「コントロール」グループは40の州で構成され、約2,500の観測を生成しました。「テスト」グループには、約10の州と500の観測があります。 最初に、を計算するために使用したグループmeans+ を見つけましpooled standard deviationたEffect Size。それから私はと呼ばれるパッケージを使用pwr中にR、私は0.05意義と0.8パワー与えられたグループごとに約135の観測の最小サンプルサイズを、必要なことがわかりました。 ただし、現在のように1つのグループを他のグループよりも大きくしたいため、グループごとに2つの異なる観測値の最小数または状態数の観点からの人口の最小%または「テスト」グループに入らなければならない観察。 2つのサンプルt検定(R関数pwr.t2n.test)のパワー分析が表示されますが、少なくとも1つのサンプルサイズを指定する必要がありますが、両方のグループの最小サンプルサイズを(数値またはパーセンテージ)とこの関数は、2つのグループの標準偏差の違いを反映していません。 これは可能ですか、それとも機能しないことを伝えますか?

2
メタアナリシスでは、生データを含まない重要でない研究をどのように扱うべきですか?
特定の構成に関するグループAとグループBのパフォーマンスを調べて、メタ分析を行っているとしましょう。さて、私が出くわすいくつかの研究は、2つのグループ間で統計的な差が見つからなかったと報告しますが、正確なテスト統計や生データは表示されません。メタ分析では、そのような研究をどのように処理すればよいですか? 基本的に、私はここに3つの異なる選択肢を見ます: それらすべてを含め、それぞれに0の効果サイズを割り当てます。 それらをすべて捨てます。 それらのそれぞれに対してある種の電力分析を行うか、特定の数の参加者にしきい値を設定します。統計的有意性に到達できたはずのすべてを含め、それぞれに効果サイズ0を割り当てます。残りは捨てます。 すべての異なるオプションのメリットを確認できます。オプション1はかなり保守的であり、タイプIIのエラーを発生させるリスクしかありません。オプション2はタイプIのエラーを引き起こすリスクを高めますが、多くの不十分な研究のために結果が台無しになるのを防ぎます。オプション3は、オプション1とオプション2の間の中間のように見えますが、多くの仮定や純粋な推測を行う必要があります(パワー分析のベースとする効果のサイズはどれですか?それぞれに何人の参加者を要求する必要がありますか?合格するための研究?)、おそらく最終結果の信頼性を低下させ、主観性を高めます。

1
電力分析でサンプルを決定した後のサンプルサイズの超過の結果
チャレンジ 私たちのオフィスでは、サンプルサイズとそのエフェクトサイズへの影響について話し合いました。私を助けてさらに説明してもらえますか? ベース 電力分析を実行するとき、特定の設計における特定の効果サイズのサンプルサイズを決定できます。 問題/ディスカッション どうなり先験的にはサンプルサイズを超えた決定(電力解析では例えば、決定サンプルだった、我々は得ることができた)?N = 1000N=100N=100N=100N=1000N=1000N=1000 ポジション1: 大きなサンプルサイズは、エフェクトサイズを切り刻む/破壊します。電力分析で決定されたよりも大きいサンプルを使用すると、「すべてが重要になる」という危険が発生します(軽微で、実際には無関係な影響も)。したがって、電力分析から決定されたサンプルに依存する必要があります。そうすることで、「実際の/関連する」効果を明らかにすることができます。 または ポジション2: サンプルサイズの決定は、所定の効果を明らかにするために必要な最小サンプルサイズを指します。大きなサンプルサイズは、たとえば測定誤差が減少するため、有益です。したがって、実際の効果をより簡単に明らかにすることができます。事後効果サイズの計算は、効果の関連性に関する情報を提供します。 または 位置3: 位置1と位置2はスタディデザインによって異なります(たとえば、「関連性のある影響」を求めるためt検定では位置1ですが、CFA / SEMでは位置2でより安定した信頼できる結果が得られます)。 または 位置4: 別の説明として考えられる別の位置。

1
通常の近似を使用せずに2グループの2項電力分析を実行するにはどうすればよいですか?
比率が非常に小さい比率の(非)等値の仮説検定の検出力分析をしたいと思います。二項分布の正規(またはポアソン)近似を使用せずに、そうしたいと思います。対処できるようにしたいいくつかの一般的な力の質問があります。 事後:(グループ1で成功する確率)と\ Pr_2とN_1(サンプルサイズグループ1)とN_2を指定して、\ alphaを指定した設計の検出力を計算します。Pr1Pr1\Pr_1Pr2Pr2\Pr_2N1N1N_1N2N2N_2αα\alpha \ alpha、比率N_1 \ over {N_2}、1-\ beta(power)、\ alpha、\ Pr_1、および予想される\ Pr_2が与えられた場合のN の事前解NNNαα\alphaN1N2N1N2N_1\over{N_2}1−β1−β1 - \betaαα\alphaPr1Pr1\Pr_1Pr2Pr2\Pr_2 先験的はを解く1−β1−β1 - \beta所与α,N1,N2,Pr1α,N1,N2,Pr1\alpha, N_1, N_2, \Pr_1、およびPr2Pr2\Pr_2。 理想的な応答にはRコードが含まれ、指摘し忘れていた他のすべての指摘を指摘します。比率が小さいため、シミュレーションアプローチは適切な応答ではありません。ソリューションでは、どのような統計的検定が適用できるかについても説明してください。

1
代表的なサンプルをブートストラップしてnを無限に近づけることができるのに、なぜ仮説検定の威力が問題になるのですか?
コンピューターが遅い時代にもう生きていなくて、ノンパラメトリックなものに対して順列検定をブートストラップ/実行するのにコストがかかりすぎるのに、なぜ仮説検定の力を気にするのですか? ブートストラップ/置換仮説検定を実行できる場合、電力分析は関係ありませんか? 「サンプルサイズ」をブートストラップで無限大にできるので、ブートストラップの結果として電力が増加しますか?

3
なぜ人々は重要性レベルを権力と交換しないのですか?
慣例として、有意水準がで検出力がある多くの研究があります。ただし、べき乗で研究を見つけることは非常にまれです。0.050.050.050.80.80.8α = 0.2α=0.2\alpha = 0.20.950.950.95 私の理解では、実験が行われた後、結果が有意でない場合、有意水準はまったく問題になりません。なぜなら、この場合、私たちはnullを受け入れることが理にかなっているかどうかを検討しており、すべての重要なことです力です。同様に、結果が有意である場合、有意水準は証拠となり、検定の検出力はまったく差がありません。(「重要ではない」とは、「この実験の目的ではない」という意味です。メタスタディでは、重要度とパワーの両方が重要であるため、両方をレポートで報告してください!) 私が正しい場合、帰無仮説と代替案はある程度対称的です。帰無仮説は本質的にそれ以上の保護を必要としません。代替案を証明したい場合は、「この新薬は患者に影響を与える」と言ってから、非常に小さなと適度に高いパワーを使用します。一方、たとえば正規性テストでnullを証明する場合は、適度に小さいと非常に高いパワーを選択して、nullを秘密裏に受け入れることができるようにする必要があります。αα\alphaαα\alpha 適度に小さいと非常に高いパワーでの実験がそれほど珍しいのはなぜですか?αα\alpha

3
サンプルサイズを2倍にすると、p値にどのような影響がありますか
それらがOLS回帰[帰無仮説検定]の2つの変数間の根本的な関係であるとすると、サンプルサイズを2倍にした場合のp値にはどのような影響がありますか?(最初のサンプルが母集団の代表であり、後続のサンプルも代表であると仮定します)。 根本的な関係がある限り、サンプルサイズを増やすとp値が小さくなることは明らかですが、pとnの関係の性質をさらに理解することに興味があります。
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.