タグ付けされた質問 「power-analysis」

特定の状況下で、検出力(偽であると仮定して帰無仮説を棄却する確率)を計算することによる、統計的検定の質の調査。電力分析は、通常、電力の公称レベルを達成するために必要なサンプルサイズを決定するための調査を計画するときに使用されます(たとえば、80)特定の効果サイズ。多くの場合、理論計算は扱いにくいので、電力分析はシミュレーションによって行われます。




1
尤度比検定の「望ましい」統計的特性は何ですか?
その方法が完全に尤度比検定に基づいている記事を読んでいます。著者は、一方的な代替案に対するLRテストはUMPであると述べています。彼はそれを主張することによって進みます 「... [LRテスト]が一律で最も強力であると示すことができない場合でも、LRテストは望ましい統計的特性を備えていることがよくあります。」 ここでどのような統計的特性が意味されているのでしょうか。筆者がこれらを言及していることを考えると、それらは統計学者の間の共通の知識であると思います。 私がこれまでに見つけるために管理している唯一の望ましい特性はの漸近カイ二乗分布である(いくつかの規則性の条件の下で)、λは LR比です。− 2 ログλ−2log⁡λ-2 \log \lambdaλλ\lambda 私は、それらの望ましい特性について読むことができる古典的なテキストへの参照にも感謝します。

2
回帰F検定の能力は何ですか?
多重線形回帰における変数のサブセットの古典的なF検定は、 ここで、は、「縮小」モデルの下での二乗誤差の合計であり、「大きな」モデル内にネストし、は、 2つのモデル。'big'モデルの追加の変数には線形の説明力がないという帰無仮説では、統計量はおよびの自由度を持つFとして分布されます。SSE(R)BdfdfR−dfBdfBF= (SSE(R )− SSE(B ))/(dfR− dfB)SSE(B) / dfB、F=(SSE(R)−SSE(B))/(dfR−dfB)SSE(B)/dfB, F = \frac{(\mbox{SSE}(R) - \mbox{SSE}(B))/(df_R - df_B)}{\mbox{SSE}(B)/df_B}, SSE(R)SSE(R)\mbox{SSE}(R)BBBdfdfdfdfR− dfBdfR−dfBdf_R - df_BdfBdfBdf_B しかし、代替案の下での分布はどうですか?私はそれが非中心Fであると思います(二重非中心ではないことを願っています)が、非中心パラメーターが正確に何であるかについての参照は見つかりません。私はそれが真の回帰係数、おそらくは計画行列に依存すると推測しますが、それを超えると私はよくわかりません。Xββ\betaバツXX

4
研究が過剰に行われるとはどういう意味ですか?
研究が過剰に行われるとはどういう意味ですか? 私の印象では、サンプルサイズが非常に大きく、ごくわずかな効果サイズを検出できるということです。これらの効果サイズはおそらく非常に小さいため、変数間の(必ずしも直接ではない)因果関係よりも、サンプリングプロセスのわずかなバイアスから生じる可能性が高くなります。 これは正しい直感ですか?もしそうなら、結果がそのように解釈され、見積もられた効果サイズが「意味のある」ほど十分に大きいかどうかを手動でチェックして確認する限り、私は大したことが何であるかわかりません。 何か不足していますか?このシナリオで何をすべきかについてより良い推奨事項はありますか?

1
生存分析のための電力分析
遺伝子シグネチャーが再発のリスクが低い被験者を特定すると仮定すると、人口の20%でイベントレートが0.5(ハザード比0.5)減少し、遡及的コホート研究のサンプルを使用するつもりです。 2つの仮説グループで等しくない数のサンプルサイズを調整する必要がありますか? たとえば、Collett Dを使用すると、2003年の第2版-第2版の医学研究における生存データのモデリングが必要です。必要なイベントの総数dは、 d=(Zα/2+Zβ/2)2p1p2(θR)2d=(Zα/2+Zβ/2)2p1p2(θR)2\begin{equation} d = \frac{(Z_{\alpha/2} + Z_{\beta/2})^2}{p_1 p_2 (\theta R)^2} \end{equation} ここで、及びZ β / 2が上側であるα / 2と上部β / 2標準正規分布のそれぞれのポイント、、。Zα/2Zα/2Z_{\alpha/2}Zβ/2Zβ/2Z_{\beta/2}α/2α/2\alpha/2β/2β/2\beta/2 特定の値については、 p1=0.20p1=0.20p_1 = 0.20 p2=1−p1p2=1−p1p_2 = 1 - p_1 θR=−0.693θR=−0.693\theta R = -0.693 、したがって Z 0.025 = 1.96α=0.05α=0.05\alpha = 0.05Z0.025=1.96Z0.025=1.96Z_{0.025}= 1.96 β=0.10β=0.10\beta = 0.10Z0.05=1.28Z0.05=1.28Z_{0.05} = 1.28 θR=logψR=log0.50=−0.693θR=log⁡ψR=log⁡0.50=−0.693\theta R …

1
モンテカルロ分析に必要なシミュレーション数
私の質問は、モンテカルロ分析法に必要なシミュレーション数についてです。私は、任意の許容されるパーセンテージエラーのためにシミュレーションに必要な数を見る限り、(例えば、5)は 、N = { 100 ⋅ Z C ⋅ STD (X )EEEn={100⋅zc⋅std(x)E⋅mean(x)}2,n={100⋅zc⋅std(x)E⋅mean(x)}2, n = \left\{\frac{100 \cdot z_c \cdot \text{std}(x)}{E \cdot \text{mean}(x)} \right\}^2 , ここで、は結果のサンプリングの標準偏差、z cは信頼水準係数です(たとえば、95%の場合は1.96)。したがって、この方法で、nシミュレーションの結果の平均と標準偏差が実際の平均と95%の信頼水準の標準偏差を表すことを確認できます。std(x)std(x)\text{std}(x)zczcz_cnnn 私の場合、シミュレーションを7500回実行し、7500シミュレーションから100サンプリングの各セットの移動平均と標準偏差を計算します。私が取得する必要なシミュレーションの数は常に100未満ですが、結果全体の平均と標準と比較した平均と標準誤差の%は常に5%未満ではありません。ほとんどの場合、平均誤差率は5%未満ですが、標準誤差は最大30%になります。 実際の平均と標準を知らずに必要なシミュレーションの数を決定する最良の方法は何ですか(私の場合、シミュレーションの対象となる結果は正規分布です)? 助けてくれてありがとう。 シミュレーションが無限に実行されたときにシミュレーション結果の分布がどのようになるかを理解するために、n回のシミュレーション後に結果の平均と分散を使用する代わりに、結果の分布のフィット関数を見つけることにしました。ただし、ここでは、nは%エラーをフルフィルする必要があります。そのようにすると、たとえば97.5%に関連する累積分布関数のより正確な結果を見つけることができると思います。400と7000のシミュレーションの結果を比較すると、両方のサンプリングの分布のフィット関数は互いに似ているため、2番目の曲線の曲線のみが滑らかになります。また、したがって、MATLAB / Simulinkのモデルは非線形ですが、生成された入力パラメーターは正規分布ですが、シミュレーションの結果のヒストグラムは通常ではないため、「一般化極値分布」を使用しました。これは、MATLABでは 'gev'という名前です。しかし、それでも、この方法論についてはよくわかりません。事前のコマンドに感謝します

1
比率と二項分布によるサンプルサイズの決定
私は、SokalとRohlfによるBiometry(3e)という本を使用して、いくつかの統計を学ぼうとしています。これは、確率、二項分布、およびポアソン分布をカバーする第5章の演習です。 この質問への答えを生成する式があることを理解しています: ただし、この式はこのテキストにはありません。確率、望ましい信頼レベル、および二項分布のみを知ってサンプルサイズを計算する方法を知りたいのですが。私が指摘できるこのトピックをカバーするリソースはありますか?私はGoogleを試しましたが、これまでに見たものには、この問題でアクセスできない情報が必要です。n=4(p–√−q√)2n=4(p−q)2 n = \frac 4 {( \sqrt{p} - \sqrt{q} )^2}

1
観測48で革新的な異常値をARIMAモデルに組み込むにはどうすればよいですか?
私はデータセットに取り組んでいます。いくつかのモデル識別手法を使用した後、私はARIMA(0,2,1)モデルを思いつきました。 R detectIOのパッケージの関数を使用して、元のデータセットの48回目の観測で革新的な外れ値(IO)TSAを検出しました。 この外れ値をモデルに組み込んで、予測に使用するにはどうすればよいですか?Rではそれから予測を行うことができない可能性があるため、ARIMAXモデルを使用したくありません。これを行う方法は他にありますか? これが私の値です。 VALUE <- scan() 4.6 4.5 4.4 4.5 4.4 4.6 4.7 4.6 4.7 4.7 4.7 5.0 5.0 4.9 5.1 5.0 5.4 5.6 5.8 6.1 6.1 6.5 6.8 7.3 7.8 8.3 8.7 9.0 9.4 9.5 9.5 9.6 9.8 10.0 9.9 9.9 9.8 9.8 9.9 9.9 9.6 9.4 …
10 r  time-series  arima  outliers  hypergeometric  fishers-exact  r  time-series  intraclass-correlation  r  logistic  glmm  clogit  mixed-model  spss  repeated-measures  ancova  machine-learning  python  scikit-learn  distributions  data-transformation  stochastic-processes  web  standard-deviation  r  machine-learning  spatial  similarities  spatio-temporal  binomial  sparse  poisson-process  r  regression  nonparametric  r  regression  logistic  simulation  power-analysis  r  svm  random-forest  anova  repeated-measures  manova  regression  statistical-significance  cross-validation  group-differences  model-comparison  r  spatial  model-evaluation  parallel-computing  generalized-least-squares  r  stata  fitting  mixture  hypothesis-testing  categorical-data  hypothesis-testing  anova  statistical-significance  repeated-measures  likert  wilcoxon-mann-whitney  boxplot  statistical-significance  confidence-interval  forecasting  prediction-interval  regression  categorical-data  stata  least-squares  experiment-design  skewness  reliability  cronbachs-alpha  r  regression  splines  maximum-likelihood  modeling  likelihood-ratio  profile-likelihood  nested-models 

3
帰無仮説がある場合の二項データの検出力分析
対 2項データから単一サンプルの電力分析を実行したいと思います。ここで、は母集団内の成功の割合です。場合、項の正規近似または -testのいずれかを使用できますが、場合、どちらも失敗します。この分析を行う方法があるかどうか知りたいです。提案、コメント、または参考資料をいただければ幸いです。どうもありがとう!H 1:P = 0.001 、P 0 &lt; P &lt; 1 χ 2、P = 0H0:p=0H0:p=0H_0: p = 0H1:p=0.001H1:p=0.001H_1: p = 0.001ppp0&lt;p&lt;10&lt;p&lt;10 < p <1χ2χ2\chi^2p=0p=0p =0

2
2標本t検定の検出力
2つの独立したサンプルのt検定の場合の検出力の計算を理解しようとしています(分散が等しいと想定していないため、Satterthwaiteを使用しました)。 これは、プロセスを理解するのに役立つことがわかった図です。 したがって、2つの母集団について次のことを与え、サンプルサイズを与えると仮定しました。 mu1&lt;-5 mu2&lt;-6 sd1&lt;-3 sd2&lt;-2 n1&lt;-20 n2&lt;-20 アッパーテールの確率が0.05であることに関連して、nullの下で臨界値を計算できます。 df&lt;-(((sd1^2/n1)+(sd2^2/n2)^2)^2) / ( ((sd1^2/n1)^2)/(n1-1) + ((sd2^2/n2)^2)/(n2-1) ) CV&lt;- qt(0.95,df) #equals 1.730018 そして、対立仮説を計算します(この場合、私が学んだのは「非中心t分布」です)。上の図で、中央以外の分布と上で見つかった臨界値を使用してベータを計算しました。Rの完全なスクリプトは次のとおりです。 #under alternative mu1&lt;-5 mu2&lt;-6 sd1&lt;-3 sd2&lt;-2 n1&lt;-20 n2&lt;-20 #Under null Sp&lt;-sqrt(((n1-1)*sd1^2+(n2-1)*sd2^2)/(n1+n2-2)) df&lt;-(((sd1^2/n1)+(sd2^2/n2)^2)^2) / ( ((sd1^2/n1)^2)/(n1-1) + ((sd2^2/n2)^2)/(n2-1) ) CV&lt;- qt(0.95,df) #under alternative diff&lt;-mu1-mu2 t&lt;-(diff)/sqrt((sd1^2/n1)+ (sd2^2/n2)) ncp&lt;-(diff/sqrt((sd1^2/n1)+(sd2^2/n2))) #power 1-pt(t, …

2
変量効果モデルのクラスターあたりの最小サンプルサイズ
変量効果モデルのクラスターごとの観測数に合理性はありますか?交換可能なランダム効果としてモデル化された700個のクラスターのサンプルサイズが1,500です。少数ではあるが大きなクラスターを構築するために、クラスターをマージするオプションがあります。各クラスターの変量効果を予測する上で意味のある結果を得るために、クラスターごとの最小サンプルサイズをどのように選択できるのでしょうか。これを説明する良い紙はありますか?

2
Rでのコルモゴロフスミルノフ検定の検出力を計算できますか?
Rでの両側Kolmogorov Smirnovテストの電力分析を実行することは可能ですか? 私はks.test()を使用して2つの経験的分布が異なるかどうかをテストしており、電力分析を追加しようとしています。 RでKSテストの組み込み電力分析を見つけることができませんでした。何か提案はありますか? 編集:これらはランダムに生成された分布であり、私のデータに非常に近似しています(真のサンプルサイズと指数分布の推定減衰率を使用) set.seed(100) x &lt;- rexp(64, rate=0.34) y &lt;- rexp(54,rate=0.37) #K-S test: Do x and y come from same distribution? ks.test(x,y) これらのデータは、2つの異なるグループのボディサイズの測定値です。2つのグループの分布は基本的に同じであることを示したいのですが、サンプルサイズに基づいてそれを言う力があるかどうか共同編集者から尋ねられました。ここでは指数分布からランダムに抽出しましたが、これらは実際のデータに近いものです。 これまでのところ、両側KS検定に基づくこれらの分布に有意差はないと述べました。2つの分布もプロットしました。xとyのサンプルサイズと減衰率を考えると、そのようなステートメントを作成する能力があることをどのように示すことができますか?

1
比率の2標本比較、標本サイズ推定:RとStata
比率の2標本比較、標本サイズ推定:RとStata 次のように、サンプルサイズの結果が異なります。 でR power.prop.test(p1 = 0.70, p2 = 0.85, power = 0.90, sig.level = 0.05) 結果:各グループの(つまり 161)。n=160.7777n=160.7777n = 160.7777 Stata sampsi 0.70 0.85, power(0.90) alpha(0.05) 結果:各グループで。n=174n=174n = 174 なぜ違いがあるのですか?ありがとう。 ところで、私はSAS JMPで同じサンプルサイズ計算を実行しました。結果は(Rの結果とほとんど同じです)。n=160n=160n = 160

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.