タグ付けされた質問 「sample-size」

このタグは非常にあいまいです。質問がサンプルサイズに関するもので、[小さいサンプル]、[大きいデータ]、[パワー分析]、[パワー]、[未定]、または[アンバランスクラス]のどれも適切でない場合に使用します。

1
キャレットglmnetとcv.glmnet
glmnetwithin caretを使用して最適なラムダを検索cv.glmnetし、同じタスクを実行するために使用することの比較には、多くの混乱があるようです。 次のような多くの質問が提起されました。 分類モデルtrain.glmnet対cv.glmnet? キャレットでglmnetを使用する適切な方法は何ですか? 「キャレット」を使用して「glmnet」を相互検証する しかし、答えはありません。これは、質問の再現性による可能性があります。最初の質問に続いて、非常に似た例を挙げますが、同じ質問があります:推定されるラムダはなぜそんなに違うのですか? library(caret) library(glmnet) set.seed(849) training <- twoClassSim(50, linearVars = 2) set.seed(849) testing <- twoClassSim(500, linearVars = 2) trainX <- training[, -ncol(training)] testX <- testing[, -ncol(testing)] trainY <- training$Class # Using glmnet to directly perform CV set.seed(849) cvob1=cv.glmnet(x=as.matrix(trainX),y=trainY,family="binomial",alpha=1, type.measure="auc", nfolds = 3,lambda = seq(0.001,0.1,by = …

3
なぜ政治(たとえば、ギャラップ)の統計的サンプリングが必要なのか(?)
世論調査(ギャラップなど)は、人口の規模と比較して、ばかばかしいほど少ない人数(たとえば、数億人のうち1000人)をサンプリングしています。 さて、私にとって、母集団の統計を推定する手段として母集団をサンプリングすることは、その標本が母集団(または同様に他の標本)を代表していると信じる強い理由がある場合に意味があります。 たとえば、医学研究にとってサンプリングは明らかに理にかなっています。なぜなら、人間はすべて非常によく似たゲノムを持ち、この要因によって体が同様に振る舞うことをアプリオリに知っているからです。 これはある種の疎結合ではないことに注意してください-ゲノムは非常に強力な決定要因です。 しかし、政治的な世論調査などに低サンプルサイズを使用することを正当化する理由はわかりません。 似たような社会経済的/教育的背景のために、近所の人々の80-90%が大統領に同じように投票するかもしれませんが、これはばかばかしいほど少ないサンプルを正当化することはほとんどないようです。文字通り、1000人のランダムな有権者が2億人の他の有権者のように振る舞う理由は(少なくとも私には)説得力のある理由はありません。 私には、少なくともその100倍の(たとえば)が必要です。どうして?私は多くの理由を考えることができます、例えば: カリフォルニアにはちょうど 22,000の境内があります。人々の経済的および教育的背景は大きく異なっているため、サイズ1000の投票は笑えるほど小さく見えます。平均して1人未満の境内全体をどのように要約できますか? 一般的に、人々は医学に対する身体の反応を変えることはできませんが、それについて考えるだけで政治についての意見を変えることができます。私が見ているように、政治を扱うとき、医学のDNAに似た強制要因はありません。で最高の私は、相関の小さなポケットがあるはず想像します。 しかし、どういうわけか、このような世論調査は...とにかく動作するように見える?それとも、少なくとも人々はそう思うと思う? しかし、なぜ彼らはすべきなのでしょうか?たぶん私は基本的にサンプリングを理解していませんか?誰か説明できますか? 私は真剣に見ている世論調査のいずれかを取ることはできませんが、これで多かれ少なかれ一人でいるように感じています...

1
反復測定ANOVAに必要なサンプルサイズの決定方法
繰り返し測定ANOVAについての助けが必要です。 一部の病棟における血流感染(BSI)率の低下に対する何らかの介入の効果を調査しています。BSIレート情報は、毎月、最初は介入なしで12か月、次に介入ありで12か月で取得する予定です。 時系列または反復測定ANOVAのいずれかを実行することを考えています。最初の分析ではあまり考えないうちに、後の分析を選択します(追加の質問:時間点が少なすぎますか?)。別の問題として、BSI率に対する介入の統計的に有意な効果があることを示すために、いくつの病棟が必要ですか? 「介入前」と「介入中」の2つのANOVAを行うと思います。また、「介入前」のANOVAに有意なF比検定を行うべきではないと思います。 「サンプルサイズ」という用語は、病棟の数または繰り返し測定の数のいずれかで、2次元で考慮します。

3
フィッシャーのz変換はいつ適切ですか?
p値を使用して、有意性についてサンプル相関をテストしたいrrr H0:ρ=0,H1:ρ≠0.H0:ρ=0,H1:ρ≠0.H_0: \rho = 0, \; H_1: \rho \neq 0. 私はフィッシャーのz変換を使用してこれを計算できることを理解しました zobs=n−3−−−−−√2ln(1+r1−r)zobs=n−32ln⁡(1+r1−r)z_{obs}= \displaystyle\frac{\sqrt{n-3}}{2}\ln\left(\displaystyle\frac{1+r}{1-r}\right) そしてp値を見つける p=2P(Z>zobs)p=2P(Z>zobs)p = 2P\left(Z>z_{obs}\right) 標準正規分布を使用します。 私の質問は、これが適切な変換であるためには、がどれくらい大きい必要があるかということです。もちろん、nは私の教科書は何の制限に言及していない3よりも大きくする必要がありますが、のスライド29にこのプレゼンテーションには、その言うnは私のようなものがあります、私は考慮されるデータについては10より大きくなければならない5 ≤ nと≤ 10。nnnnnnnnn5≤n≤105≤n≤105 \leq n \leq 10


3
事前に述べられている場合、サンプルサイズを動的に増やしても大丈夫ですか?
私は、被験者内設計で、ある刺激のメリットと別の刺激のメリットに関する研究をしようとしています。研究の一部の順序効果(タスクタイプの順序、刺激の順序、タスクセットの順序)を減らすように設計された順列スキームがあります。置換スキームは、サンプルサイズを8で割り切れるように指定します。 サンプルサイズを決定するには、野心的な推測(私の分野では伝統的)を行うか、希望する検出力のサンプルサイズを計算する必要があります。問題は、私が観察しようとしているエフェクトサイズの大きさの手掛かりがほとんどないことです(これも私の分野では良い伝統です)。これは、電力計算が少し難しいことを意味します。一方で、サンプルサイズが小さすぎるか、参加者に多額のお金を払ってラボで時間を費やしすぎる可能性があるため、ワイルドな推測をするのも悪いかもしれません。 2つのp値のコリドーを残すまで、8人のバッチで参加者を追加することを前もって述べても大丈夫ですか?例:0,05 <p <0,30?または、他にどのようにお勧めしますか?

2
構造方程式モデルに非常に小さなサンプルがあることの複雑さ
Amos 18で構造方程式モデル(SEM)を実行しています。実験に100人の参加者(緩やかに使用)を探していましたが、SEMを成功させるにはおそらく十分ではないと思われました。SEM(EFA、CFAとともに)は「大規模なサンプル」統計手順であると繰り返し言われました。簡単に言えば、私は100人の参加者には到達しませんでした(なんて驚きです!)。問題のある2つのデータポイントを除外した後は42人しかいません。興味深いことに、とにかくこのモデルを試してみましたが、驚いたことに、非常にうまく適合しているようでした!CFI> .95、RMSEA <.09、SRMR <.08。 このモデルは単純ではありません。実際、比較的複雑だと思います。2つの潜在変数があり、1つは観測値が2つ、もう1つは観測値が5つあります。また、モデルには4つの追加の観測変数があります。間接変数と直接変数には多くの関係があり、例として、いくつかの変数は他の4つの変数に内因性があります。 私はSEMにやや不慣れです。ただし、SEMに精通している私が知っている2人の個人は、フィットインデックスが良好である限り、効果は解釈可能であり(有意である限り)、モデルに重大な「誤り」はないことを教えてくれます。いくつかの適合指数は、良好な適合を示唆するという点で小さなサンプルに対してバイアスがかけられていることを知っていますが、前述の3つはうまく見えるようで、同様にバイアスがかけられていないと思います。間接的な影響をテストするために、ブートストラップ(2000サンプル程度)を使用しています。90%のバイアス補正信頼度、モンテカルロ。さらに、3つの異なる条件に対して3つの異なるSEMを実行しています。 私はあなたの何人かを考慮したい2つの質問があります、そして、あなたが貢献する何かがあるならば、返信してください: 適合指数で実証されていないモデルに重大な弱点はありますか?小さなサンプルは研究の弱点として強調されますが、私が完全に忘れている大きな統計的問題があるかどうか疑問に思っています。将来、さらに10〜20人の参加者を獲得する予定ですが、このような分析のサンプルは比較的少ないままです。 私の小さなサンプル、または私がそれを使用しているコンテキストを考えると、ブートストラップの使用に問題はありますか? これらの質問がこのフォーラムにとって「基本的」すぎないことを願っています。私はSEMおよび関連事項に関する多くの章を読みましたが、この分野の意見に関しては人々が非常に分散していることがわかりました! 乾杯

3
ベルヌーイ試験で「成功」の確率を推定するために必要なサンプルサイズ
ゲームが、完了時に報酬を与えるか、何も与えないイベントを提供するとします。報酬が与えられるかどうかを決定する正確なメカニズムは不明ですが、乱数ジェネレーターが使用されていると想定しています。結果がハードコードされた値よりも大きい場合は、報酬が得られます。 報酬が与えられる頻度を決定するためにプログラマーが使用した値(推定15-30%)を基本的にリバースエンジニアリングする場合、必要なサンプル数をどのように計算しますか? 私はここの「真の確率の推定」セクションから始めました:Checking_whether_a_coin_is_fair、しかし私が正しい道を進んでいるかどうか確信がありません。95%の信頼度で最大3%のエラーが発生するために必要な〜1000サンプルの結果が得られました。 最終的に、私が解決しようとしているのは次のとおりです。 イベント#1は1.0Rの報酬を与え、時間のX% イベント#2は、時間のY%で報酬1.4Rを提供します XとYを正確に見積もり、どのイベントがより効率的かを判断したいと思います。最大で20分ごとに1つのサンプルしか取得できないため、サンプルサイズが大きいと問題になります。

3
異なるサンプルサイズでのp値の相対サイズ
異なるサンプルサイズで、p値の相対サイズはどのように変化しますか?あなたが得た場合のようにで、相関のために、その後に元のp値と比較して、第二の試験のためのp値の相対的な大きさであるもの、0.20の同一のp値を得場合?p=0.20p=0.20p=0.20n=45n=45n=45n=120n=120n=120n=45n=45n=45


5
実験を開始する前にサンプルサイズを決定するか、実験を無期限に実行しますか?
私は何年も前に統計を勉強しましたが、すべてを忘れてしまったので、これらは特定のものよりも一般的な概念的な質問のように思えるかもしれませんが、ここに私の問題があります。 私はUXデザイナーとしてeコマースのウェブサイトで働いています。数年前に構築されたA / Bテストフレームワークがあり、それを疑い始めています。 すべての決定を下すメトリックはコンバージョンと呼ばれ、サイトにアクセスして最終的に何かを購入するユーザーの割合に基づいています。 そこで、[購入]ボタンの色を緑から青に変更するテストを行います。 コントロールは既に持っているもので、平均コンバージョン率がわかる緑色のボタンです。実験では、緑色のボタンを青色のボタンに置​​き換えています。 95%の有意性が満足のいく信頼レベルであることに同意し、実験をオンにして、実行したままにします。 ユーザーがサイトにアクセスすると、舞台裏で50/50の確率でコントロールバージョン(緑色のボタン)と実験バージョン(青いボタン)に送信されます。 7日後の実験を見ると、サンプルサイズが3000(1500が対照に、1500が実験に)、統計的有意性が99.2%の実験に有利な変換で10.2%の増加が見られます。素晴らしいと思います。 実験が続行され、サンプルサイズが大きくなると、コンバージョンが+ 9%増加し、98.1%の有意性が見られます。OK、実験をもっと長く続けると、実験では統計的有意性がわずか92%でコンバージョンが5%増加するだけで、フレームワークは95%の有意性に達する前に4600個のサンプルが必要だと言っています。 実験はどの時点で決定的ですか? 事前にサンプルサイズに同意し、実験を完了すると、あらゆるメトリックが99%の重要性に10%改善するという臨床試験プロセスを考えると、その薬は市場に出るという決定が下されます。しかし、もし4000人を対象に実験を行い、どんな指標でも5%改善し、わずか92%の有意性が見られた場合、その薬は市場に出ることはできません。 事前にサンプルサイズに同意し、そのサンプルサイズに達したら停止して、実験をオフにする時点で有意性が99%だった場合に結果に満足する必要がありますか?

1
距離の差の統計的有意性
2次元グリッド上に3000を超えるベクトルがあり、ほぼ均一な離散分布です。ベクトルのいくつかのペアは特定の条件を満たす。注:条件はベクトルのペアにのみ適用され、個々のベクトルには適用されません。約1500個のこのようなペアのリストがあります。これをグループ1と呼びましょう。グループ2には他のすべてのベクトルペアが含まれています。グループ1のペアのベクトル間の距離が、2つのベクトル間の平均距離よりも大幅に短いかどうかを確認したいと思います。どうやってやるの? 統計的検定:中心極限定理は私の事例に適用できますか?つまり、距離のサンプルを使用し、スチューデントのt検定を使用して、条件を満たすサンプルの平均と条件を満たさないサンプルの平均を比較できますか?それ以外の場合、ここではどのような統計的検定が適切でしょうか? サンプルサイズとサンプル数:ここには2つの変数があることがわかります。2つのグループのそれぞれに対して、サイズmのn個のサンプルを取得し、各サンプルの平均を取得する必要があります。nとmを選択する原則的な方法はありますか?それらは可能な限り大きくすべきですか?または、統計的有意性を示す限り、できるだけ小さくする必要がありますか?2つのグループのそれぞれで同じにする必要がありますか?または、より多くのベクトルペアを含むグループ2の方が大きくする必要がありますか?

5
数20は魔法ですか?
データフィッティング分布のサンプルサイズを最小20にすることを検討するようにアドバイスした参考文献があります。 これには意味がありますか? ありがとう

1
F検定のサンプルサイズの式
F検定に適用されるLehrの式のようなサンプルサイズの式があるかどうか疑問に思っていますか?t検定のための徐冷炉の式は、Δは、効果の大きさである(例えば、Δ = (μ 1 - μ 2)/ σ)。これは、に一般化することができるN = C / Δ 2 cは式I率、所望の電力に依存する定数であり、1つは、片面または両面の試験を行っているかどうか。n=16/Δ2n=16/Δ2n = 16 / \Delta^2ΔΔ\Delta Δ=(μ1−μ2)/σΔ=(μ1−μ2)/σ\Delta = (\mu_1 - \mu_2) / \sigman=c/Δ2n=c/Δ2n = c / \Delta^2ccc F検定の同様の式を探しています。私の検定統計量を有する非中心Fのように、代替の下で、配布され自由と非中心性パラメータの程度N λ、λは唯一未知であるが、いくつかの値を取ることが仮定されている人口のパラメータに依存します。パラメータkは実験によって固定され、nはサンプルサイズです。理想的には、n = cの形式の(できればよく知られている)式を探してい ますk,nk,nk,nnλnλn \lambdaλλ\lambdakkknnn ここで、cはタイプIレートと電力のみに依存します。n=cg(k,λ)n=cg(k,λ)n = \frac{c}{g(k,\lambda)}ccc サンプルサイズが満たすべき ここで、Fは(X 、K 、N 、δ )以外のCDFでありますk 、n dofおよび非心度パラメーターδを持つ中央F 、およびα 、βはタイプIおよびタイプIIのレートです。想定できるF(F−1(1−α;k,n,0);k,n,nλ)=β,F(F−1(1−α;k,n,0);k,n,nλ)=β, F(F^{-1}(1-\alpha;k,n,0);k,n,n\lambda) = …

2
パラメトリックサンプルサイズの計算とノンパラメトリック分析
私は、パラメトリックな方法を使用してサンプルサイズの計算を実行する医学文献の一般的な実践をサポートする特定の参照(テキストまたはジャーナル記事)を持っているかどうかに興味があります主要な試験結果の分析がノンパラメトリック法を使用して行われる場合。 例:主な結果は、特定の薬物を投与した後の嘔吐までの時間であり、平均値は20分(SD 6分)であることが知られていますが、顕著に右斜めに分布しています。サンプルサイズの計算は、次の式を使用して、上記の仮定で行われます。 、n (グループごと)= f(α 、β)× (2 σ2/( μ1- μ2)2)n(グループごと)=f(α、β)×(2σ2/(μ1−μ2)2)n(\text{per-group})=f(\alpha,\beta) \times (2\sigma^2 /(\mu_1 - \mu_2)^2 ) ここで、は、目的のαおよびβエラーに基づいて変化します。f(α 、β)f(α、β)f(\alpha, \beta)αα\alphaββ\beta ただし、分布が歪んでいるため、主要な結果の分析はランクに基づいて行われます(Mann Whitney U検定などのノンパラメトリック手法)。 このスキーマは、統計文献の著者によってサポートされていますか、またはノンパラメトリックのサンプルサイズの推定を実行する必要がありますか(およびこれらをどのように実行しますか)。 私の考えでは、計算を簡単にするために、上記の方法を実行してもかまいません。結局、サンプルサイズの推定値は、それだけです-いくつかの仮定を既に行う推定値-すべては、わずかに(または非常に!)不正確である可能性が高いです。ただし、他の人の考えを知りたい、特にこの推論のラインをサポートする参照があるかどうかを知りたいです。 援助に感謝します。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.