タグ付けされた質問 「experiment-design」

変化が存在する場合の情報収集演習の構成方法の研究。

16
実験計画に関する推奨本?
実験計画に関する本に対するパネルの推奨事項は何ですか? 理想的には、本はまだ印刷されているか、電子的に入手可能であるべきですが、それは常に実現可能ではありません。あなたがこの本の何が素晴らしいのかについていくつかの言葉を付け加えたいと思うなら、それも素晴らしいでしょう。 また、投票ごとに提案を分類できるように、回答ごとに1冊の本を目指してください。 (コミュニティWiki、改善できる場合は質問を編集してください!)

4
二項データのANOVA
実験データセットを分析しています。データは、治療タイプと二項式の結果のペアベクトルで構成されます。 Treatment Outcome A 1 B 0 C 0 D 1 A 0 ... 結果列の1は成功を示し、0は失敗を示します。治療が結果を大きく変えるかどうかを知りたいです。4回の異なる治療があり、各実験は何度も繰り返されます(各治療で2000回)。 私の質問は、ANOVAを使用してバイナリの結果を分析できますか?または、二項データをチェックするためにカイ二乗検定を使用する必要がありますか?カイ2乗は割合が均等に分割されると仮定しているようですが、そうではありません。別のアイデアは、各治療の成功と失敗の割合を使用してデータを要約し、次に割合テストを使用することです。 この種の二項式の成功/失敗実験に意味のあるテストについてのあなたの推奨を聞きたいです。

3
ランダムなサンプルが明らかに代表的でない場合はどうなりますか?
ランダムなサンプルを取り、それが明らかに最近の質問のように代表ではないことがわかる場合はどうでしょう。たとえば、人口分布が0を中心に対称であると仮定し、ランダムに描画するサンプルに不均衡な正と負の観測値があり、不均衡が統計的に有意である場合、どうなりますか?バイアスされたサンプルに基づいて、母集団についてどのような合理的な説明をすることができますか?そのような状況での合理的な行動方針は何ですか?私たちの研究でこの不均衡に気づいたとき、それは重要ですか?

4
実験計画の落とし穴:死んだ実験の回避
私はこの引用に何度も出くわしました: 実験が終了した後に統計学者に相談することは、多くの場合、単に死後検査を行うように彼に求めることです。彼はおそらく実験が何で死んだかを言うことができます。- ロナルドフィッシャー(1938) 私には、それはおそらく少し誇張されているようです。優れたデザインなしで実験がどのように死ぬかを説明した唯一の例は、コントロールの欠如またはコントロールの悪さです。たとえば、肥料の散布を制御するが、散布に必要な環境を制御できない実験。多分それは私だけかもしれませんが、フィッシャーの設計原則に関するウィキペディアのセクションを一読するだけで、ほとんどの基盤がカバーされるようです。 統計学者として、データに関する実験関連の問題の設計をどのくらいの頻度で見ますか?フィッシャーが言及したこれらの少数の要因に常に関係しているのか、それとも統計的に訓練されていない科学者が注目すべき重大な落とし穴があるのか​​?


10
大学院レベルで応用統計を自習するための本の推奨事項はありますか?
私は大学でいくつかの統計学コースを受講しましたが、私の教育は非常に理論に基づいていることがわかりました。 私は、あなたが推薦したり、良い経験をしたりした応用統計のテキスト(大学院レベル)を持っている人がいるかどうか疑問に思っていました。

4
(一部の)擬似ランダム化の問題点
50歳以上の患者が誕生年までに擬似ランダム化された研究に出会いました。誕生年が偶数の場合、通常のケア、奇数の場合、介入。 実装が簡単で、転覆するのが難しく(患者が受けるべき治療を簡単に確認できます)、覚えやすい(割り当ては数年間続いた)。それでも、私はそれが好きではありません。適切なランダム化の方が良かったと感じています。しかし、その理由は説明できません。 私はそれを感じるのは間違っていますか、または「本当の」ランダム化を好む正当な理由がありますか?

4
新しいベクターをPCA空間に投影する方法は?
主成分分析(PCA)を実行した後、新しいベクトルをPCA空間に投影します(つまり、PCA座標系で座標を見つけます)。 を使用してR言語でPCAを計算しましたprcomp。これで、ベクトルにPCA回転行列を掛けることができるはずです。このマトリックスの主成分を行または列に配置する必要がありますか?
21 r  pca  r  variance  heteroscedasticity  misspecification  distributions  time-series  data-visualization  modeling  histogram  kolmogorov-smirnov  negative-binomial  likelihood-ratio  econometrics  panel-data  categorical-data  scales  survey  distributions  pdf  histogram  correlation  algorithms  r  gpu  parallel-computing  approximation  mean  median  references  sample-size  normality-assumption  central-limit-theorem  rule-of-thumb  confidence-interval  estimation  mixed-model  psychometrics  random-effects-model  hypothesis-testing  sample-size  dataset  large-data  regression  standard-deviation  variance  approximation  hypothesis-testing  variance  central-limit-theorem  kernel-trick  kernel-smoothing  error  sampling  hypothesis-testing  normality-assumption  philosophical  confidence-interval  modeling  model-selection  experiment-design  hypothesis-testing  statistical-significance  power  asymptotics  information-retrieval  anova  multiple-comparisons  ancova  classification  clustering  factor-analysis  psychometrics  r  sampling  expectation-maximization  markov-process  r  data-visualization  correlation  regression  statistical-significance  degrees-of-freedom  experiment-design  r  regression  curve-fitting  change-point  loess  machine-learning  classification  self-study  monte-carlo  markov-process  references  mathematical-statistics  data-visualization  python  cart  boosting  regression  classification  robust  cart  survey  binomial  psychometrics  likert  psychology  asymptotics  multinomial 

5
実験計画のブロックとは何ですか?
実験計画におけるブロックの概念について2つの質問があります。(1)ブロックと因子の違いは何ですか?(2)いくつかの本を読んでみましたが、はっきりしないことがあります。著者は、「ブロック要因」と他の要因の間に相互作用がないと常に仮定しているようです。

2
因子/変数をどのように「制御」しますか?
私の理解では、「コントロール」には統計上で2つの意味があります。 対照群:実験では、対照群のメンバーに治療は施されていません。例:プラセボと薬物:あるグループに薬物を投与し、他のグループ(対照)には投与しません。これは「制御実験」とも呼ばれます。 変数の制御:特定の独立変数の効果を分離する手法。この技術に与えられた他の名前のいくつかは、「会計」、「保持定数」、「制御」、いくつかの変数です。例:サッカー視聴調査(好きか嫌いか)では、性別がバイアスを引き起こすと考えられるため、性別の影響を取り除くことができます。つまり、男性は女性よりもそれを好む可能性があります。 したがって、私の質問はポイント(2)に対するものです。2つの質問: 一般的に、どのようにして変数を「制御」/「アカウント」しますか。どのようなテクニックが使用されていますか?(回帰の観点から、ANOVAフレームワーク)。 上記の例では、男性と女性をランダムに選択することがコントロールを構成していますか?つまり、「ランダム」は他の効果を制御するためのテクニックの1つですか?

3
「統計実験」と「統計モデル」の違いは何ですか?
AW van der Vaartの漸近統計(1998年)をフォローしています。彼は統計実験とは異なり、統計モデルとは異なると主張しているが、どちらも定義していない。私の質問: (1)統計実験、(2)統計モデル、(3)統計実験と統計モデルを常に区別する重要な要素は何ですか?

3
数式または分析からのデータをシミュレートする一般的な方法はありますか?
実験計画データフレームからのデータのde novoシミュレーション。 Rに重点を置いて(ただし、他の言語のソリューションは素晴らしいでしょう)。 実験または調査の設計において、データをシミュレートし、このシミュレートされたデータを分析することにより、設計の長所と短所に関する素晴らしい洞察を得ることができます。 このようなアプローチは、統計的テストの理解と適切な使用にも不可欠です。 ただし、このプロセスはやや面倒な傾向があり、多くの場合、実験や調査でこの重要なステップをスキップするようになります。 統計モデルとテストには、データのシミュレーションに必要な情報の大部分が含まれています(分布の仮定または明示的な記述を含む)。 分析モデル(および関連する仮定(例:正常性とバランス)、因子のレベル、および有意性の尺度(p値など)が与えられた場合、シミュレートされたデータ(理想的には、 print()、predict()、simulate())。 このような一般化されたシミュレーションフレームワークは可能ですか? もしそうなら、そのようなフレームワークは現在利用可能ですか? 例、次のような関数が欲しい sim(aov(response~factor1+factor2*factor3), p.values=list(factor1=0.05, factor2=0.05, factor3=0.50, factor2:factor3=0.05), levels=list(factor1=1:10, factor2=c("A", "B", "C"), factor3=c("A", "B", "C"))) すなわち、次の一般化バージョン: sim.lm<-function(){ library(DoE.base) design<-fac.design(nlevels=c(10,3,3), factor.names=c("factor1", "factor2", "factor3"), replications=3, randomize=F) response<-with(design, as.numeric(factor1)+ as.numeric(factor2)+ as.numeric(factor3)+ as.numeric(factor2)*as.numeric(factor3)+ rnorm(length(factor1))) simulation<-data.frame(design, response)} または sim(glm(response~factor1+factor2*factor3, family=poisson), p.values=list(factor1=0.05, factor2=0.05, factor3=0.50, factor2:factor3=0.05), levels=list(factor1=1:10, factor2=c("A", …

4
勾配ブースティングマシンの精度は、反復回数が増えると低下します
caretR のパッケージを介して勾配ブースティングマシンアルゴリズムを試しています。 小さな大学入学データセットを使用して、次のコードを実行しました。 library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine algorithm. ### set.seed(123) fitControl <- trainControl(method = 'cv', number = 5, summaryFunction=defaultSummary) grid <- expand.grid(n.trees = seq(5000,1000000,5000), interaction.depth = 2, shrinkage …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

4
理想的な実験を作成できないときに何をすべきかについての教科書/読書?
私の統計トレーニングは数学統計に根ざしており、これらのメソッドクラスをMSで受講することは、現時点では少しショックです。私は業界での経験が不足しているため、これらの「適用された」方法のいくつかを理解することは現在困難です。 私のメソッドクラスで私たちが話してきたトピックの1つは、実験計画のアイデアです。 たとえば、K-12の生徒のテストスコアを上げると主張する教育プログラムの有効性に関する実験を行いたいとします。 メソッドのクラスでは、こうした問題を追求するために次のことを教えました。適切な研究質問、適切なデータ収集方法、ランダム化実験、均質な治療グループ(つまり、このプログラムで治療したグループ、ない)理想的には同じサイズで、その後、(またはある種のノンパラメトリック仮説検定)を実行すると、すべてうまくいきますよね?ttt 私は、これが実際にどのように機能するかについてはほとんど信じていません。 確かに、便利なサンプリングを行う必要があるかもしれないことを学びました。しかし、それ以外には、教科書から学んだこと以外に、実験計画をどのように実装するかわからない。 これらの問題を実際に探求する教科書や読み物などはありますか(そして理想的には、数学に目を光らせないでください-すべての詳細な証拠は必要ありませんが、すべてが「明らか」、例えば)?

3
フィッシャーはこの引用で何を意味しますか?
私はこの有名な引用を随所に見ていますが、強調された部分を毎回理解するのに失敗しています。 習慣が慣例であるため、有意性が1%以上の場合、仮説を暫定的に「拒否」する人は、そのような決定の1%未満と間違います。仮説が正しいとき、彼はこれらのケースのわずか1%で間違えられ、それが間違っているとき、彼は拒絶で決して間違われません。[...]しかし、計算はとてつもなくアカデミックです。実際、科学者は毎年一定の重要性レベルを持たず、あらゆる状況で仮説を拒否します。彼はむしろ、彼の証拠と彼の考えに照らして、それぞれの特定の事件に心を向けています。テストを適用するために選択されたケースが明らかに高度に選択されたセットであり、選択条件が単一のワーカーであっても指定できないことを忘れてはなりません。また、使用された議論では、特定の試験で示された実際の重要性のレベルを、まるで彼の生涯の習慣であるかのように選択することは明らかに違法であるとは言えません。 (統計手法と科学的推論、1956、p。42-45) 具体的には、わかりません テストを適用するためにケースが「高度に選択」されているのはなぜですか?エリア内の人々の平均身長が165cm未満かどうか疑問に思って、テストを実施することにします。私が知る限り、標準的な手順は、領域からランダムなサンプルを取り出し、その高さを測定することです。これはどのように高度に選択できますか? ケースが高度に選択されていると仮定しますが、これは有意水準の選択にどのように関連していますか?もう一度上記の例を考えてみましょう。サンプリング方法(フィッシャーが選択の条件と呼んでいるものと思われるもの)が歪んでおり、背の高い人を何らかの形で好む場合、研究全体が台無しになり、有意水準の主観的な決定はそれを保存できません。 実際、「特定の試験で示された実際の有意水準」が何を指しているのかさえ、私には分かりません。それはその実験のppp値、有名な0.05のような(in)有名な値、または何か他のものですか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.