タグ付けされた質問 「experiment-design」

変化が存在する場合の情報収集演習の構成方法の研究。

4
DoEについてのFisherの引用の実例
私のチームと私は、会社の非統計学者に実験計画の有用性についてプレゼンテーションをしたいと思います。これらの非統計学者もクライアントであり、通常、データを収集する前に相談することはありません。フィッシャーの有名な引用をよく説明する実際の例を知っていますか?「実験が終わった後に統計学者を呼ぶことは、死後検査を行うよう彼に頼むことだけであるかもしれません。の。" ?できれば、産業/製薬/生物学の文脈でイラストを探しています。予備的に適切に設計されていれば成功したかもしれない決定的でない統計分析の例を考えますが、他の可能な例もあるかもしれません。

3
事前に述べられている場合、サンプルサイズを動的に増やしても大丈夫ですか?
私は、被験者内設計で、ある刺激のメリットと別の刺激のメリットに関する研究をしようとしています。研究の一部の順序効果(タスクタイプの順序、刺激の順序、タスクセットの順序)を減らすように設計された順列スキームがあります。置換スキームは、サンプルサイズを8で割り切れるように指定します。 サンプルサイズを決定するには、野心的な推測(私の分野では伝統的)を行うか、希望する検出力のサンプルサイズを計算する必要があります。問題は、私が観察しようとしているエフェクトサイズの大きさの手掛かりがほとんどないことです(これも私の分野では良い伝統です)。これは、電力計算が少し難しいことを意味します。一方で、サンプルサイズが小さすぎるか、参加者に多額のお金を払ってラボで時間を費やしすぎる可能性があるため、ワイルドな推測をするのも悪いかもしれません。 2つのp値のコリドーを残すまで、8人のバッチで参加者を追加することを前もって述べても大丈夫ですか?例:0,05 <p <0,30?または、他にどのようにお勧めしますか?

1
GBMパッケージとGBMを使用したキャレット
私はを使用してモデルのチューニングを行ってきましたがcaret、gbmパッケージを使用してモデルを再実行しています。caretパッケージが使用gbmし、出力が同じである必要があることは私の理解です。ただし、を使用した簡単なテスト実行でdata(iris)は、評価指標としてRMSEとR ^ 2を使用したモデルで約5%の不一致が示されています。を使用して最適なモデルのパフォーマンスを見つけたいが、部分的な依存関係プロットを利用するためにcaret再実行しgbmます。再現性のために以下のコード。 私の質問は次のとおりです。 1)これらの2つのパッケージは同じであっても違いがあるのはなぜですか(確率的ですが、5%がやや大きな違いであることがわかります。特に、次のような素晴らしいデータセットを使用していない場合 iris、モデリングの) 。 2)両方のパッケージを使用する利点または欠点はありますか? 3)無関係:irisデータセットを使用した場合、最適な値interaction.depthは5ですが、読み取り値が最大値floor(sqrt(ncol(iris)))である2 を超えるはずです。これは厳密な経験則ですか、それとも非常に柔軟ですか。 library(caret) library(gbm) library(hydroGOF) library(Metrics) data(iris) # Using caret caretGrid <- expand.grid(interaction.depth=c(1, 3, 5), n.trees = (0:50)*50, shrinkage=c(0.01, 0.001), n.minobsinnode=10) metric <- "RMSE" trainControl <- trainControl(method="cv", number=10) set.seed(99) gbm.caret <- train(Sepal.Length ~ ., data=iris, distribution="gaussian", method="gbm", trControl=trainControl, verbose=FALSE, tuneGrid=caretGrid, metric=metric, bag.fraction=0.75) …

3
実験計画の潜在的な混乱
質問の概要 警告:この質問には多くの設定が必要です。どうか我慢してください。 私と私の同僚は、実験計画に取り組んでいます。このデザインは、以下にリストする多数の制約を回避する必要があります。制約を満たし、関心のある効果の公平な推定値を提供する設計を開発しました。しかし、私の同僚は、設計に混乱があると考えています。この点については、解決に至らずに吐き気を催しているので、この点については外部の意見をお願いします。 この研究の目標、私たちの制約、潜在的な混乱、およびこの「混乱」が問題ではないと私が考える理由を以下に説明します。各セクションを読むときに、私の全体的な質問に留意してください。 私が説明するデザインには混乱がありますか? [この実験の詳細は変更されましたが、私の質問をするために必要な必須要素は同じままです] 実験目標 白人男性によって書かれたエッセイが、白人女性、黒人男性、または黒人女性によって書かれたエッセイよりも有利に評価されるかどうかを判断したいと思います(エッセイ著者変数)。また、高品質または低品質の助成金(品質変数)で見つかったバイアスがより多く現れるかどうかを判断したいと考えています。最後に、12の異なるトピック(トピック変数)について書かれたエッセイを含めたいと思います。ただし、実質的に重要なのは最初の2つの変数のみです。トピックは論文ごとに異なる必要がありますが、トピックごとに評価がどのように異なるかに実質的に関心はありません。 制約 参加者の数と収集できるエッセイの数には制限があります。その結果、オーサーシップは参加者間で完全に操作することも、エッセイ間で完全に操作することもできません(つまり、各エッセイは複数の条件に割り当てられなければなりません)。 各エッセイには白人男性、白人女性、黒人男性、黒人女性のバージョンがありますが、各エッセイは高品質と低品質のいずれかで、1つのトピックのみになります。または、この制約を別の方法で言えば、エッセイ内で品質やトピックを操作することはできません。これらは特定のエッセイに固有の特性であるためです。 疲労のため、特定の参加者が評価できるエッセイの数には制限があります。 特定の人が読むエッセイはすべて、単一のトピックに関するものでなければなりません。言い換えると、各参加者が同様のトピックのエッセイのみを読むようにする必要があるため、エッセイを完全にランダムに参加者に割り当てることはできません。 エッセイの多くは黒人または女性の著者によって書かれているため、実験の目的について参加者に疑わせたくないので、各参加者は、白人ではない男性著者によって執筆されたと思われるエッセイを1つしか表示できません。 提案された設計 私の提案する設計では、最初に各エッセイを4つの異なる著者バージョン(白人男性、白人女性など)に操作します。同様のトピックの4つのエッセイを使用して「セット」を定義します。各セットは、2つの高品質のエッセイと2つの低品質のエッセイで構成されます。各参加者は、下の図に示すように、所定のセットから3つのエッセイを受け取ります。各参加者は、自分が割り当てられた3つのエッセイのそれぞれに単一の評価を提供します。 潜在的な交絡 私の同僚は、上記の設計には混乱が含まれると考えています。問題は、高品質のエッセイが白人ではない男性作家による執筆に割り当てられた場合、常に1つの高品質のエッセイと1つの低品質のエッセイとペアになることです(エッセイ1については、参加者1-3を参照してください図で)。一方、同じエッセイが白人男性作家による執筆に割り当てられている場合、1つの高品質のエッセイと1つの低品質のエッセイが3回(エッセイ1、参加者4-6の場合)、2つの低品質のエッセイ3回(エッセイ1、参加者7-9の場合)。 低品質のエッセイにも同様の問題があります。低品質のエッセイに白人以外の男性著者がいる場合、常に低品質のエッセイと高品質のエッセイが表示されます(エッセイ3については、参加者7-9を参照)。ただし、同じエッセイに白人男性著者がいる場合、1つの高品質のエッセイと1つの低品質のエッセイで3回(エッセイ3、参加者10-12)、2つの高品質のエッセイで3回(エッセイ3、参加者1-3)。 上記のパターンが問題になる可能性があるのは、「コントラスト効果」の存在を仮定した場合です。具体的には、高品質のエッセイが1つの低品質のエッセイと1つの高品質のエッセイ(合理的な仮定)とペアリングされる場合よりも、2つの低品質のエッセイとペアリングされる場合の平均でより好意的に評価される場合、白人男性のエッセイは、著者以外の理由による白人女性、黒人男性、および黒人女性のエッセイ。 高品質のエッセイのコントラスト効果は、低品質のエッセイのコントラスト効果によってバランスがとれる場合とされない場合があります。つまり、2つの高品質のエッセイと対になった低品質のエッセイが特に不利に評価される場合とそうでない場合があります。とにかく、私の同僚の主張では、あらゆる種類のコントラスト効果の可能性により、白人男性によって書かれたエッセイが他の著者のエッセイよりも好意的に評価されるかどうかを判断するために、このデザインに問題が生じます。 潜在的な交絡が問題ではないと思う理由 私にとって重要なのは、コントラスト効果が存在する場合でも、白人男性のエッセイが他のエッセイとは異なる評価の程度を推定できるかどうか(つまり、興味のある効果を推定できるかどうか)です。そのため、コントラスト効果を含む50個のデータセットをシミュレートし、対象の効果をテストするモデルに適合するシミュレーションを実施しました。 特定のモデルは、エッセイ(各エッセイが複数の参加者によって評価される)および参加者(各参加者が複数のエッセイを評価する)のランダムインターセプトを含む混合効果モデルです。エッセイレベルには、人種、性別、およびそれらの相互作用のランダムな勾配が含まれ(両方の変数はエッセイ内で操作されます)、参加者レベルには品質のランダムな勾配が含まれます(参加者内で品質が操作されます)。関心のある効果は、人種、性別、人種と性別の間の相互作用、およびこれらの変数と品質のそれぞれの間の高次相互作用の効果です。このシミュレーションの目的は、データにコントラスト効果を導入すると、人種、性別、人種と性別の相互作用、これらの変数と品質の間の高次の相互作用。詳細については、以下のコードチャンクを参照してください。 シミュレーションによると、コントラスト効果の存在は、関心のある効果の推定値にバイアスをかけません。さらに、コントラスト効果のサイズは、設計の他の効果と同じ統計モデルで推定できます。私にとって、これはすでに、私の同僚によって特定された「コントラスト効果」が混乱ではないことを示唆しています。しかし、私の同僚は懐疑的なままです。 require(lme4) require(plyr) participant <- rep(1:12, 3) essay <- c(rep(1, 9), rep(2, 9), rep(3, 9), rep(4, 9)) quality <- ifelse(essay == 1 | essay == 2, …

2
2つのグループで風邪を引く確率を比較するためのテストとテスト
興味深い実験(残念ながらソースはありません)について、かなり尊敬される(人気のある)科学雑誌(ドイツのPM、2013年2月、36ページ)を読みました。直感的に結果の重要性を疑ったので、それが私の注意を引きましたが、提供された情報は統計的検定を再現するのに十分でした。 研究者は、寒い気候で寒くなると風邪をひく確率が高くなるのではないかと考えました。そのため、180人の学生のグループをランダムに2つのグループに分割しました。1つのグループは、足を冷水に20分間保持しなければなりませんでした。もう一人は靴を履き続けた。ちょっとおかしな操作だと思いますが、一方で私は医者ではなく、医者はおもしろいと思います。倫理的な問題は別として。 とにかく、5日後、治療グループの学生のうち13人は風邪をひいていましたが、靴を履いたグループでは5人しかいませんでした。したがって、この実験のオッズ比は2.87です。 サンプルサイズがかなり小さいことを考えると、この違いが大きいのではないかと思い始めました。そこで、2つのテストを実施しました。 最初に、正規近似を使用した比率の等価性の簡単なテスト。このテストは、で。私の推測では、これは研究者がテストしたものです。これは本当に重要なことです。ただし、このz検定は、通常の近似のために間違えない限り、大きなサンプルでのみ有効です。さらに、有病率はかなり小さく、これが効果の信頼区間のカバー率に影響を与えないのではないかと思います。z=1.988z=1.988z=1.988p=0.0468p=0.0468p=0.0468 2番目の試みは、モンテカルロシミュレーションと標準のピアソンカイ2乗の両方を使用したカイ2乗独立性検定でした。ここで、についての値を見つけます。p=.082p=.082p=.082 今では、結果についてそれほど安心しているわけではありません。このデータをテストするためのオプションが他にあるかどうか、2つのテストについてのあなたの考えは何か(特に、最初の重要なテストの仮定)

1
サンプリング変数を使用した混合効果モデルの設計
lme4実験計画の線形混合効果モデル(を使用)の式を指定しようとしていますが、正しく実行されているかどうかはわかりません。 設計:基本的には植物の応答パラメーターを測定しています。私は4つのレベルの治療と2つの灌漑レベルがあります。植物は16のプロットにグループ化され、各プロット内で4つのサブプロットをサンプリングします。各サブプロットで、15から30の間の観測値をとります(見つかった植物の数に依存します)。つまり、合計1500行あります。 当初、サブプロットレベルはサンプリングのためだけにありましたが、サブプロットごとに多くの変動があることがわかったので、モデルで(64レベル変数として)考慮に入れたいと思いました。 、同じプロット内でも(プロット全体のばらつきよりも大きい)。 私の最初のアイデアは、書くことでした: library(lme4) fit <- lmer(y ~ treatment*irrigation + (1|subplot/plot), data=mydata) または fit <- lmer(y ~ treatment*irrigation + (1|subplot) + (1|plot), data=mydata) あれは正しいですか?数式でプロットとサブプロットの両方のレベルを維持する必要があるかどうかはわかりません。固定効果は重要ではありませんが、ランダム効果は非常に重要です。

2
標準偏差が独立変数でスケーリングするレートを推定する
正規分布変数測定を行っている実験があります。YYY Y∼N(μ,σ)Y∼N(μ,σ)Y \sim N(\mu,\sigma) しかし、以前の実験は、標準偏差といういくつかの証拠が提供された独立変数のアフィン関数であるXを、すなわち、σσ\sigmaXXX σ=a|X|+bσ=a|X|+b\sigma = a|X| + b Y∼N(μ,a|X|+b)Y∼N(μ,a|X|+b)Y \sim N(\mu,a|X| + b) Xの複数の値でYをサンプリングすることにより、パラメーターおよびbを推定したいと思います。さらに、実験の制限により、Yの限られた数(約30〜40)のサンプルしか取得できず、無関係な実験上の理由から、Xのいくつかの値でサンプリングすることを好みます。これらの制約がある場合、aとbを推定するためにどのような方法が利用できますか?aaabbbYYYXXXYYYXXXaaabbb 実験の説明 これは、上記の質問をする理由に興味がある場合の追加情報です。私の実験では、聴覚と視覚の空間知覚を測定します。さまざまな場所からの聴覚的または視覚的なターゲットを提示できる実験設定があり、被験者はターゲットの知覚された場所Yを示します。上記のσとしてモデル化した離心率の増加(つまり| X |の増加)により、ビジョン*とオーディションの両方の精度が低下します。結局、aとbを見積もりたいXXXYYY|X||X||X|σσ\sigmaaaabbbビジョンとオーディションの両方のために、私は空間内のさまざまな場所にわたる各感覚の精度を知っています。これらの推定値は、同時に提示される場合に視覚的および聴覚的ターゲットの相対的な重み付けを予測するために使用されます(ここで提示される多感覚統合の理論と同様:http : //www.ncbi.nlm.nih.gov/pubmed/12868643)。 *中心窩空間と中心窩外空間を比較すると、このモデルは視覚に対して不正確であることがわかっていますが、私の測定値は中心窩空間にのみ制限されています。これはまともな近似です。

1
回帰モデルの変数の制御と研究デザインの変数の制御の違いは何ですか?
研究デザインで変数を制御する方が、回帰モデルでその場で制御するよりも、エラーを減らすのに効果的だと思います。 これら2つの「制御」のインスタンスの違いを正式に説明してもらえますか?エラーを削減し、より正確な予測を行う上で、それらはどれほど効果的ですか?

3
データマイナーのための実験計画のコース
私はデータマイニングに携わるコンピューターサイエンティストです。コンピューター科学者が体系的な実験計画と評価を行うのがかなり下手だと言うことは秘密ではありません-p値と信頼度推定の使用は高度であると考えられます:)。 コンピュータサイエンティストに優れた実験計画法を教えるための優れたコースや資料があるかどうか知りたい。これをより具体的にするために、次の情報を追加します。 このコースは、確率については合理的に理解していると考えられるが、統計のバックグラウンドが限られている大学院生を対象とする必要があります。 このコースでは、「制御されていない不自然な設定」での実験計画に焦点を当てる必要があります。つまり、基礎となる物理的なグラウンドトゥルースも、データ収集プロセスを制御する方法もありません(人間の被験者と同様)。もちろん、良いコースはファンダメンタルズに焦点を当てますが、このシナリオをかなりの方法で扱う必要があります。 計算要素はおまけですが、必須ではありません。私たちは多くのデータを扱いますが、必要に応じて自分で計算の問題を理解することができます。

2
サイコロのロールに影響を与えることができると言う精神病者のためのテストを設計する
私が友人を持っているとしましょう(彼を「ジョージ」と呼びましょう)、彼は彼の心を使ってサイコロの出目を制御できる(つまり、彼が考えている特定の数にサイコロが落ちる可能性が高くなります)と言っています。 科学的に厳密なテストを設計して、彼が実際にこれを実行できるかどうかを判断するにはどうすればよいですか?(もちろん、彼ができるとは本当に思っていませんが、テストを開始する前に、アメージングランディスタイルのテストの詳細に同意してほしいと思います。)(非常にありそうな)ポストテストの言い訳を減らしたい彼が思いつくだろうこと。 ここに私がこれまでに持っているものがあります: サイコロの物理的なローリングテクニック(サイコロ、シェーカーカップ、着陸面など)を決定する サイコロのX個のロールで構成される「テストセッション」を定義します。これは、1度に行うには十分に小さい必要がありますが、サイコロが公平に落ちたかどうか、または片方を優先したかどうかを95%〜99%の信頼度で(分析後に)判断するのに十分な大きさである必要があります 選択したサイコロでYセッションを実行し(ジョージからの影響なし)、「コントロール」として、サイコロが自分で「公正な」結果を表示することを確認します。 GeorgeとZセッションを実行します。それぞれの前に、個別のサイコロを振って、そのセッション全体でジョージが「集中する」数字を決定します。 結果をコンパイルして分析します。 ジョージは彼の悲惨なパフォーマンスのいくつかの言い訳をします。 だからあなたへの私の質問: 私の方法論全体に欠陥や問題はありますか?ジョージが反対する可能性が高いことは何ですか? D6を使用する必要がありますか?またはD20?それは重要ですか?同じように自信のある結果を出すには、より多くのフェースを持つダイでより多くのロールが必要になるでしょうか?それとも反対ですか?実際の考慮事項から、私は多くよりも少ないロールを好むでしょう:) X、Y、およびZの適切な値は何ですか?それらは完全に無関係ではありません。選択したXの値が1つのセッションの95%の信頼しか許さない場合、ジョージの影響がなくても、20セッションごとに1つが「失敗」する可能性があります。 個々のセッションの「成功」または「失敗」を定義するにはどうすればよいですか?(カイ二乗検定の詳細を通過するこの質問を見つけたので、それが私の評価方法だと思いますが、妥当な信頼しきい値とは何ですか?) テスト全体の「成功」または「失敗」を定義するにはどうすればよいですか?ジョージはたった1回のセッションで「勝つ」かもしれませんが、テスト全体に合格するには、Zセッションの何回をパスする必要がありますか? MS Excelスプレッドシートでこれらの結果を分析することになります。

5
研究計画の参考資料
統計についての平均的な(中央値?)会話では、このデータまたはそのタイプのデータを分析するこの方法またはその方法について話し合うことがよくあります。私の経験では、統計分析に関して特別な考慮を払った注意深い研究デザインはしばしば無視されます(生物学/生態学で働いている、これは一般的な出来事のようです)。統計学者は、収集されたデータが不十分な(またはまったく間違った)グリッドロックに陥ることがよくあります。ロナルドフィッシャーを言い換えると、彼らはデータについて死後の調査を余儀なくされ、その結果、仮に仮説が立てられたとしても、その結果はより弱いものになります。 上記の落とし穴を回避するのに役立つ幅広い方法(例:t検定、GLM、GAM、オーディネーション手法など)のために、成功した研究デザインを構築するために使用するリファレンスを教えてください。

2
データをテストセットとトレーニングセットに分割することは、純粋に「統計」の問題ですか?
私は機械学習/データサイエンスを勉強している物理学の学生なので、この質問が対立を開始することを意味しません:)ただし、物理学部のプログラムの大部分は、ラボ/実験を行うことであり、これは大量のデータを意味します処理と統計分析。しかし、物理学者がデータを処理する方法と、私のデータサイエンス/統計学習ブックがデータを処理する方法との間には、はっきりとした違いがあることに気づきました。 主な違いは、物理実験から得られたデータに回帰を実行しようとすると、回帰アルゴリズムがWHOLEデータセットに適用され、トレーニングセットとテストセットに分割されることがまったくないことです。物理の世界では、R ^ 2または何らかのタイプの疑似R ^ 2が、データセット全体に基づいてモデルに対して計算されます。統計の世界では、データはほとんどの場合80-20、70-30などに分割され、モデルはテストデータセットに対して評価されます。 このデータ分割を決して行わないいくつかの主要な物理実験(ATLAS、BICEP2など)もあるので、物理学者/実験家が統計を行う方法とデータ科学者が行う方法との間に、なぜそんなに頑固な違いがあるのだろうと思います。統計を行います。

3
特徴選択は、トレーニングデータのみ(またはすべてのデータ)で実行する必要がありますか?
特徴選択は、トレーニングデータ(またはすべてのデータ)に対してのみ実行する必要がありますか?私はGuyon(2003)やSinghi and Liu(2006)などのいくつかのディスカッションと論文を読みましたが、正しい答えについてはまだわかりません。 私の実験のセットアップは次のとおりです: データセット:50人の健康なコントロールと50人の病気の患者(病気の予測に関連する可能性のある200の機能)。 タスクは、利用可能な機能に基づいて疾患を診断することです。 私がすることは データセット全体を取り、特徴選択(FS)を実行します。今後の処理のために選択した機能のみを保持します テストとトレーニングに分割し、トレーニングデータと選択した機能を使用して分類子をトレーニングします。次に、分類子をテストデータに適用します(ここでも、選択した機能のみを使用します)。Leave-one-out検証が使用されます。 分類精度を取得する 平均化:1)〜3)をN回繰り返します。(100)。N=50N=50N=50 データセット全体でFSを実行するとある程度のバイアスが生じる可能性があることに同意しますが、私の意見では、平均化(ステップ4)中に「平均化」されるということです。あれは正しいですか?(精度の差異は)&lt;2%&lt;2%<2\% 1 Guyon、I.(2003) "An Introduction to Variable and Feature Selection"、The Journal of Machine Learning Research、Vol。1 3、pp。1157-1182 2 Singhi、SKおよびLiu、H.(2006)「分類学習のための特徴サブセット選択バイアス」、Proceeding ICML '06 Proceedings on the 23rd International Conference on Machine Learning、pp。849-856

1
観測48で革新的な異常値をARIMAモデルに組み込むにはどうすればよいですか?
私はデータセットに取り組んでいます。いくつかのモデル識別手法を使用した後、私はARIMA(0,2,1)モデルを思いつきました。 R detectIOのパッケージの関数を使用して、元のデータセットの48回目の観測で革新的な外れ値(IO)TSAを検出しました。 この外れ値をモデルに組み込んで、予測に使用するにはどうすればよいですか?Rではそれから予測を行うことができない可能性があるため、ARIMAXモデルを使用したくありません。これを行う方法は他にありますか? これが私の値です。 VALUE &lt;- scan() 4.6 4.5 4.4 4.5 4.4 4.6 4.7 4.6 4.7 4.7 4.7 5.0 5.0 4.9 5.1 5.0 5.4 5.6 5.8 6.1 6.1 6.5 6.8 7.3 7.8 8.3 8.7 9.0 9.4 9.5 9.5 9.6 9.8 10.0 9.9 9.9 9.8 9.8 9.9 9.9 9.6 9.4 …
10 r  time-series  arima  outliers  hypergeometric  fishers-exact  r  time-series  intraclass-correlation  r  logistic  glmm  clogit  mixed-model  spss  repeated-measures  ancova  machine-learning  python  scikit-learn  distributions  data-transformation  stochastic-processes  web  standard-deviation  r  machine-learning  spatial  similarities  spatio-temporal  binomial  sparse  poisson-process  r  regression  nonparametric  r  regression  logistic  simulation  power-analysis  r  svm  random-forest  anova  repeated-measures  manova  regression  statistical-significance  cross-validation  group-differences  model-comparison  r  spatial  model-evaluation  parallel-computing  generalized-least-squares  r  stata  fitting  mixture  hypothesis-testing  categorical-data  hypothesis-testing  anova  statistical-significance  repeated-measures  likert  wilcoxon-mann-whitney  boxplot  statistical-significance  confidence-interval  forecasting  prediction-interval  regression  categorical-data  stata  least-squares  experiment-design  skewness  reliability  cronbachs-alpha  r  regression  splines  maximum-likelihood  modeling  likelihood-ratio  profile-likelihood  nested-models 

3
変数のマッチングや統計的制御などの方法間のリンクは何ですか?
研究記事では、研究者が特定の変数を制御していることがよくあります。これは、マッチング、ブロッキングなどの方法で実行できます。 しかし、変数の制御は、影響を与える可能性のあるいくつかの変数を測定し、それらに対していくつかの統計分析を実行することによって統計的に行われるものであると常に思っていました。したがって、たとえば、独立変数と交絡変数を測定し、分析を行う調査やその他のテストを行うことができます。 準実験で変数を制御することは可能ですか? 変数のマッチングや統計的制御などの方法間のリンクは何ですか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.