非ランダムサンプルのランダム化


9

実験的な研究に参加する心理的な広告を見ると、いつも少し驚いています。確かに、これらの広告に反応する人々は無作為に抽出されるわけではないため、自己選択された集団です。

ランダム化によって自己選択の問題が解決されることがわかっているので、非ランダムサンプルのランダム化によって実際に何かが変化したのかどうか疑問に思いました。

どう思いますか ?また、自分で厳選したサンプルに基づいてこれらすべての心理実験を行うにはどうすればよいでしょうか。


回答:


10

非ランダムなサンプルのランダム化は、効果がランダムな変動によって合理的に説明されていないことを示す可能性があります。

たとえば、サイズがほぼ等しい2つの認識されないサブグループ(特性が多少異なる*)の母集団があるが、サンプルがランダムではなく、80/20に分割されているとします。同じサイズの2つの治療グループを想像してみましょう。無作為化(少なくともまともなサンプルサイズで)は、各グループでほぼ80/20に分割される傾向があるため、不均一なグループの治療への不均等な割り当てではなく、治療による治療効果がもたらされます。

*異なるベースライン手段につながる、と言う

問題は、サンプルが表すもの(セルフセレクター)以外のターゲット母集団に推論を拡張する場合に発生します。これには、証拠がない可能性のある仮定/引数が必要です(たとえば、母集団のすべてのサブセットで処理の違いが一貫していると仮定するなど)。

同様の状況で、標準的な治療やプラセボと比較して、男性だけで高血圧薬をテストすることを想像してみてください。男性が治療群に適切に無作為化されていると仮定します。治療効果は、男性の効果を実際に説明するという意味で現実的です。その推論を女性に拡張しようとするときに困難が来るでしょう。

したがって、彼らが採用とは別に適切に実施され、ランダム化されている場合、観察された有意な効果は見かけ上のものになりますが、実際にサンプリングしたものに適用されますが、必ずしも目的のターゲットではなかったため、2つの間のギャップを越える可能性があります注意深い議論が必要です。そのような議論はしばしば欠けています。

私が学生だったとき、心理学の実験が心理学の学生に対して行われることは非常に一般的でした。心理学の学生は、そのような実験を一定時間ボランティアすることが期待されていました実験を行う人)治療への無作為化により、推論は有効であったかもしれません(何が行われたかによって異なります)が、非常に遠く離れた(自分がサインアップする実験を一般に選択する)自己選択心理学の学部生の地元の人口に適用されるより広い集団のランダムなサンプル。


貧しい学部生を採用することはまだ慣行です。心理学の学生がそのような研究に参加することが期待されていることは、IMOの研究の完全性に対するひどい違反です。
StasK、2015

@StasK:なぜですか?以前はかなり面白いと思っていたので、それらに参加することで心理学の学生に役立つ見方ができると思います。
Scortchi-モニカを回復

1
うん、「イントロサイキプール」モデルはまだ健在です。@StasK、それを少し強制力を少なくするために、学生はいくつかの実験に参加するように求められ、彼らはどれを選ぶことができます。生徒がすべてをオプトアウトする方法もいくつかあると思います。
Matt Krause、2015

2
最近では、AmazonのMechanical Turk、Google消費者調査、その他の「クラウド」のことで人々は熱狂しています。これらは理論的には他のサブジェクトプールへのアクセスを提供しますが、そこにも多くの問題があります(「条件」ははるかに変化しやすく、サブジェクトのモチベーションが低下する可能性があります。 ...)。学部生はすぐそこにいて、実験をするためにかなりやる気があり、しばしば安く働きたいと思っています。
Matt Krause

@MattKrause:私の日、あなたはワインのボトルの抽選に参加しました-ボランティアの不足は決してありませんでした。
Scortchi-モニカを回復

6

ランダム化によって自己選択の問題が解決されることがわかっているので、非ランダムサンプルのランダム化によって実際に何かが変化したのかどうか疑問に思いました。

つまり、いいえ。このように考えてください。100個の黒いボールと100個の白いボールのつぼがあるとします。それから90個の黒いボールと10個の白いボールをサンプリングします。サンプリングランダムにこのサブサンプルからすると、あなたの壷自体の公平な推論を許可しません。

また、自分で厳選したサンプルに基づいてこれらすべての心理実験を行うにはどうすればよいでしょうか。

人々は、ランダムでないサンプリングが問題であることを認めています。しかし、問題の程度は、関心のあるメカニズムの「理論」の問題でもあります。仮説が、すべての人間にとって基本的に同じであるはずのメカニズムを扱っている場合(つまり、氷に浸されたときに凍るような感覚を経験する場合)水)、その場合、ランダムでない選択はそれほど重要ではありません。残念ながら、それは私たちが興味を持っていることではありません。


心理学者は「壁にボールを投げてボールを壊そうとしているのではなく、テーブルに置いてハンマーで打った場合、どちらの手順で分割する可能性が高いのか」などの質問をしています。彼らは、各色のボールの数についての推論を試みているのではなく、破壊モードについて、そのモードへのランダム化に関して推論を試みています。
StasK

必ずしもそうではありません。場合によっては(たとえば、ストループ効果)、目的はすべての人間に固有の認知メカニズムに一般化することです。処理を比較している場合でも、サンプル内のランダム化では、母集団に対して公平な推論を行うことはできません(これは私たちが興味を持っていることです)。
abaumann

1

ブートストラップとして知られている問題に対処するために設計されたテクニックがあります。ブートストラップは、実際のサンプルプールから置き換えて新しい合成サンプルを生成するアプローチです 次に、それらの各合成サンプルプールの統計を実行し、セット間の統計を比較します。

これらの合成サンプルは既知の分布に由来するため、これには統計で非常に多くの追加ツールを使用できるという大きな利点があります。次に、推定者がこれらの総合的なケースの処理にどの程度優れているかを判断できます。すべての合成サンプルの推定量が同じ結果にうまく収束していることがわかった場合、ブートストラップの仮定により、推定量が完全なサンプルに適用されたときに、未知の母集団の適切な推定値を提供していると推測できます。一方、推定量が合成サンプルセットと合成サンプルセットで非常に異なる結果になる場合は、推定量を完全なサンプルに適用すると、未知の母集団に対して非常に適切な推定値が得られない可能性があると推測する必要があります。

このブートストラップアプローチは、非ランダムサンプルのランダム化が十分かどうかを検証するために使用できます。もちろん、それを証明することはできませんが、ランダムサンプリングが十分にランダムであるという仮定を再確認して信頼性を高めるためのツールとして使用されています。


2
ブートストラップは、サンプルが母集団に非常に類似していることを前提としています。サンプルが母集団を代表していない場合、ブートストラップは役に立ちません。したがって、ブートストラップによって非ランダムサンプルの問題をどのように解決できるかわかりません。
穂高2015
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.