(一部の)擬似ランダム化の問題点


23

50歳以上の患者が誕生年までに擬似ランダム化された研究に出会いました。誕生年が偶数の場合、通常のケア、奇数の場合、介入。

実装が簡単で、転覆するのが難しく(患者が受けるべき治療を簡単に確認できます)、覚えやすい(割り当ては数年間続いた)。それでも、私はそれが好きではありません。適切なランダム化の方が良かったと感じています。しかし、その理由は説明できません。

私はそれを感じるのは間違っていますか、または「本当の」ランダム化を好む正当な理由がありますか?


1
サイトへようこそ!こちらで投稿をご覧ください。
アンディW

上記の回答により、私は誕生日までに「ランダム化」する方が良いと感じています!治療への奇数日、制御への日さえ...アダルベルト
AADF

6
点である主点、ミス@Adalberto 任意のグループに対象を割り当てる明確な、非無作為化手順は、ランダム化手順が有する望ましい特性を有することが保証できません。その後、そのような研究に何年も費やして、治療と生年月日の間の予期しないが強力な交絡因子をレビュアーに指摘してもらうとしますか?このような交絡をすべて予測することはできないため、ランダムな割り当てによって問題を回避します。
whuber

回答:


28

あなたは懐疑的であることが正しい。一般に、「本当の」ランダム化を使用する必要があります。これは、通常、関連する要因(観測不能)に関するすべての知識がないためです。それらの観察不能なものの1つが、年齢が奇数または偶数であると相関している場合、治療を受けたかどうかとも相関しています。この場合、治療効果を特定することはできません。観察される効果は、治療によるものか、観察されない要因によるものです。

これは、実際のランダム化では問題ではありません。処理と観測不能の間に依存関係はありません(もちろん、小さなサンプルの場合は存在する可能性があります)。

このランダム化手順が問題になる理由を説明するために、たとえばベトナム戦争が始まった17/18歳の被験者のみが研究に含まれていたと仮定します。17の場合、起草される機会はありませんでした(私が間違っている場合は修正してください)。18の機会はありましたが、チャンスが無視できず、戦争経験が人々を変えると仮定すると、数年後にこれら2つのグループ1年しか離れていなくても違います。おそらく治療(薬)は効かないように見えますが、ベトナムの退役軍人がいるグループだけがそれを受け取ったので、これは実際にはPTSDの人には効かないという事実(またはその他の要因ベテランであること)。つまり、治療効果を特定するには、治療を除く両方のグループ(治療とコントロール)が同一である必要があります。

したがって、グループ間に観察されていない違いがないことを除外できない限り(ただし、観察されない場合はどうすればよいでしょうか)、実際のランダム化が望ましいです。


ありがとう。いい例です。(私はそれを擬似ランダム化と呼ぶのを忘れていました、私はそれを質問で編集しました)。
ジェレミーマイルズ

2
(+1)私が質問を読んでいたとき、ベトナムはすぐに思いついた最初の例でした。あなたがまったく同じタックを取ったことを見るのは面白かったです。被験者の年齢が述べられていることを考えると、これは最も明白な選択だと思いますが、60代前半から60代の年齢は少し近いです。
枢機

トピック外のpingの謝罪:[ランダム化された実験]を[ランダムな割り当て]タグ(stats.meta.stackexchange.com/a/4651)の同義語にするメタに関する提案があります。この提案に投票するには、このタグに十分な評判があります:stats.stackexchange.com/tags/random-allocation/synonyms-通過するには4つの投票権が必要です。提案に同意しない場合は、Metaにコメントして理由を説明することを検討してください。このコメントはすぐに削除します。乾杯。
アメーバは、モニカを復活させる

18

時々逆張りの意見を支持するのは良い練習です。そのため、この形式の疑似ランダム化を支持するいくつかの理由を説明することから始めましょう 主に、フィールド内のグリッドのポイントで環境メディアのサンプルを取得したり、果樹園の他のすべてのツリーをサンプリングしたりするなど、体系的なサンプリングの他の形式とほとんど変わらないため、このサンプリングは同等の利点を享受できます。

ここでの類推は完璧です: ゼロの原点から始まり、年ごとに年齢が「グリッド化」され、グループへの割り当てがこの(1次元)グリッドに沿って交互に行われました。このアプローチのいくつかの利点は、フィールドまたは果樹園(この場合は年齢)全体にサンプルが広く均一に分散することを保証することです。これは、場所が応答の変動の主な要因であることを理論が示唆している場合に特に役立ちます。さらに、本当に小さなサンプルを除いて、あたかもデータ分析しますそれらは単純なランダムサンプルであり、誤差は比較的少ないものです。さらに、いくつかのランダム化が可能です。フィールドでは、グリッドの原点と方向をランダムに選択できます。本件では、偶数年が対照か治療対象かを少なくともランダム化できます。

グリッドサンプリングの別の利点は、局所的な変動を検出することです。 フィールドでは、これは異常な応答の「ポケット」になります。統計的には、それらを空間的相関の現れと考えるかもしれません 現状では、比較的狭い年齢層が異常な反応を経験する可能性がある場合、グリッド設計は優れた選択肢です。純粋にランダム化された設計は、いずれかのグループ内の年齢に大きなギャップを含めることができるためです。(しかし、より良い設計は、層化することです:年齢の平等を使用して2つの分析を形成し、各層内で独立して、患者をコントロールおよび治療グループにランダム化します。)

9実験に重要な要因に関連付けられます。これにより、問題の懸念は仮説よりも低くなります。それは現実です。この時点で、このスレッドの以前の回答は、私がやりたいと思う追加の考えをうまく提示しているので、停止して、それらを再読するように招待します。


(+1)特に、反論の設定について。
枢機

13

あなたが与える例はかなり無害であることに同意しますが...

関与するエージェント(介入を処理する人または介入を受ける人のいずれか)が割り当てスキームを認識すると、彼らはそれを利用することができます。このような自己選択は、ほとんどの実験計画で問題となる理由を明らかにする必要があります。

犯罪学で私が知っている1つの例はこのようになります。この実験は、国内紛争後の刑務所での夜の抑止効果をテストすることと、加害者に夜に去るように頼むことを目的としたものでした。役員にはシートの小冊子が渡され、上部の現在のシートの色は、どの処理を行うのかを識別するためのものでした。特定の事件で受け取ることになっていた。

最終的に起こったのは、役員が研究デザインに意図的に従わず、perpに何をすべきかについての個人的な好みに基づいてシートを選択したことでした。あなたの例では、少なくとも同様の年の混乱が疑われることは極端ではありません。


素敵な例、ありがとう、しかし、推論の一部は、混乱がはるかに難しいことでした-シートが黄色であると主張することはできませんでした
ジェレミーマイルズ

3
私は@JeremyMilesに同意します、それは二重盲検無作為化研究の別の理由です。これは、疑似ランダム化に対する意図された引数にすぎません-実際のランダム化よりも意図された処理を回避する方が簡単です。(私の例は、実際には疑似ランダム化の例ではありませんが、簡潔にポイントを示しています。)
アンディW

まあ、それは(真の)ランダム化がどのように行われたかに依存します-研究に関与した人々は、転覆に関する問題を避けるために部分的にそれをしました。実際のランダム化を使用する場合、ランダム化を決定する人が治療を提供する人と通信し、提供する人が正しいことを確実にするために、適切な記録保持が必要です。たとえば、家の番号(たとえば)を使用している場合、役員はランダムではありませんが、転覆するのに苦労している可能性があります。
ジェレミーマイルズ

1
トピック外のpingの謝罪:[ランダム化された実験]を[ランダムな割り当て]タグ(stats.meta.stackexchange.com/a/4651)の同義語にするメタに関する提案があります。この提案に投票するには、このタグに十分な評判があります:stats.stackexchange.com/tags/random-allocation/synonyms-通過するには4つの投票権が必要です。提案に同意しない場合は、Metaにコメントして理由を説明することを検討してください。このコメントはすぐに削除します。乾杯。
アメーバは、モニカを復活させる

0

ランダムな分布に基づく完全なランダム化は予測不可能です。あなたの場合、適格性確認の前にケースが介入またはコントロールに割り当てられるかどうかはわかっています。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.