制御された実験で潜んでいる変数のどのような例が出版物にありますか?


11

本論文で:

潜む変数:いくつかの例 ブライアンL.ジョイナーアメリカ統計学者Vol。35、No。4、1981年11月227-233

ブライアン・ジョイナーは、「ランダム化は万能薬ではない」と主張しています。これは、以下のような一般的なステートメントとは対照的です。

適切に設計された実験には、独立変数と従属変数の間の観測された関係の説明として、研究者が無関係な変数を排除できる設計機能が含まれています。これらの無関係な変数は潜伏変数と呼ばれます。

引用はこの質問から取られたものであり、出典はありませんが、私の経験では、それは一般的な態度を表しています: 潜む変数と影響力のある観察の例

与えられた1つの例は、70年代のげっ歯類に対する赤色#40食用色素の安全性(特に発がん)をテストしたときに、ケージの位置の影響が研究を混乱させることがわかったということです。現在、私はげっ歯類の発がんについて研究している多くの雑誌の記事を読んだことがあり、この影響を制御していると報告している人を見たことがありません。

これらの研究の詳細については、こちらをご覧ください。 規制プロセスにおける統計のケーススタディ:FD&C Red No. 40実験。

ペイウォールされていないバージョンは見つかりませんでしたが、ここに抜粋があります:

1月の会議で、私たちは予備的な分析(14)を発表しました。これは、ケージ列とRE(細網内皮腫瘍)の死亡率との強い相関を示し、17%(下列)から32%(上列)(表2)。この強い関連性を性別、投与量グループ、ラックカラムまたは位置で説明することはできませんでした。その後の分析(18)では、ケージの位置(前と後)が非RE死亡率と相関している可能性があり、その位置が非RE死亡までの時間と相関していることが示されました。

私は特に医学文献の複製にこのような問題があるように思われることに特に関心がありますが、あらゆる分野の例を歓迎します。観察研究ではなく、無作為化対照実験の例に興味があることに注意してください。


興味のある問題からだけ、lukring変数はカウンファウンダー/交絡変数と同じですか?
tomka 2013

@tomka私は潜んでいる変数を予期しない交絡変数として定義します。
フラスコ

おかげで-この問題に関する私の意見は、予想される交絡因子(ケージの位置)を制御しない学者は、治療効果について欠陥のある可能性のある推論を行い、最適ではない研究を行うことです。潜んでいる変数は予期しないものであるため、制御することはできません。したがって、それらが発生した場合、それは不運の問題です。しかし、それらが観察された場合、問題は少なくなり、事後的に制御可能になります。危険なのは観察されていない、したがって未知の潜伏者です。これが疑われる場合は、感度分析をお勧めします。
tomka

@tomkaこれが私が報告されていることについて質問した理由です。実験には無作為化するとは考えられない多くのステップがあります。無作為化はおそらく無関係であり、そうするためには余分な労力が必要です(おそらく作業に毎日数時間を追加する)か、ラベル付けに誤りを犯す可能性があります。フィッシャーのお嬢様がお茶の試飲をする例では、すべての順序をランダム化すると、これは多くの前臨床実験ではあまり実用的ではありません。
フラスコ

ランダム割り当ての目的は、制御されていない変数のバランスを取ることではなく、それらにランダムな違いを作ることであることに注意してください。有意性検定の基本的なロジックは、ランダムな非制御変数が結果をもっともらしく説明できるかどうかの検定を提供することです。言い換えれば、研究は有効であるために潜伏変数を測定する必要はありません。
デビッドレーン

回答:


5

臨床研究のいくつかの例は無作為化後に発生する変数である可能性があります-無作為化はそれらからあなたをまったく保護しません。私の頭の上のいくつかは、可能性として挙げられているか、注目されています。

  • HIV予防のための自発的成人男性割礼後の行動の変化
  • RCTの治療群と対照群との間のフォローアップに対する差次的損失
  • より具体的な例としては、院内感染の防止に関する最近の「Universal Gowning and Glovingの利点」の調査がありますブログの解説はこちら、このペーパーはペイウォールの背後にあります)。介入に加えて、それが原因である可能性もあり、手指衛生率と患者とスタッフ/訪問者の間の接触率の両方が変化しました。

無作為化は、それらが無作為化後に発生するため、これらの効果のどれからも保護します。


3

これが、マイクロアレイデータで見つけた1つの例です。測定された発現は、「チップ」上の位置と強く相関していると報告されています。これは、サンプルの位置をランダム化するとラベリングエラーが発生する可能性が高くなるため、技術的な作業を行う人は、重要ではないと思われる場合はランダム化しないことを選択する可能性があるケースです。

実験単位の治療へのランダムな割り当ては、治療以外の要因が関連の原因である可能性を制御します(1,2)⁠。Illumina®やNimbleGenTMなどの一部のマイクロアレイプラットフォームでは、複数の生体サンプルを1つのチップにハイブリダイズできます。実験計画でバランスとランダム化が考慮されていない限り、チップとサンプルの位置の影響は、マイクロアレイ実験の精度と再現性に影響を与える可能性があります(4)。私たちの目的は、これらの影響の影響を交絡実験とランダム化実験で比較することでした。

イルミナプラットフォームを用いたマイクロアレイ実験計画におけるランダム化の重要性

Ricardo A. Verdugo、Christian F. Deschepper、およびGary A. Churchill。ジャクソン研究所、バーハーバー、ME 04609、Institut de Recherches Cliniques、モントリオール、QC、カナダ。


1

この質問をしたときに当初意図していたものとは少し異なる例があります。過去1年か2年は、ランダム化された実験からの効果の再現性の欠如の原因について心理学で進行中の議論を引き起こしています。この議論のバージョンは何年にもわたって表面化してきましたが、仮説の定式化、データの収集、データの分析、および結果の報告における心理学の標準である多くの実践を示す論文の発表以来、議論はより厳しくなりました研究者が任意に選択した仮説さえもサポートする結果を見つけられるようにします(元の論文では、研究者はこれらのプラクティスを使用して、ビートルズによる「ときは60だ」と聞くと人々が若いことを示しました)。

もちろん、問題の根本は、心理学(および他の科学)に蔓延している、刺激的で「公開可能な」新しい結果を得るための広範にわたるインセンティブ構造です。これらのインセンティブは、研究科学者がデータの偽造ほど明らかに「間違っている」わけではないにもかかわらず、偽陽性の結果の増加率につながる慣行を採用することを奨励しています。これらのプラクティスには以下が含まれます。

  1. 複数の非常に類似した従属変数のコレクション。元の仮説と最も一致する結果を生成する従属変数のみが報告されます。
  2. データ収集中、重要な結果を複数回テストし、重要性が得られたらデータ収集を停止します。
  3. 分析中、統計モデルに複数の共変量を含める。最終的な論文では、元の仮説と最も一致する結果につながる共変量の組み合わせのみが報告されています。
  4. 元の催眠術と一致しない結果につながる条件を削除し、これらの条件を紙に報告しない。

等々。

これらの場合の「潜む変数」は、肯定的で「公表可能な」結果を得たことに対して研究者に報酬を与えるインセンティブ構造であると私は主張します。実際、心理学にはすでにいくつか の注目を集めている結果があり(その多くは私の専門分野である社会心理学にあります)、再現に失敗しています。これらの再現の失敗は、心理学のサブフィールド全体に疑いを投げかけると多くの人が主張しています。

もちろん、誤検知を助長するインセンティブ構造の問題は、心理学に固有のものではありません。これは、すべての科学、したがってすべての無作為化比較試験に固有の問題です。

参考文献

Simmons、JP、Nelson、LD、およびSimonsohn、U(2011)。偽陽性心理学:データの収集と分析における未公開の柔軟性により、重要なものは何でも提示できます。 Psychological Science、17、1359-1366。

Nosek、BA、Spies、JR、およびMotyl、M(2012)。科学的ユートピア:II。出版可能性よりも真実を促進するためのインセンティブと実践の再構築。 心理学の展望、7、615-631。

ヨン、E(2012)。悪いコピー。 自然、485、298-300。

アボット、A。(2013)。紛争は社会心理学に新たな打撃を与えた。 自然、497、16。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.