彼らがあなたに矛盾する結果を与えるとき、どちらがより良い研究であるかを検出する方法は?


11

あなたはしばしば方向性が逆の結果を結論付ける様々な研究に新聞に出くわします。それらは、新しい処方薬のテストや特定の栄養素のメリットなど、その問題に関連している可能性があります。

そのような2つの研究が矛盾する結果に達したとき、2つのうちどちらが真実に最も近いかをどのようにして知ることができますか?


たぶんこれはCWでしょうか?この質問に対する固有の答えはなく、複数の視点とアプローチが現れる可能性があります。
whuber

2
@whuber私はCWに反対票を投じるでしょう。たとえ異なる見方があっても、最善のアプローチが1つある可能性が高いからです。これは、異なるフレームワーク/モデルを使用して同じ仮説をテストする方法と似ていますが、最善のアプローチが1つあると考えられます。

@スリカント:どんな特定の場合でも、あなたはあなたの主張をサポートする強力な防御を築くことができると想像できます。ただし、一般的には、これが現在の状況ですが、最良の答えはコンテキストによって異なります。単純な(そして不完全な)例として、設計された物理実験のペアの評価(歴史的に信頼区間のほとんどが真実を逃した光速の測定など)と社会科学の観察研究の違いを検討してください。
whuber

@whuber多分、メタでこの会話を続けるべきです。私はCWをいつ使うべきか、いつすべきでないかについてまだ曖昧であることを認めます。この質問に対する最良の答えは、答えは状況依存であり、いくつかの例を通じて理由を説明することです。いずれにせよ、この質問はCWにすべきではないと私はどういうわけか感じますが、私は上記で概説したもの以外の理由をこれ以上明確に述べることはできません。

回答:


3

2つの実験的研究または実際のメタ分析を調べている場合は、Jeromyの答えで十分だと思います。しかし、多くの場合、私たちは2つの非実験的研究の調査に直面し、これら2つの異なる結果の妥当性を評価する任務を負っています。

以下のような質問のサイラスの食料品のリストを示唆して、トピック自体は短い応答に従順ではなく、全体の本は、このような問題に対処することを目的とした本質的にあります。非実験的データの研究に関心のある方は、ぜひお読みください。

ウィリアムR.シャディッシュ、トーマスD.クック、ドナルドトーマスキャンベルによる一般化された因果推論のための実験的および準実験的なデザイン(このテキストの古いバージョンも同様に優れていると聞きました)。

Jeromyが言及したいくつかの項目(より大きなサンプルサイズとより優れた方法論的厳密さ)、およびCyrusが言及するすべてのものは、Campbell and Cookが「内部有効性」と呼ぶものと見なされます。これらには、XとYの関係を評価するために使用される調査計画と統計手法の側面が含まれます。特に、批評家として、結果にバイアスをかけ、結果の信頼性を低下させる可能性のある側面について懸念しています。これは統計分析に特化したフォーラムであるため、回答の多くは統計的手法に集中しており、評価している関係の偏りのない見積もりを保証します。しかし、それらは統計分析に関係のない研究設計の他の側面であり、統計分析でどのような厳密な長さを行っても、調査結果の妥当性が低下します(Cyrusの実験忠実度のいくつかの側面に関する言及などは対処できますが、解決できません)統計的方法、およびそれらが発生した場合は常に研究結果の有効性が低下します)。ここに記載されていない非実験的研究の結果を比較する際に評価することが重要になる内部妥当性の他の多くの側面と、調査結果の信頼性を区別できる研究デザインの側面があります。ここで詳しく説明するのはあまり適切ではないと思います。

キャンベルとクックは、研究の「外部的妥当性」にも言及しています。研究デザインのこの側面は、範囲がはるかに小さいことが多く、内部の妥当性ほど注目に値しません。外部有効性は本質的に調査結果の一般化可能性を扱います。私は、一般の人が主題に精通している限り、妥当性を評価できることが多いと思います。短編小説は、シャディッシュ、クック、キャンベルの本を読んだ。


8

メタ分析の文献は、あなたの質問に関連しています。メタ分析手法を使用して、研究全体でプールされた関心の効果の推定値を生成できます。このような手法は、多くの場合、サンプルサイズの観点から研究に重みを付けます。

メタ分析コンテキスト内で、研究者は固定効果モデルと変量効果モデルについて話します(HunterおよびSchmidt、2002を参照)。固定効果モデルは、すべての研究が同じ母集団効果を推定していることを前提としています。変量効果モデルでは、推定される母集団効果が研究によって異なると想定しています。通常、変量効果モデルがより適切です。

特定の関係に注目する研究が増えるにつれて、より洗練されたアプローチが可能になります。たとえば、知覚される品質などのさまざまなプロパティの観点からスタディをコード化し、効果のサイズがこれらのスタディの特性によって異なるかどうかを経験的に調べることができます。質を超えて、関係を緩和するであろう研究間にいくつかの理論的に関連する違いがあるかもしれません(例えば、サンプルの特徴、投与量レベルなど)。

一般的に、私は研究を信頼する傾向があります:

  • より大きなサンプルサイズ
  • より方法論的な厳密さ
  • 確認オリエンテーション(たとえば、100の異なる栄養素と50の健康転帰との相関関係をテストした研究ではない)
  • 利益相反がない(例:関係を示すことに商業的利害関係がある会社ではなく、有意な結果を見つけるインセンティブを持つ研究者ではない)

しかし、それは矛盾する研究結果のもっともらしい説明として、無作為抽出と研究間の理論的に意味のある差異を維持する必要があると述べた。


メタ分析で証拠を集計する手段として、特に尤度比が好きです。各研究についてそれらを計算するのに十分なデータがある場合は、研究全体にわたって積を計算して、仮説に対する/に対する仮説に対する集計証拠を表すだけです。
マイクローレンス、

Cyrusの回答の後、メタ分析の(ir)妥当性についてコメントしましたが、他のすべて、特に箇条書きの点について、この回答を支持しました。
whuber

@whuber @Gaetanの質問は、1つの研究が真実に近いと仮定しています。メタアナリシスフレームワーク内のスタディ間の結果のばらつきを一歩一歩先に進め、スタディは同等の品質である可能性を認めますが、ランダムサンプリングまたは実質的な違いが説明である可能性があることを認めます。
Jeromy Anglim

@whuber 2つの研究があっても、関心のある効果のメタ分析による推定を作成することは可能です。もちろん、効果の推定値の信頼区間は大きくなる可能性があります。しかし、2つの研究しか実施されておらず、それらが矛盾する結果をもたらしている場合、高度の不確実性が予想されます。
Jeromy Anglim

5

潜在的なバイアスまたはターゲット母集団の変動があるかどうかソースを精査するまで、メタ分析の検討は控えます。これらが治療効果の研究である場合、治療はランダムに割り当てられましたか?プロトコルからの逸脱はありましたか?違反はありましたか?不足している結果データはありますか?同じフレームからサンプルが抽出されましたか?参加の拒否はありましたか?実装エラー?標準誤差は正しく計算され、クラスタリングを説明し、さまざまなパラメトリック仮定に対してロバストでしたか?あなたがこれらの質問に答えた後でないと、メタ分析の問題が問題に入り始めないと思います。2つの研究について、英雄的な仮説を立てる意思がない限り、メタ分析が適切であることはまれです。


しかし、これらのステップはすでにメタ分析の一部ではありませんか?
10

3
@chl:正しいですが、重要なのは、これらのステップが質問の本質に到達することです。メタ分析は、2つだけではなく多くの研究があり、それらのメリットがすでに慎重に評価されている場合にのみ役立ちます。私たちの前の質問は、最初に、1つの研究または2つの矛盾する研究の質をどのように評価するかについて本当に尋ねています。Cyrusはこれの多くの側面のいくつかを指摘しました。合理的な治療には通常、大学レベルの研究の1〜2学期が必要です。この観点から、彼の「英雄的」という言葉の使い方は少々控えめだと思います。
whuber

1
@whuberはい、あなたと@Cyrusに同意します。もちろん、以前の研究の質と信頼性を評価することは必須の手順です(M​​Sに情報がないために著者に連絡する必要がある場合は特に、すべての研究を確認するには時間がかかります)。これはメタ分析の一部だと思っただけで、「統計的な部分」は信頼できる結果の定量的な要約をもたらすことになります。
2010
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.