信頼区間と確率-このステートメントのエラーはどこにありますか?


11

誰かが以下のような声明を出した場合:

「全体として、環境の煙にさらされた非喫煙者は、煙にさらされなかった非喫煙者と比較して、冠状動脈性心臓病の相対リスクが1.25(95%信頼区間、1.17〜1.32)でした。」

全体としての人口の相対リスクは何ですか?冠状動脈性心臓病に関連するものはいくつありますか?テストできる膨大な数の中で、実際に冠状動脈性心臓病に関連しているものはほとんどないため、ランダムに選択された特定のものが関連している可能性はほとんどありません。したがって、母集団の相対リスクは1であると言えますが、引用された間隔には値1が含まれていません。したがって、実際には2つのものの間に関連があり、その確率は非常に小さいか、またはこれは次のいずれかです。パラメータを含まない5%の間隔。後者は前者よりはるかに可能性が高いので、それは私たちが仮定するべきものです。したがって、適切な結論は、データセットがほぼ確実に母集団の非定型であったことです。

もちろん、5%以上が冠状動脈性心疾患に関連していると仮定する根拠がある場合、統計には、環境煙がその1つであるという示唆を裏付ける証拠がいくつかある可能性があります。常識では、これはありそうもないことです。

彼らの推論の誤りは何ですか(すべての保健機関は間接喫煙の有害な影響に関する重要な文献があることに同意しているので)?「検査できる膨大な数の中で、実際に冠状動脈性心臓病に関連しているものはほとんどない」という彼らの前提のせいですか?この文は、ランダムに選択された要因(すなわち、冠動脈疾患のリスクがある人が犬を何匹所有するか)に当てはまる可能性がありますが、先験的確率は、「任意のランダムな要因」よりも、受動喫煙および冠状動脈性心臓病の方がはるかに高いです。

これは正しい推論ですか?または他に何かありますか?


引用されたテキストは...ええと、引用のようです。これ、どこから来たの?:)
MånsT

ええ、それはウィキペディアからの引用です...誰かが「信頼区間」の記事にこれを追加しました。それは明らかに正しくないので私はそれを削除しようとしていますが、男は拒否します。「これは明らかに間違っている」のではなく、数学的に正しい理由が必要です。私はいくつかのアイデアを持っていますが、誰かが説明できるかどうか知りたかったここでエラーが正確に発生しています。これが正しかったならば、多くの研究が同様の理由で反論することができますので、
BYS2

3
それが少し引きずる場合、私は上に移動して手助けしようとします。彼の議論は明らかに虚偽であり、彼に議題があることを強く指摘しています。
エリック

3
多くの統計を使用しているが統計学者ではない物理学者として、私はその段落が本当に役に立たないことに気づきます。私は常に、おそらく誤って、95%clは、帰無仮説が真である場合、20回に1回、実験を繰り返すと95%レベルで有意な結果が得られることを意味すると考えていました(私の意見では、 99.9未満を使用しないでください。その投稿は、相関関係のある要素についてより重要な点のようであり、実際には専門家以外の人(または誰でも)をまったく助けません。
ボウラー2012

@エリック。ユーザーは靴下人形劇のかなり危険な歴史を持ち(いくつかのアカウントがあり、IP編集を使用します)、以前にブロックされています...彼の取引が何であるかわからない。しかし、トラブルメーカーのように見えます
BYS2

回答:


10

H0H1

H0H1

次に、真の値を含まない95%の信頼区間が得られる確率は5%であると述べて、以前のデータを更新します。これは事実ですが、帰無仮説の仮定の下で特定の間隔を取得する可能性はありません。彼が[1.17、1.32]の信頼区間を[100、200]の信頼区間とまったく同じように扱っていたことに注意してください。これは明らかに問題があります。

これはベイジアンアプローチにとって非常に重要です。1がゼロであるという仮定の下で、1を含む間隔を取得しない確率は5%ですが、その特定の間隔を取得する確率密度は異なります(それより小さくなります)。

H0H1

4番目の間違いは、実行する適切なアクションはデータを破棄することであると言うことです。彼の結果はデー​​タにさえ依存していないことに注意してください。彼の議論は、まったく同じアクションがどのデータに対しても行われたであろうことを暗示しています。興味深いリンクを見つけたが、それがまぐれであると疑われる場合、適切な科学的なことは、結果を再現することです。


ネストルの答えを拡張してくれてありがとう!簡単な質問ですが、「これは、帰無仮説の仮定の下で特定の間隔を取得するチャンスではありません」と述べました。帰無仮説の仮定の下で特定の間隔が得られる可能性を見つけたい場合は、ベイズ推定と信頼できる間隔を使用する必要がありますか?頻繁な信頼区間は、「区間に真の値が含まれる可能性」を示すだけです。ありがとうございました
BYS2

95%の頻出信頼区間は、構築された間隔の少なくとも95%に真の値が含まれるように構成されています。ここまでは順調ですね。これは、帰無仮説が真の場合に特定の信頼区間を取得する確率(または密度の値)を計算することもできると言われています。正確な場所には、帰無仮説が含まれているかどうかよりも多くの「情報」が含まれています。ベイズ推論を使用する場合、ヌルが真である確率に関連するため、その情報を捨てることは悪いことです。
エリック

おもちゃの例は次のようになります。ベイジアン推論、分布の形に推論したい場合。事前は2つの可能性を許可します。H1:分布は標準の標準です。H2:分布正規、平均= sd =1。分布の値のサンプルを使用して、事前分布を更新できます。値のサインのみが与えられた場合、以前の値を更新することもできますが、関連する情報を破棄したため、更新の情報は少なくなります。
エリック

6

これは、仮説検定に関連する非常に興味深い哲学的問題です(したがって、ここで説明するように、頻繁な設定では信頼区間も同様です)。

もちろん、調査できる多くの仮説があります-受動喫煙は冠状動脈性心臓病を引き起こし、飲酒はchdを引き起こし、犬を飼うことはchdを引き起こし、山羊座であることはchdを引き起こします...

これらの仮説のいずれかをランダムに選択すると、たまたま真であるという仮説を選択する確率は実質的にゼロになります。これは引用されたテキストの議論のようです-私たちがたまたま真の仮説をテストした可能性は非常に低いです。

しかし、仮説は無作為に選ばれませんでした。それは、冠状動脈性心臓病についての以前の疫学的および医学的知識によって動機付けられました。喫煙がどのようにして冠状動脈性心臓病を引き起こすかを説明する理論的なメカニズムがあるので、それらが受動喫煙にも有効であると考えることはそれほど難しくないと思われます。

引用の批判は、データセットが仮説のためにマイニングされる探索的研究に有効かもしれません。これが、このような "発見"を事実として受け入れない理由です。代わりに、新しい研究で結果を再現できるようにする必要があります。どちらにしても、引用で引用された論文はメタ研究であり、したがってこの問題の影響を受けません。

過去数世紀にわたって、予測された結果と観測された結果が比較され、理論によって動機付けられた仮説テストすることが経験的に見られてきました私たちがこの手順を信じているという事実が、医学、工学、科学において多くの進歩を遂げた理由です。これが私が自分のコンピュータでこれを書き、あなたがあなたのコンピュータでそれを読むことができる理由です。この手順が間違っていると主張することは、科学的方法に根本的に欠陥があることを主張することです-そして私たちはそうでないと言う多くの証拠を持っています。

この種の証拠を受け入れようとしない人が実際に受け入れるものはないのではないかと思います...


私は最後の前に本当にあなたの段落を取得しませんでした。「有意性検定」(たとえば、少なくとも極端なデータの確率の計算)を指しているのか、それとも本当に「仮説検定」(ベイジアン設定)を指しているのか?あなたが正しい質問をすると、それらのどれもうまくいかないと誰が言ったのですか?
ネストル

@ネストル:私はおそらくそれを違うように書いたはずです。私は統計的仮説検定について実際に発言しているのではなく、モデルの予測と実際のデータを比較すること(つまり、仮説が正しい場合は「検定」)が非常に効率的な方法であるように見えるという事実について観察していました理科。このCIに対する批判の中心には、この方法を受け入れたくないという思いがあります。引用で与えられた種類の引数は、すべての統計的手法に適用されます。すべての帰無仮説に対して事前確率がゼロであるため、何も信じません。
MånsT

6

冠動脈性心疾患の相対リスクが1である確率は、信頼区間のみに基づいて分析すると、非常に小さい可能性があると著者が言う理由が本当にわかりません。これは明らかに間違っています。私には、彼は頻繁に使用する設定を使用しているように見えますが、ベイジアン的に推論しています(これはかなり一般的です)。

H0:p(De|H0)Dep(H0|D)D

p(H0|D)p(D|H0)p(H0),
p(H0)H0

H0はないでしょう:受動喫煙とCHDの間にリンクはありませんか?帰無仮説は通常、効果がないという仮説であるためです。それとは別に、この答えをありがとう!
BYS2

うん、君のいうとおりだ!あなたが指摘するまで私はそれに気づきませんでした:-)。回答を編集します。
Nestor

3

このベイズ理論の推論には何かがあり(エリックによって非常に徹底的に分解されています)、実際、この考えは多くの医学的所見を再現できない理由を説明していますが、この特定の議論は、大槌のような考え方に当てはまります。

著者は、証拠を提供せずに2つのことを前提としています:煙への曝露が無作為に選択されたことと、世界で心臓疾患を引き起こすものはほとんどないことです。推論のこれらの緩い基準の下で、著者は何かが心臓病を引き起こすという結論を拒否することができます。あなたがする必要があるすべては断言することです:

  1. 仮説が無作為に選ばれたこと、そして
  2. その心臓病はゼロに近い原因を持っています。

これらの主張はどちらも議論の余地があります(そして、私の一般的な知識に基づいて、おそらく誤りです)。しかし、これらの前提が整っていれば、間接喫煙にさらされた人の100%が1年以内に心臓発作で死亡したことを観察したとしても、接続は隠れた、単一の「真の」原因との偶然の相関にすぎないと断言できます。 。


よろしくお願いします!はい、著者は間違いなく仮説が「ランダムに選ばれた」と仮定しましたが、これは正しくありません。
BYS2

-1

引用文の段落に明らかに問題があるとは思わないが、データを見たことがなく、数字を確認できない。ただし、それに続く2つの段落は非常に不明確です。

「全体的に、病的に肥満である非喫煙者は、正常な体重を有する非喫煙者と比較して、冠状動脈性心臓病の相対リスクが1.25(95%信頼区間、1.17〜1.32)であった」と述べたとします。誰か彼を疑う理由がありますか?


まあ、引用の最初の段落は、疫学研究の結論を引用した著者にすぎなかったので、何も問題はありません。次の数段落は、彼が疑わしい発言をする研究の信用を落とそうとしているところです。
BYS2、2012
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.