NYTimesでの統計的手法の誤用に関する記事
この記事を参照しています:http : //www.nytimes.com/2011/01/11/science/11esp.html 次の実験を検討してください。コインが頭に向かってわずかに重くなっていると信じる理由があると仮定します。テストでは、コインは1,000回のうち527回出てきます。 これは、コインが重み付けされているという重要な証拠ですか? 古典的な分析はイエスと言います。公正なコインでは、1,000回のフリップで527以上のヘッドを獲得する可能性は、従来のカットオフの20分の1、つまり5パーセント未満です。別の言い方をすれば、この実験では、「95%の信頼度で」重み付きコインの証拠を見つけます。 しかし、多くの統計学者はそれを購入しません。20分の1は、1,000スローで526を超える任意の数のヘッドを獲得する確率です。つまり、フリップする確率527、フリップする確率528、529などの合計です。 しかし、実験ではその範囲内のすべての数値が見つかりませんでした。このように、これらの専門家によると、コインに重みが付けられている場合、その数字を取得する確率を計算し、コインが同じ場合に同じ数字を取得する確率と比較する方が正確です。公正。 統計学者は、心理学者のジェフ・ルーダーとともに例を提供した統計学者のポール・スペックマンによると、この比率は約4対1より高くできないことを示すことができます。 最初の質問:これは私にとって新しいことです。誰かが正確な計算を見つけることができるリファレンスを持っていますか、および/またはあなた自身に正確な計算を与えることで私を助けることができますか、および/または同様の例を見つけることができるいくつかの資料を教えてくれますか? ベイズは、新しい証拠が登場すると、仮説の確率を更新する方法を考案しました。 そのため、特定の発見の強度を評価する際に、ベイジアン(BAYZ-ee-unと発音)分析では、既知の確率が組み込まれています(利用可能な場合)。 「うん、正しい」効果と呼ばれることもあります。キンカンが心臓病のリスクを90%低減すること、治療により1週間でアルコール中毒が治まること、敏感な親が男の子よりも女の子を産む可能性が2倍高いことが研究でわかった場合、ベイジアンの反応はネイティブの懐疑論者:ええ、そうです。この調査結果は、世界で観察可能なものと比較検討されます。 医学の少なくとも1つの分野-診断スクリーニングテスト-では、研究者は既知の確率を使用して新しい発見を評価しています。たとえば、新しい嘘発見テストの精度は90%で、10のうそつきのうち9のうそつきに正しくフラグを立てることができます。しかし、10人の嘘つきを含むことが既に知られている100人の人口に与えられた場合、テストはそれほど印象的ではありません。 10のうそつきのうち9を正しく識別し、1つを見逃します。しかし、他の90個のうち9個が嘘であると誤って識別されます。いわゆる真陽性(9)をテストでフラグが立てられた人の総数(18)で割ると、50%の正解率が得られます。「偽陽性」と「偽陰性」は、人口の既知の割合に依存します。 2番目の質問:新しい発見がこの方法で「本当」であるかどうかをどのように正確に判断しますか?そして:これは、事前に設定された事前確率を使用しているため、5%バリアのようにIs意的ではありませんか?