タグ付けされた質問 「fallacy」

30
一般的な統計上の罪とは何ですか?
私は心理学の大学院生であり、統計学でますます独立した研究を進めるにつれて、正式な訓練が不十分であることにますます驚いています。個人的な経験と中古の経験の両方は、学部および大学院の訓練における統計的厳密性の不足が心理学のどこにでもあることを示唆しています。そのため、私のような独立した学習者にとっては、「統計的罪」のリストを作成し、卒業生に標準的な実践として教えられた統計的実践を表にし、実際には優れた(より強力な、または柔軟な、または堅牢な、など)現代の方法または率直に無効であることが示されています。他の分野でも同様の状況が発生する可能性があることを予想して、分野間の統計的な罪のリストを収集できるコミュニティwikiを提案します。
227 fallacy 

10
平均対ギャンブラーの誤acyへの回帰
一方で、平均への回帰があり、他方でギャンブラーの誤acyがあります。 ギャンブラーの誤acyは、Miller and Sanjurjo(2019)によって定義されています。「ランダムシーケンスは反転の系統的傾向がある、つまり、同様の結果のストリークは継続するよりも終了する可能性が高いという誤った信念」。連続した時間は、次の試験で不釣り合いに尾を引く可能性が高いと考えられます。 私は前回のゲームで良好なパフォーマンスを達成しましたが、平均への回帰によると、おそらく次のゲームではパフォーマンスが低下するでしょう。 しかし、ギャンブラーの誤acyによると、次の2つの確率を考慮します。 20頭の確率、1尾= 0.520×0.5=0.5210.520×0.5=0.5210.5^{20} × 0.5 = 0.5^{21} 20頭の確率、その後1頭= 0.520×0.5=0.5210.520×0.5=0.5210.5^{20} × 0.5 = 0.5^{21} その後... 簡単な例を考えてみましょう。生徒のクラスは、科目で100項目の正誤テストを行います。すべての生徒がすべての質問をランダムに選択するとします。次に、各学生のスコアは、平均50の期待値を持つ、独立した同じ分布のランダム変数のセットの1つを実現します。 当然のことながら、一部の学生は50を大幅に上回り、一部の学生は偶然50を大幅に下回ります。学生の上位10%のみを取得し、2番目のテストを行って、すべてのアイテムで再びランダムに選択すると、平均スコアは再び50に近くなると予想されます。 したがって、これらの学生の平均は、元のテストを受けたすべての学生の平均にまで「回帰」します。学生が元のテストで得点したものに関係なく、2番目のテストで得点の最高の予測は50です。 特別に10%の学生のトップスコアのみを取得し、すべてのアイテムで再びランダムに選択する2回目のテストを行うと、平均スコアは再び50に近くなります。 ギャンブラーの誤acyによると、得点の確率は同じで、必ずしも50に近いとは限らないと思われますか? Miller、JB、およびSanjurjo、A.(2019)。サンプルサイズを無視した場合の経験によるギャンブラーの誤Fallの確認方法

6
探索的データ分析におけるテキサスの狙撃兵の誤acy
私はNatureでこの記事を読んでおり、データ分析の文脈でいくつかの誤ciesが説明されています。テキサスの狙撃兵の誤acyを避けるのが特に難しいことに気付きました。 データ分析中に待機するコグニティブトラップは、テキサスのシャープシューターのf話で説明されています。納屋の横でランダムなパターンの弾丸を発射し、最大の銃弾の穴の周りにターゲットを描き、誇らしげに指さす彼の成功。 彼のブルズアイは明らかに笑えますが、勝ちの連続があるときに「ホットハンド」を信じるギャンブラーや、宝くじがすべて奇数になると超自然的な意味を見る人々にとって、誤acyはそれほど明白ではありません。 また、研究者にとって常に明らかではありません。「データからある程度の励ましを得てから、これが下降する道だと考えてください」とパシュラーは言います。「27種類の選択肢があることに気付いていないので、最も納得のいく、または面白い結果が得られるものを選んだので、今ではデータの偏りのない表現に取り組んでいます。」 ある種の探査作業は一般的であり、多くの場合、仮説は分析のその部分に基づいて構築されると思います。このプロセス専用のアプローチ(EDA)があります。 統計学者がデータを調査し、新しいデータの収集と実験につながる可能性のある仮説を立てることを奨励するために、John Tukeyが探索的データ分析を推進しました。 仮説を事前に持たずに実行された探索プロセスは、偽の仮説を生成する傾向があるようです。 上記のEDAの説明が実際に話していることに注意してくださいnew data collection and experiments。新しいデータが収集された後、確認データ分析(CDA)が適切であることを理解しています。ただし、この区別は非常に明確ではないと思います。EDAとCDAの分離は理想的ですが、確かにこれが実行不可能な状況もあります。この分離に従うことは厳密には一般的ではなく、ほとんどの開業医はEDAパラダイムにまったく加入していないと言えます。 だから私の質問は次のとおりです。EDA(またはデータを調査する非公式なプロセス)は、テキサスの狙撃兵の誤fallに陥る可能性を高めますか?
23 eda  fallacy 

4
統計情報に基づいて間違った決定が行われた戦争の物語?
統計は応用科学であると言うのは公平だと思うので、平均と標準偏差を計算するとき、それは誰かがそれらの数値に基づいていくつかの決定をしようとしているからです。 優れた統計学者の一部は、サンプルデータが信頼できる場合、および何らかの統計テストが興味のある真のデータを完全に誤って伝えている場合に、「感知」できることを望みます。ビッグデータセット統計と確率理論を再学習していますが、これまで見てきたすべての本は、舞台に上がってたくさんのことを言う政治家のようなものだというこのしつこい気持ちを揺るがすことはできませんスピーチの最後の次の免責事項: さて、これは良いことでも悪いことでもありませんが、数字は良いと言っているので、とにかく投票してください。 たぶんあなたはそれを得るが、多分そうではないので、ここに質問があります。統計学者による戦争の話はどこで見られますか?いくつかの決定は、後で完全に間違っていることが判明した統計情報に基づいていますか?

2
分散の線形性
次の2つの式が当てはまると思います。 V R(X )= 2 V R(X )Var(aX)=a2Var(X) \mathrm{Var}(aX)=a^2 \mathrm{Var}(X) に一定数である V R(X + Y )= V R(X )+ V R(Y )Var(X+Y)=Var(X)+Var(Y) \mathrm{Var}(X + Y)=\mathrm{Var}(X)+\mathrm{Var}(Y) 場合、XXX、 YはYY独立しています ただし、以下の何が問題なのかわかりません。 V a r(2 X )= V a r(X + X )= V a r(X )+ V a r(X )Var(2X)=Var(X+X)=Var(X)+Var(X)\mathrm{Var}(2X) = \mathrm{Var}(X+X) = …

1
帰無仮説の棄却がなぜ検察官の誤りのケースではないのですか?
これが私の理解です: p値-調査質問の帰無仮説(H0)が真の場合に、観測された、またはより極端な結果を見つける確率 つまり、p-valueです。ここで、p値が特定のしきい値()を下回ると、帰無仮説を棄却します。=P(evidence/nullhypothesis)=P(evidence/nullhypothesis)=P(evidence/nullhypothesis)alphaalphaalpha 私はここで非常に基本的な何かを見逃していることを知っていますが、検察官の誤謬を犯した場合ではなく、帰無仮説が真実であるという証拠である可能性が低いことに基づいて帰無仮説を拒否するのはどうですか?
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.