データを収集または解釈するときに人間が作る最も一般的なバイアスは何ですか?


39

私はecon / stat専攻です。経済学者は、人間が合理的に振る舞わない状況を特定することにより、人間の行動と合理性に関する仮定を修正しようとしたことを知っています。たとえば、1000 ドルの損失の100%のチャンスまたは2500 ドルの損失の50%のチャンスを提供すると、後者の期待値が保証された1000 ドルよりも大きい損失であっても、人々は2500 ドルのオプションを選択します損失。これは「損失回避」として知られています。行動経済学者は現在、これらのパターンを研究し、通常「合理的な」行動を構成すると想定される公理から人間が逸脱する方法を特定しようとしています。ここでは、予想される最小の損失を優先することが合理的であると想定しています。

統計学者が、人々がデータをどのように解釈するかに偏った結果をもたらすデータ収集の一般的なパターンを特定したかどうか疑問に思っていました。本質的にデータを収集する「合理的な」方法があった場合、人間がこれから逸脱して「バイアス」を示す例があると思います。そうだとすれば、データを収集または解釈するときに人間が作る最も一般的なバイアスは何ですか?


5
Podsakoffらによる素晴らしい論文があります。その一般的な方法バイアス口コミ両方統計や手続きの救済策を提案している:ln.edu.hk/mkt/staff/gcui/CommonMethodBias.pdf表2を見てきた
アイハン


10
あなたは非合理性の非合理的な推定を持っています。結果にユーティリティ関数を適用できません。あなたの述べた例では、その人が1000 ドルを持っていると仮定して、今から1分後にギャングにローンを返済するために使用しなければならない、またはギャングによって殺されるでしょう。100%の確率で$ 50%の確率に対し、殺害されたのは100%の確率で、1000損失の結果$殺される50%の確率で2500年の損失の結果のみ。econ majorとして、不合理性を宣言する前に、出発点としてユーティリティに順応する必要があります。
マークL.ストーン

3
統計学者は通常、そのような研究を行いません。このQがPsychology&Neuroscience SEサイトにより適しているのではないかと思います。
GUNG -復活モニカ

3
街灯効果 - 街灯の下で失われたキー(データ)を探すことは、夜間に光があるため、特に今では非常に一般的で、タップするのが非常に簡単なデータだと思います。//データを収集する「合理的な方法」はありません。なぜなら、あなた-それを収集する研究者-は無作為化されていないからです。
AS

回答:


23

学界では、p値は非常に一般的に誤解されていると思います。人々はp値が条件付き確率を表すことを忘れがちです。実験が完全に行われ、選択された統計的テストのすべての要件が満たされていても、通常、誤検出率は有意水準アルファよりもはるかに高くなります。誤検出率は、統計的検出力と真陽性の有病率の低下とともに増加します(Colquhoun、2014; Nuzzo、2014)。

さらに、推定値は真実であり、推定値はランダムであるとみなされる傾向があります(Haller&Kraus、2002)。たとえば、「95%のケースで、この識別された信頼区間がパラメータをカバーしている」と彼らが言うとき...

相関関係と因果関係の混乱は、おそらくデータ解釈における非常に一般的なエラーでもあります。

データ収集に関して言えば、よくある間違いは、最も代表的なサンプルではなく、最も簡単にアクセスできるサンプルを取ることだと思います。

Colquhoun、D.(2014)。偽発見率とP値の誤解の調査。王立協会オープンサイエンス、1–15。

Nuzzo、R.(2014)。統計誤差:P値、統計的妥当性の「ゴールドスタンダード」は、多くの科学者が想定しているほど信頼性が高くありません。Nature、506、150〜152。

Haller、H.&Kraus、S.(2002):重要性の誤解:生徒が教師と共有する問題?オンライン心理学研究の方法、Vol.7、No.1


19

真のランダム性がどのように見えるかを一般的に理解できないと言います。人々は、ランダムなイベントのシーケンスで実際に発生するよりも少ないスプリアスパターンを期待しているようです。これは、ランダム性を自分でシミュレートしようとしたときにも現れます。

別のかなり一般的なものは、ギャンブラーの誤acyのように、独立性を理解していないことです。シャッフルされたカードの前の取引が将来のものに影響を与えるような以前の出来事は、明らかに不可能であっても、将来の出来事に影響を与えると考えることがあります。


7

(行動的)エコノミストによって「不合理」または「偏り」とラベル付けされた行動や思考プロセスの多くは、現実世界では実際に高度に適応的かつ効率的であることがすでに指摘されています。それにもかかわらず、OPの質問は興味深いものです。しかし、経済文学で議論されているものに対応する特定の「バイアス」を探すのではなく、認知プロセスに関するより基本的で記述的な知識を参照する方が有益だと思います(例:損失回避、寄付効果、ベースレート無視など)。

たとえば、評価可能性は確かにデータ分析の問題です。評価可能性理論では、解釈や評価が容易であると判断した情報を過大評価するとしています。回帰係数の場合を考えます。係数の「実際の」結果を評価するのは大変な作業です。係数が実用的な関連性を持っているかどうかを理解するために、独立変数と従属変数の単位と独立変数と従属変数の分布を考慮する必要があります。一方、係数の有意性の評価は簡単です。p値とアルファレベルを比較するだけです。係数自体と比較してp値の評価可能性が高いことを考えると、p値で構成されていることはほとんど驚くことではありません。

(標準化は係数の評価可能性を向上させますが、曖昧さを増加せる可能性があります。処理中のデータの「元の」形式が利用できないため、関連情報が利用できないまたは差し控えられるという感覚です。)

関連する認知の「バイアス」は、具体性の原則であり、意思決定の文脈において「すぐそこに」存在し、記憶からの検索を必要としない情報を過大化する傾向です。(具体性の原則は、情報が与えられた形式で使用される可能性が高く、変換の実行を避ける傾向があることも述べています。)p値の解釈は、単に回帰出力を見るだけで行うことができます。モデリングしているものについての実質的な知識を取得する必要はありません。

統計データの解釈における多くの偏りは、問題を解決したり判断を下したりする際に簡単なルートを取る可能性が高いという一般的な理解にたどることができると期待しています(「認知的悲惨」、「限定合理性」などを参照) 。関連して、「簡単に」何かを行うと、通常、結果の信念を保持する自信が高まります(流hold 性理論)。(また、明確に表現できるデータが-自分自身または他の人に-私たちの分析では過大評価されています。たとえば、心理学の研究では、問題を解決するのが難しいと考える場合、具体的で難易度の高いアプローチと解決策を好むことがあります。たとえば、単純な方法よりも難解な方法を選択します。


7

私が考えることができる最大の単一の要因は、「確認バイアス」として広く知られています。私の研究が示すと思うものに落ち着いたので、私はその結論に至るデータを批判せずに受け入れ、反論するように見えるすべてのデータポイントについて言い訳をします。私の結論に合わないデータポイントを無意識のうちに「明らかな機器エラー」(または同等のエラー)として拒否する場合があります。場合によっては、それほど露骨にならないことがあります。それらのデータポイントを完全に捨てるのではなく、「エラー」を取り除くためのいくつかの公式を作成します。これにより、事前に決められた結論を確認する方向に結果を導くことができます。

これについて特に悪意のあることは何もありません。それは私たちの脳の働きです。そのような偏りを取り除くには多大な努力が必要であり、それが科学者が二重盲検研究を調合することを好む理由の1つであり、測定を行う人が実験が証明するものを知らないということです。それから、彼が忠実に測定したものを調整しないために、非常に規律が必要です。


1
これは実際に最も危険なバイアスだと思います。なぜなら、データ収集段階で既に発生している可能性があるからです。
stijn

1
確認バイアスは分野間で非常に悪い場合があり、分野の基本的根拠が異なる場合でも、「Xはあなたの分野(そのセンシング方法を使用)では不可能ですが、私の分野では明白です(私たちはできます)センスX)」。たとえば、リンゴは木にぶら下がったり、地面に横たわったりするためのものです。彼らは自分の意見に「落ちる」ことはできません。多くの場合、物理科学では、混乱を隠す数学的根拠の変化があります。
フィリップオークリー

6

直線

データの解釈/分析中の一般的なバイアスは、通常、人々はすぐに線形関係を仮定することです。数学的には、回帰モデルは、その決定論的要素が予測子の線形関数であると想定しています。残念ながら、それは必ずしも真実ではありません。私は最近、学部生のポスター会議に参加しましたが、線形モデルを適用するのを見た鈍い二次的または非線形の傾向の量は控えめに言っても心配でした。

p


2

興味深い事例は、ギャンブラーの誤Fallに関する議論です。

既存のデータを含めるか除外する必要がありますか?私がすでに6つのシックスで進んでいる場合、これらは10回の試行の実行に含まれますか?以前のデータについて明確にしてください。

絶対数から比率にいつ変更する必要がありますか?最初の連勝中に獲得したアドバンテージがゼロ(ランダムウォーク)に戻るには長い時間がかかります。

100万ドルの0.1%は大企業にとってはそれほど大きなものではないかもしれませんが、1000ドルを失うことは唯一のトレーダーにとっては生と死になる可能性があります(そのため投資家は「駆動された」人々に投資することを望みます)。パーセンテージにシフトできることはバイアスになる可能性があります。

統計学者でさえバイアスがあります。


2

Daniel Kahnemanによる"Thinking、Fast and Slow"をお勧めします。これは明快な言語の多くの認知バイアスを説明しています。

また、「http://www.burns-stat.com/review-thinking-fast-slow-daniel-kahneman/」を参照することもできます。これは、上記の本のいくつかのバイアスをまとめたものです。

より詳細な章ごとの要約については、「https://erikreads.files.wordpress.com/2014/04/thinking-fast-and-slow-book-summary.pdf」をお読みください

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.