1000人中900人が車が青だと言った場合、青である確率はどのくらいですか?


114

これは最初、自然なテキストを分類するためにモデルに対して行っているいくつかの作業に関連して生じましたが、私はそれを単純化しました...おそらく多すぎます。

あなたは青い車を持っています(客観的な科学的尺度によると-それは青です)。

1000人に見せます。

900は青だと言います。100はありません。

車を見ることができない人にこの情報を与えます。彼らが知っているのは、900人が青いと言い、100人はそうではなかったということです。あなたはこれらの人々(1000)についてこれ以上何も知りません。

これに基づいて、「車が青くなる確率はいくらですか?」

これは私が尋ねた人々の間で意見の大きな相違を引き起こしました!正しい答えは何ですか?


162
着替えたらどうなるのかしら。
user1717828

13
それでは、人々への質問は何ですか?「車は青ですか?」または「車は何色ですか?」
コンサイク

13
車が青くなるとはどういう意味ですか?車は青ではないと言う人がいる場合、それは一部の人が青と呼び、他の人が別の名前で呼ぶ色である可能性があります。これは、彼らが色に反対するという意味ではなく、色の名前に反対するという意味です。
ベン

7
あなたが出会ったさまざまな異なる意見を述べれば、質問は大いに改善されると思います。現状では、答えは確率論から色彩理論、さらには生物学(色覚異常)にいたるまで、分野全体をただ探索するだけであり、それが実際にどのように役立つかわかりません。
AnoE

32
問題の説明に欠けているものがあります。確かに青であるにもかかわらず車が青であることを否定する100人は多くの人であり、それらをランダムエラーとして単純に破棄することはできません。
アクサカル

回答:


117

TL; DR:人が車の色を判断するのが不当に悪いとか、青い車が不当に珍しいと思わない限り、この例の人が多いということは、車が青である確率が基本的に100%であることを意味します。

マシュー・ドゥルーリーはすでに正しい答えを出しましたが、いくつかの数値例を使ってそれに加えたいと思います。なぜなら、さまざまなパラメーター設定で実際にかなり似た答えが得られるように数字を選んだからです たとえば、コメントの1つで言ったように、人々が車の色を正しく判断する確率は0.9であると仮定しましょう。つまり、 そして P それは青ではないと言う|車は青ではありません= 0.9 = 1 - P 青だと言う|車は青くない

p(say it's blue|car is blue)=0.9=1p(say it isn't blue|car is blue)
p(say it isn't blue|car isn't blue)=0.9=1p(say it is blue|car isn't blue)

それを定義したら、私たちが決めなければならない残りのことは、車が青いという事前の確率は何ですか?何が起こるかを見るためだけに非常に低い確率を選んで、、つまりすべての車の0.1%だけだとしましょう。次に、車が青である事後確率は次のように計算できます。p(car is blue)=0.001

p(car is blue|answers)=p(answers|car is blue)p(car is blue)p(answers|car is blue)p(car is blue)+p(answers|car isn't blue)p(car isn't blue)=0.9900×0.1100×0.0010.9900×0.1100×0.001+0.1900×0.9100×0.999

分母を見ると、合計の項の相対的なサイズはとの比率によって支配されているため、その合計の2番目の項は無視できることは明らかです。はのオーダーです。実際、コンピューターでこの計算を行うと(数値アンダーフローの問題を避けるように注意して)、1(マシン精度内)に等しい答えが返されます。 0.1 900 10 580.99000.19001058

ここで事前確率がそれほど重要ではない理由は、1つの可能性(車が青い)と他の可能性の証拠が非常に多いためです。これは尤度比で定量化でき、次のように計算できます:

p(answers|car is blue)p(answers|car isn't blue)=0.9900×0.11000.1900×0.910010763

したがって、事前の確率を検討する前に、証拠は、1つのオプションがすでに天文学的に他のオプションよりも可能性が高いことを示唆しており、違いを生む前に、青い車は不合理に、愚かにまれでなければならないでしょう(私たちが期待するほどまれです)地球上で0台の青い車を見つけます)。

それでは、人々が車の色の説明の正確さを変えるとどうなるでしょうか?もちろん、私たちはこれを極端に推し進めて、50%の確率でしかうまくいかないと言うこともできます。これは、コインを投げることに勝るものはありません。この場合、車が青であるという事後確率は、前の確率と単純に等しくなります。これは、人々の答えが何も教えてくれなかったからです。しかし、確かに人々は少なくともそれよりも少しだけ良い結果を出します。そして、人々が正確な時間の51%だけだと言っても、尤度比は、車のおよそ倍の可能性があります。青になります。1013

これはすべて、例で選択したかなり大きな数値の結果です。9/10人が車が青いと言っていた場合、同じ比率の人が1つのキャンプと他のキャンプにいたとしても、それは非常に異なる話だっただろう。統計的証拠はこの比率に依存するのではなく、対立する派fact間の数値の違いに依存するからです。実際、尤度比(証拠を定量化する)で、車が青ではないと言う100人は、青と言う900人のうち100人を正確にキャンセルするため、800人全員が同意している場合と同じです。それは青かった。そして、それは明らかに非常に明確な証拠です。

(編集:Silverfishが指摘したように、私がここで行った仮定は、人が青以外の車を間違って説明するときはいつでも、それが青だと言うことをデフォルトとすることを暗示しています。しかし、これは結論に違いはありませんが、人々が青い車と青い車を間違える可能性が低いほど、それが青いと言う証拠が強くなります。ですから、どちらかといえば、上記の数値は実際には青系の証拠の下限に過ぎません。)


11
+1。実際、OPのデータを考慮すると、人々が正確である頻度のMLE推定値は900/1000 = 90%です。
アメーバ

5
50%の確率で車の色を正しく取得することは、コインを投げることと同じではありません。結局のところ、使用可能な2色以上の方法があります。また、「ブルー」の代わりに「ネイビー」または「紺ure」と言う人もいるかもしれません。実際、正しい答えが「青のように見えるおしゃれでファッショナブルな特許の色」である場合、Maynの人々は誤って「青」と言うでしょう
ハーゲンフォンアイゼン

10
これらは単なる実例にすぎないことを知っていますが、「人々が車の色を正しく判断する確率が0.9である場合」、青色について特別なものがない限り、p(青|車は青ではない)= 0.1。90%の時間で正しい色が特定されると考えると、p(たとえば赤|車は赤)= p(たとえば白|車は白)= p(たとえば緑|車は緑)= 0.9など可能なすべての車の色をオンにします。しかし、なぜp(たとえば青|車は赤)= p(たとえば青|車は白)= p(たとえば青|車は緑)= 0.1なのでしょうか?これは、たとえばp(白|車は赤)= 0を意味します。
シルバーフィッシュ

2
@PatMolloy:必ずしもそうではありません。確率が対称かどうかに依存します。誰かが青を青以外の車と間違える可能性があるのと同じように、青と青以外の車を間違える可能性は同じですか?もしそうなら、500/500判定はコイントスと同じくらい多くの情報を与えます。しかし、青い車が青ではないと言うよりも、青でない車が青であると人々が言う可能性が低い場合、500人の青い人は、500人の青い人ではない人よりも説明するのが難しい非青仮説。したがって、その場合、証拠のバランスは青に傾くでしょう。
ルーベンファンベルゲン

3
色の知覚は注意が必要です..10人中9人がドレスが白と金だと言った場合、青と黒である確率はどれくらいですか?
Glen_b

73

正しい答えは、問題で指定されていない情報に依存します。単一の最終的な答えを導き出すには、さらにいくつかの仮定を行う必要があります。

  • 車が青である事前確率、つまり、まだ誰にも質問していないということを考えると、車が青であるというあなたの信念。
  • 車が実際に青であるときに誰か青だと言う確率と、実際青ではないときに車が青だと言う確率。
  • 誰かがそれを言ったときに車が実際に青である確率と、誰かがそれを青と言ったときに車が青ではない確率。

これらの情報を使用して、ベイズの式を使用して全体を分解し、自動車が青である事後確率を導き出すことができます。1人だけに質問する場合に焦点を当てますが、人に質問する場合にも同じ推論を適用できます。1000

Ppost(car is blue)=P(car is bluesay is blue)P(say is blue)    +P(car is bluesay is not blue)P(say is not blue)

をさらに分解し続ける必要があり。これが先例の出番です。P(say is blue)

P(say is blue)= P(say is bluecar is blue)Pprior(car is blue)+P(say is bluecar is not blue)Pprior(car is not blue)

したがって、Bayesのルールの2つのアプリケーションがあります。特定の状況に関する情報に基づいて、またはいくつかの合理的な仮定を行うことにより、指定されていないパラメーターを決定する必要があります。

以下に基づいて、どのような仮定を立てることができるかについて、他にもいくつかの組み合わせがあります。

P(say is bluecar is blue)P(car is blue)=P(car is bluesay is blue)P(say is blue)

最初は、これらのことは何も知りません。そのため、そのうち3つについて合理的な仮定を立てる必要があり、4つ目はそこから決定されます。


5
多くの場合そうです。次に、2つのオプションがあり、青ではなく青が等しく発生する可能性があると仮定して、知識の完全な欠如を表現します。、このような何かを助けることができるフィールドの迅速な調査をください:en.wikipedia.org/wiki/Car_colour_popularity
マシュードゥルーリー

18
@Matthew「青色ではなく青色も同様に発生する可能性が高い」という問題は、一貫性がないことです。考えられる車の色のそれぞれに同じ推論を適用すると、それらはすべて同時に50%の確率(確率の法則により2色以上では不可能)と50%未満の確率(あなたが「白ではない」と「赤ではない」の青を見てください。これは、色の確率が複数の値を取ることができないため、矛盾にもつながります)
Glen_b

2
人々の答えは独立している必要はないので、これよりも不特定の情報があります(実際、客観的な色と強く関連していることを願っています。回答が「過度に」依存している場合はどうなりますか?たとえば、10人のランダムな歩行者に単純に尋ねますが、それぞれが100回返事をしますか?
ハーゲンフォンアイゼン

2
@HagenvonEitzenとMatthewDrury。実際、仮定する必要があるのは、独立性ではなく、条件付き独立性です。つまり、。P(Joe and Mary say blue|car is blue)=P(Joe says blue|car is blue)P(Mary says blue|car is blue)
ルカシティ

15
@Glen_b:世界には青と青以外の2色しかありません。確かに、どちらもさまざまな色合い、特に青ではありません。
-psmears

13

あなたの1000の意見が体系的なバイアスを共有していないという重要な仮定があります。これはここでは合理的な仮定ですが、他の場合には重要になる可能性があります。

例は次のとおりです。

  • それらはすべて、同様の色覚異常を共有します(たとえば、母集団の遺伝学)。
  • 彼らは皆、オレンジ色のナトリウム街路灯の下で夜に車を見ました。
  • それらはすべて、青がタブーであるか魔法のように関連付けられているという共通の文化を共有します(青と表現するか、文化的なup曲表現などを使用するかどうかに偏りがあります)。
  • 彼らはすべて、特定の方法で答える/答えない場合、良い/悪いことが起こると言われています(または共通の信念を共有しています).....

このケースではそうではありませんが、他のケースでは重要な暗黙の仮定です。極端なものである必要はありません-質問を他のドメインに転置すると、これが本当の要因になります。

共有バイアスの影響を受ける可能性のあるそれぞれの例:

  • 背の高い薄いガラスは実際に同一の短い脂肪ガラスよりも多く保持しているが、1000人の回答者は非常に幼い子供であるかどうかを尋ねる(誤解を共有)。
  • はしごの下を歩くのは危険かどうかを1000人に尋ねる(一般的な文化的信念)
  • パートナーが自分の答えを知っていると信じる状況で、パートナーを愛している/関係があるかどうかを1000人の既婚者に尋ねます。コンテキストは、テレビ番組、または尋ねられたときに存在するパートナーなどである可能性があります(結果についての一般的な信念)

900:100応答が信念と誠実さ、または他の何かの尺度であり、正しい答えを指していない構造的に同一の質問を想像することは難しくありません。この場合はそうではありませんが、他の場合はそうです-はい。


11

さまざまな人からさまざまな答えを得る理由の1つは、質問をさまざまな方法で解釈できることであり、ここでの「確率」の意味が明確ではないということです。質問を理解する1つの方法は、マシューの答えのようにベイズのルールを使用して事前確率と理由を割り当てることです。

確率を求める前に、ランダムにモデル化するものとそうでないものを決定する必要があります。未知ではあるが固定された数量に優先順位を割り当てる必要があることは、広く受け入れられていません。質問の問題を浮き彫りにする同様の実験を次に示します。

想定、成功確率(平均)とIIDベルヌーイ確率変数である。解釈しように、をコインフリップと考えてみましょう。(十分な統計量)を観察するとします。コインが公正である確率はどのくらいですか? i = 1 1000 p = 0.5 X i 1000 i = 1 X i = 900Xii=1,,1000p=0.5Xii=11000Xi=900

頻繁な視点から見ると、質問は無意味であるか、答えが「1」です。もしあなたがベイジアンなら、事前分布をに割り当てたいかもしれません。その場合、質問は理にかなっています。私の例と質問の根本的な違いは、質問でが不明であるということです。質問は、実際のランダム性は(おそらくランダムにサンプリングされた)人が車が青かどうかと答えるかどうかという事実を隠しています。車の色はランダムに割り当てられているわけではないため、頻繁に見ると青である可能性について話すのは面白くありません。Ppp


1
したがって、車が青で、残りが同じであるという仮定を削除すると、900人は青で、100人は青ではないと言います。その場合、確率は0.9になります。
ユーザー

いいえ、1にずっと近いです。1000人中900人が色を間違える可能性は非常に低いです。
gnasher729

1
the probability is either one or zero, depending on whether the car is actually blue or not.これは、私がよく知っている「確率」の理解には対応していません。「Xは発生する可能性も発生しない可能性もあるので、確率は50%でなければなりません」と少し聞こえます。その文の意味をもう少し明確にできますか?
AnoE

2
@AnoEの区別は、パラメーターとランダム変数の区別に似ています。質問の設定では、車は実際には青であり、色はランダムな実験の結果ではないことが示されています。本質的には、頻繁な対v。ベイジアン解釈です。コインを1000回裏返し、900個のヘッドを観察した場合、コインが公正である確率はどのくらいですか?頻繁に使用する(または無意味な)場合は、1または0です。パラメータに確率を割り当てません。
ekvall

@ユーザーいいえ、答えを更新して、ポイントを明確にしました。
ekvall

7

簡単で実用的な答え:

確率は、想定に応じて0%〜100%の範囲で簡単に設定できます。

私は既存の回答が本当に好きですが、実際には基本的に次の2つの単純なシナリオに要約されます。

シナリオ1:人は青が青であるときに青を認識するのが非常に上手であると想定される... 0%

この場合、車が青くないと述べる人が非常に多く、車が実際に青である可能性は非常に低いです。したがって、確率は0%に近づきます。

シナリオ2:人々は、青ではないときに青ではないことを非常によく理解していると想定されています... 100%

この場合、車が青であると述べている人が非常に多く、実際に青である可能性が非常に高いです。したがって、確率は100%に近づきます。


もちろん、これを数学的な角度から見ると、「関連する確率は...だと仮定しましょう」などの一般的なものから始めることになります。したがって、私は両極端を見て、両方の割合を簡単かつ現実的な仮定で簡単に正当化でき、したがって単一の有意義な答えはないという考えを理解することを提唱します。


2
「人々は青の認識に非常に優れていると想定されている」場合、シナリオ1にないのになぜ青と推定するのでしょうか。偽陽性と偽陰性の観点からシナリオを表現したい場合があります。
ハイド

@hydeあいまいさを取り除くためにシナリオを書き直した
デニスジャヘルディン


5

推定のフレームワークを開発する必要があります。あなたが尋ねるかもしれないいくつかの質問は

  1. どれくらいの色があるの?二色話してる?それとも虹のすべての色?

  2. 色はどれほどはっきりしていますか?私たちは青とオレンジを話していますか?それとも青、シアン、ターコイズ?

  3. 青いとはどういう意味ですか?シアンやターコイズブルーですか?それとも、青そのものですか?

  4. これらの人々は色を推定するのにどれほど優れていますか?彼らはすべてグラフィックデザイナーですか?それとも色盲ですか?

純粋に統計的な観点から、最後のものについていくつか推測することができます。まず、少なくとも10%の人々が誤った応答を選択していることがわかります。(最初の質問から)2色しかない場合は、

Probability says blue and is blue = 90% say is blue * 90% correct = 81%
Probability says blue and is not = 90% * 10% incorrect = 9%
Probability says not but is blue = 10% * 90% incorrect = 9%
Probability says not and is not = 10% * 10% = 1%

簡単な確認として、これらを一緒に追加すると、100%になります。@MatthewDruryの回答で、これのより数学的な表記を見ることができます。

3番目の90%をどのように取得しますか?多くの人が青と言ったが、そうでなければ間違っていた。2色しかないため、これらは対称です。3色以上ある場合、他の何かを言ったときに間違った選択が青色になる可能性は低くなります。

とにかく、この推定方法では90%の青が得られます。これには、81%の人が青であると言う確率と、9%の人がそれがそうでないときであると言う確率が含まれます。これはおそらく、元の質問に答えることができる最も近い方法であり、2つの異なることを推定するためにデータに依存する必要があります。そして、ブルーが選択される可能性は、ブルーが正しい可能性と同じであると仮定します。

3色以上ある場合、ロジックは少し変更されます。最初の2行は同じままですが、最後の2行では対称性が失われています。その場合、より多くの入力が必要です。青色を再び81%と正しく言う可能性を推定するかもしれませんが、誰かがそうではないと言ったときに色が青色である可能性が何であるかはわかりません。

また、2色の推定値を改善することもできます。統計的に有意な数の各色の車を考えると、統計的に有意な数の人々がそれらを見て分類することができます。次に、各色を選択するときに人々がどれだけ正しいか、各色を選択する頻度を数えます。次に、人々の実際の選択を考慮して、より正確に推定することができます。

90%が間違っている可能性があることを尋ねるかもしれません。紺ure、青、サファイアの3色がある場合に何が起こるか考えてください。誰かがこれら3つすべてを青と合理的に考えるかもしれません。しかし、もっと欲しいです。正確な色合いが必要です。しかし、他の色合いの名前を覚えているのは誰ですか?彼らが知っている唯一の一致する色合いであるため、多くの人が青を推測するかもしれません。そして、それが紺beであることが判明したとき、まだ間違っています。


前のコメントの1つで述べたように、確かに関連する2つの色は「青」と「青以外」だけなので、複数の色に関する部分は必要ありません。
デニスJaheruddin

4

正確な、数学、真/偽の確率を計算することはできませんあなたが提供する情報を。

ただし、実際には、このような情報は確実に入手できません。したがって、私たちの直感を使用して(そして賭けた場合、私のお金はすべて行きます)、車は間違いなく青いです。(これはもはや統計ではないと考えている人もいますが、科学の白黒の見方はあまり役に立ちません)

推論は簡単です。車が青くないと仮定します。そして、90%の人々(!)が間違っていました。次のような問題のリストがあるため、それらは間違っている可能性があります。

  • 色覚異常
  • 病的嘘
  • アルコール、LCDなどの物質の影響下にある
  • 質問を理解していない
  • 精神障害の他の形態
  • 上記の組み合わせ

上記は明らかにランダムな平均人口の90%に影響を与える可能性が低いため(たとえば、色覚異常は男性の約8%と女性の0.6%に影響し、1000人中43人)、必然的に車は青。(それは私のお金がすべてとにかく行くことだった)。


これは私にとって直感的に正しいようです。元の質問に対する批判は、十分な情報を与えていないということであり、特定の仮定を立てる必要があるということだと思います..まあ、実際にはほとんどの場合そうではありませんか?
パットモロイ

@PatMolloy正確で正しい/間違った洗練された数学的な答えを提供するのに十分な情報を提供しません(多くの質問がこのサイトから得ようとしていることは確かです)。しかし、あなたが与えた情報が減ったことを考えると、お金を賭けることになると、これが人々が選ぶ答え(100%)です。
ルチョナチョ

1
もっともらしい選択肢のいくつかをカバーできなかったと思います。これは結論を修正させるはずの選択肢です。これらには、(a)人々が青を認識できない; (b)質問者と回答者の間に「青」の一般的な理解はありません。(c)「青」の「科学的」意味は、人々が「青」として一般に理解しているものとは異なります。重要なのは、これらの選択肢のいずれも、またリストしたもののほとんどを定量化できないため、答えの確率を定量化することを正当化するにはどうすればよいでしょうか?それは統計ではありません!
whuberの

「上記は明らかに平均的なランダムな母集団の90%に影響を与える可能性は低いため」それについてはあまり確信しないでください。通常、人間について議論するときは平均の観点から話します。確かに、色覚異常があるのは(平均と比較して)わずか数パーセントですが、優れた視力を持っている明確な少数者、たとえば四色覚者がいる可能性があります。
NPSF3000

2
私は常にLCDの影響下にある
アレックス

2

何十億匹のハエが間違ってはならないという事実に基づいて、私は糞を食べません。1000のうち900人が車が青いと思ってだまされたかもしれない他の多くの理由があるかもしれません。結局のところ、それは魔法のトリックの基礎であり、人々を現実から取り除かれた何かを考えさせる。1000人中900人が助手に刺している魔術師を見ると、助手が刺されたことに即座に答えます。反射する車の塗装の青い光、誰か?


2

質問者は、質問に正確に答えるために、投票がどのように行われたかについてほとんど知りません。彼に関する限り、この世論調査にはいくつかの問題があります。

世論調査を行う人々は偏っていたかもしれません:

  1. は錯視のため青く見えた

  2. 車の色はなんらかの理由で観察が困難であり、人々は何らかの理由でこの車の前に多くの青い車を見せられ、ほとんどの人はこの車もおそらく青であると信じていました。

  3. あなたは彼らに車が青いと言って支払っていました。

  4. 誰かに催眠術をかけ、車が青いと信じ込ませました。

  5. 彼らは、嘘をつき、世論調査を妨害する協定を結んでいた。

投票を行った人々の間には、彼らがどのように選択されたか、または互いに影響を与えたために相関関係があった可能性があります。

  1. あなたは、同じ種類の色覚異常のある人々を対象にした集会で誤って投票を実施しました。

  2. 幼稚園でアンケートを実施しました。少女たちは車に興味がなく、ほとんどの少年たちは好きな色として青を使っていたので、車は青だと想像していました。

  3. 車を見せられた最初の人は酔って、青く見えると思い、「IT IS BLUE」と叫び、車が青だと思うように他の人に影響を与えました。

ルーベン・ファン・ベルゲンの回答で説明されているように、投票が完全に正しく行われた場合に車が青である確率は非常に高いですが、投票の信頼性が損なわれ、車が青ではない可能性があります取るに足らない。質問者がこのチャンスを最終的に推定する大きさは、状況が世論調査に悪影響を及ぼす可能性がどれほど高いか、そしてあなたが世論調査をどの程度うまく行っているか(そして彼があなたがどのようにいたずらしていると思うか)の見積りに依存します。


2

「青」の定義は何ですか?

文化や言語が異なれば、青の概念も異なります。IIRC、一部の文化では青の概念に緑が含まれています!

他の自然言語の言葉と同様に、物事を「青」と呼ぶとき(およびそうでないとき)に文化的な慣習があると仮定できます。

全体的に、言語の色は驚くほど主観的です(以下のコメントからのリンク、@ Count Ibilisに感謝)

ここに画像の説明を入力してください


7
質問の文脈では、この特定の側面はかなり無関係だと思います-OPは、「青」という言葉を非常に一般的な用語として選択し、人々が確信できない「紺ure」、「トルクス」などのようなものではないと思います。また、車は通常、可能な/通常の色の非常に限られたパレットを使用する傾向があります。最後に、問題は「なぜ100人が非青と言ったのか」ではなく、「車が実際に青である確率」です。
-AnoE


正確な定義は、「現在の環境条件で、主に475nmプラスマイナス10-20nmの波長を持つ光を主に放射する」ことです。これは一般に青として受け入れられます。
rackandboneman

はい、しかし、何人が主要波長を測定するツールを携行していますか?また、目に見えない波長を除外するのを忘れました。
アノニムース

1
質問は、波長計として統計的に未知の較正の人々のグループを使用することについてのようです:)
rackandboneman

1

可能性は、より洗練された前提条件に応じて、いくつかの異なる値になる可能性がありますが、99.995%は私にとって最も意味のあるものです。

定義上、車は青(100%)であることはわかっていますが、これが実際に何を意味するのかは明確ではありません(多少哲学的だと思います)。私は何かが青であるという意味で青であると仮定します。

また、被験者の90%が青と報告したことも知っています。

何が尋ねられたのか、どのように評価が行われたのか、そして車がどのような照明条件にあったのかはわかりませ。色の名前を尋ねられると、一部の被験者は、たとえばそれを「青」として数えていません。質問が「これは青ですか?」だった場合、同じ人々は「はい」と答えたかもしれません。被験者を悪意を持って欺くつもりはなかったと思います。

トリタノピーの発生率は約0.005%であることがわかっています。これは、車が実際に青と見られる場合、被験者の99.995%が実際に色を青と見たことを意味します。しかし、これは、被験者の9.995%が明確に青を見たときに青を報告しなかったことを意味します。彼らは見たものについて嘘をついていました。これはあなたの人生経験があなたに伝えるものに近いです:人々は常に正直であるとは限りません(しかし、動機がない限り、彼らは通常そうです)。

したがって、観察していない人は、圧倒的な確信をもって、車が青いと思い込むことができます。それは100%です

ただし、観察していない人自身が三タノピーに苦しんでいる場合を除きます。この場合、他の人(または90%)がそう言っていても車は青く見えません。ここで再び哲学的になります。他の人全員が木が落ちるのを聞いたが、私はしなかったなら、それは落ちましたか?

最も合理的で実用的な答えはあえて言うでしょう:観察していない人がたまたまトリアノープ(0.005%の確率)である場合、予測された色と見たままの実際の色が同じかどうかを検証すると、偽が生成されます。したがって、可能性は100%ではなく99.995%です。

さらに、ボーナスとして、被験者の9.995%が嘘つきであり、すべてのクレタ人が嘘つきであることがわかっているため、私たちはクレタ島にいないと結論付けることができます!


1

あなたは青い車を持っています(客観的な科学的尺度によると-それは青です)。

...

「車が青い確率はどうなりますか?」

100%ブルーです。

彼らが知っているのは、900人が青いと言い、100人はそうではなかったということです。あなたはこれらの人々(1000)についてこれ以上何も知りません。

(なしでこれらの番号を使用して任意のコンテキスト)は全くナンセンスです。それはすべて、質問の個人的な解釈に要約されます。私たちはこの道を進んでウィットゲンシュタインの「Wovon man nicht sprechen kann、darübermuss man schweigen」を使うべきではありません


比較のために次の質問を想像してください。

All they know is that 0 people said it was blue, and 0 did not. 
You know nothing more about these people (the 0).

これは基本的に同じ(情報が少ない)問題ですが、車の色について考えるのはほとんど(完全ではないにしても)状況によるものであることははるかに明確です。


長い目で見れば、関連する複数の質問を取得すると、そのような不完全な質問に対する答えを推測し始めることができます。これは、1つのケースでは機能しないtit-for-tatアルゴリズムでも同じですが、長期的には機能します。同じ意味で、ヴィットゲンシュタインは彼の初期調査から彼の主たる調査から戻ってきました。これらの質問に答えることはできますが、より多くの情報/試行/質問が必要です。それはプロセスです。


0

車が青であると仮定すると、1,000のうち100は青ではないと言って、ある種の極端なサンプルバイアスを意味します。おそらく、あなたは色盲の人だけをサンプリングしていました。車が青くないと仮定すると、サンプルバイアスはさらに悪化します。したがって、与えられたデータから結論付けることができるのは、サンプルが非常に偏っているということだけであり、どのように偏ったのかわからないので、車の色について何も結論付けることができません。


ええと、確かに900人が青いと言ったという事実は、何かに良いのでしょうか?青色よりも青色である可能性が高いと結論付けることはできませんか?回答者が知っているのは数字900と100だけだということを思い出してください。それで、彼らは本当にバイアスについて何かを言うことができますか?
パットモロイ

0

いくつかの答えがありました。私は決して数学の第一人者ではありませんが、まあ、これは私のものです。

4つの可能性のみがあります。

case 1) Persons says car is blue and is correct
case 2) Person says car is blue and is incorrect
case 3) Person says car is not blue and is correct
case 4) Person says car is not blue and is incorrect

この質問から、ケース1とケース4の合計は900人(90%)であり、ケース2とケース3の合計は100人(10%)であることがわかります。ただし、ここに問題があります。あなたが知らないのは、これらの2つのケースペア内の分布です。ケース1と4の合計が完全にケース1で構成されている(車が青であることを意味する)場合もあれば、合計がケース4で構成されている(車が青でないことを意味する)こともあります。ケース2 + 3の合計についても同様です。だから...あなたが必要なのは、ケース合計内の分布を予測する何らかの方法を考え出すことです。質問に他の兆候はありません(人々が自分の色などを80%確信しているとはどこにも言えません)、特定の明確な答えを思い付く方法はありません。

これを言った...私は予想される答えは次のようなものに疑っています:

P(Blue) = (case 1 + case 4) * 900 / 1000 = (1/4  + 1/4) * 900 / 1000 = 45 %
P(non-Blue) = (case 2 + case  3) * 100 / 1000 = (1/4 + 1/4) * 100 / 1000 = 5%

残りの50%が単純に不明な場合、それをエラーマージンと呼びます。


0

X,Y1,Y2,,Y1000{0,1}1p(x)pxYi|X=1p1Yi|X=0p0θ=(px,p0,p1)

p(θ,x|y1:1000)p(θ)p(x|θ)i=11000p(yi|x)

{xi}{yi|x}


-3

車を見ることができない人は、車が青いことが科学的に証明されていることを知りません。車が青である確率は、50/50です(青であるか、そうでないか)。他の人をポーリングすることは、この人の意見に影響を与える可能性がありますが、目に見えない車が青かそうでないかの確率は変わりません。

上記の数学はすべて、サンプルセットが青かどうかを判断できる確率を決定します。


青色である確率が50/50であるかどうかはわかりません。実際、赤、白、黄色などになる可能性があるため、50未満です。ランダムに選んだ車が青である確率は、50%未満です。
ユーザー
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.