より重要な統計:「すべての女性の90パーセントが生き残った」または「生き残ったすべての人々の90パーセントは女性でしたか?」


14

タイタニックに関する次のステートメントを検討してください。

仮定1:男性と女性のみが船に乗っていた

仮定2:女性だけでなく男性も多数いた

ステートメント1:すべての女性の90%が生き残った

声明2:生き残った人の90%は女性でした

最初は、女性を救うことはおそらく優先度が高いことを示しています(男性を救うかどうかに関係なく)

2番目の統計はいつ有用ですか?

そのうちの1つは、ほとんどの場合、もう1つよりも有用であると言えますか?


40
どのような目的のためにもっと便利ですか?
アクサカル

12
驚いたことに、これらの回答のいずれにもシンプソンのパラドックス
ニモ

3
私はそれがあなたが女性であるかどうかにかかっていると言うでしょう!
meh

6
最初の声明は、男性に匹敵する統計がなければ意味がありません。
バーマー

1
@RahulSahaしかし、男性の95%が生き残った場合、その意味は、男性にさらに高い優先順位を与えた可能性があります。それが比較が必要な理由です。
バーマー

回答:


54

現状では、ステートメント1と2のどちらも非常に有用ではありません。乗客の90%が女性で、90%の人々が無作為に生き残った場合、両方の声明は真実です。声明は、乗客の全体的な構成の文脈で検討する必要があります。そして、生き残るための全体的なチャンス。


男性が女性と同じ数で、それぞれ100人いるとします。以下は、男性(M)が女性(W)に対して、生存(S)が死亡(D)に対して考えられるいくつかのマトリックスです。

  |  M |  W
------------
S | 90 | 90
------------
D | 10 | 10

女性の90%が生き残った。男性の90%もそうでした。生存者の半数が女性だったため、陳述1は真実であり、陳述2は偽です。これは多くの生存者と一致していますが、性別の違いはありません

  |  M |  W
------------
S | 10 | 90
------------
D | 90 | 10

女性の90%が生存しましたが、男性の10%だけです。生存者の90%は女性でした。両方のステートメントが当てはまります。これは、性別の違いと一致しています。女性は男性よりも生存しやすい傾向があります。

  |  M |  W
------------
S |  1 |  9
------------
D | 99 | 91

女性の9%が生き残ったが、男性のたった1%。生存者の90%は女性でした。ステートメント1は偽、ステートメント2は真です。これは、性別の違いと一致しています。女性は男性よりも生存しやすい傾向があります。


3
(or indeed, if *everyone* survived)... 全員が生き残った場合、割合に関係なく、すべての女性の100%が生き残った。
ブリッジバーナー

1
@Bridgeburners:あなたは完全に正しいです、そして、私が私のコンピューターから離れていたとき、それは私に当たりました。ありがとう、回答を編集しました。
ステファンKolassa

18

一見したところ、単に情報の流れの方向のために、性別の条件付きで生き残る条件付き確率はより有用です。人の性別は、彼女または彼の生存状況の前に知られており、この確率は、予測的な意味で、前向きに使用できます。また、女性の有病率の影響も受けません。疑わしいときは、予測を考えてください。


はい、その顔で。だから、それが問題の実際の統計にどのように当てはまるかを理解するために...あなたが声明#1が有用だと言っているのは、私が女性である場合、1912年に大きな旅客船に乗っていることを教えてくれるからですたまたま氷山に覆われた海で沈んでいる場合、私が生き残る可能性は90%ですか?そして、それ以来、救命技術と実践が改善されたという合理的な仮定を加えると、そのような状況を今日生き抜く可能性はおそらく90%よりも良いでしょうか?涼しい!;-)
ドンハッチ

これらのコメントは、当初の記述目標を超えて販売するものです。
フランクハレル

目標が正しいと確信していますか?問題は、明らかに、実際のタイタニックに関するこれらの声明の有用性に関するものであり、それは実際には予測を行うのにそれほど有用ではありません。それで、あなたの発見的方法は、最初に投げられた実際の例で失敗したようです。それは良いスタートとは思えません。一方、多分OPは、現在のシナリオに適用されたものと同じ形の一般的な質問のためのプロキシであることをタイタニックの質問を意図行う予測妥当性を持っています。知りません。
ドンハッチ

1
私の本Regression Modeling Strategiesにタイタニックの乗客の生存確率に関する詳細なケーススタディがあるように、何が起こったかを発見することには多くの価値があります。そのロジスティックモデルから予測された確率を使用して、将来のタイタニックスを予測するのではなく、救命艇の選択プロセスのパターンを発見します。
フランクハレル

6

最初は、女性を救うことはおそらく優先度が高いことを示しています(男性を救うかどうかに関係なく)

「優先」という言葉は、「前」のラテン語に由来します。優先順位は、他の何かよりも前に来るものです(「前」は「より重要」という意味で使用されています)。女性を救うことが優先事項であると言うなら、女性を救うことは他の何よりも先に行かなければなりません。そして、自然な仮定は、それが前に来るものが男性を救うことであるということです。「男性を救うかどうかに関係なく」と言うと、それが何を前にしたのか不思議に思われます。

一般的な生存率が何であるかがわからなければ、女性の生存率が高かったとは言えません。私が最後に乗っていた船では、女性の90%以上が生き残っていましたが、女性を救うことが最優先事項であることを示すとは言えません。

そして、生存者の何パーセントが女性であるかを知ることは、全体として何パーセントの女性が女性であるかを知ることなく、多くを語りません。

どの統計がより役立つかは、状況によって異なります。何かがどれほど危険かを知りたい場合、死亡率がより重要です。危険性にどのような影響があるかを知りたい場合は、死傷者の割合の内訳が重要です。


2
素敵な批評:-)「最後に乗った船で、女性の90%以上が生き残ったが、女性を救うことが最優先事項であることを示すとは思わない」確かにそれは..それらを船外に投棄することに比べて高い優先順位です!確かに、これは「高優先順位」の不条理な解釈ですが、OPは「男性を救うよりも優先順位が高い」という解釈を除外しているため、残されているのは不条理な解釈だけです。
ドンハッチ

3

これらの確率がどのように関係しているかを調べることは、おそらく有用です。

してみましょう人が女性であることをイベントで、と聞かせてSは、人が生き残ったことをイベントで。WS

ステートメント1:

P(S|W)=0.9

ステートメント2:

P(W|S)=0.9

ベイズの定理は、これらの確率ステートメントがどのように関連しているかを示しています。

P(S|W)=P(W|S)P(S)P(W)

P(S)P(W)

P(S)P(W)


3
また、あなたの結論に反して、P(S)もP(W)も知られていない場合、P(S | W)とP(W | S)の両方が同じイライラする有用性の欠如に苦しむと言います。P(S)とP(W)のどちらかが正確に知られている場合、何が言えるかについてはまだはっきりとは思いません。
ドンハッチ

P(W)=0.5

1
はい、それは正しいように見えます、そして、それが与えられたとしても情報はひどく不十分であるという評決のようです。P(W | S)またはP(S | W)から抽出できる情報について考え始めるたびに、P(W)などを追加するたびに、「なぜ地球上にいるのか」と考えなければなりません。私はこれについて考えていますか?なぜ彼らは私にそれらのパーセンテージだけを与えたのですか?テーブル全体を見せてください。
ドンハッチ

3

それは、何が有用であると考えるかに依存します。

P(S|W)>P(S|M)

一方、サバイバーストーリーが主に女性からのものである理由について疑問がある場合は、ステートメント2がそれを説明するので、他の情報がなくてもステートメント2が役立ちます。

ステートメント1が文脈から外れた場合に役立つとは考えられません。それは確かに、他の何と比較しても、女性を救うことに与えられた優先順位については何も言わない。ステートメント1が私にとってすることは、「もっと教えて」と言うことだけです。


0

表面上(または現実から隔離された状態)で、両方のステートメントは州の目標に対して等しく役に立たないように見えます。ただし、コンテキストを考慮すると、2番目のステートメントの方が明らかに便利です。

ステートメント2

w

w=px/(px+(1p)z)
pxz

私たちはハイポをテストしています H0:x>z

H0

(1w)px=w(1p)z
x=w(1p)z/((1w)p)
H0
x=w(1p)z/((1w)p)>z
w(1p)>(1w)p
0.9(1p)>0.1p
1p>p/9
p<0.9

したがって、女性が生き残る可能性が高いというあなたのハイポについては、乗客の中で女性が90%未満であることを確認するだけです。これはあなたの仮定2と一致しています。p1/2

ステートメント1

x=0.9zx>z

xz

p1/2px+(1p)zxzp1/2

px+(1p)zx=0.9
x>>z

結論

両方のステートメントは、女性が男性よりも生き残る可能性が高いというあなたのハイポを支持すると思いますが、ステートメント1はかなり弱いですが、ステートメント2は仮定と組み合わせて、あなたのハイポを事実としてほぼ確実に確立します。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.