飛行機事故のクラスターはどのくらい奇妙ですか?


15

元の質問(7/25/14):ニュースメディアからのこの引用は意味がありますか、それとも最近の飛行機事故の相次ぐ統計を見るためのより良い統計的方法がありますか?

ただし、Barnettはポアソン分布の理論にも注意を向けています。これは、衝突間の短い間隔が実際には長い衝突よりも可能性が高いことを意味します。

「1年に平均1つの致命的な事故があると仮定します。これは、特定の日にクラッシュする可能性が365に1つであることを意味します」とバーネットは言います。「8月1日にクラッシュが発生した場合、次のクラッシュが8月2日に1日発生する可能性は1/365です。しかし、次のクラッシュが8月3日に発生する可能性は(364/365)x(1/365)です、次のクラッシュは8月3日に発生するのは、8月2日にクラッシュが発生しない場合のみです。」

「直観に反するように思えますが、結論は確率の法則から容赦なく続きます」とバーネットは言います。

出典:http : //www.bbc.com/news/magazine-28481060

明確化(14/27/14):(私にとって)直観に反することは、まれなイベントは近いうちに発生する傾向があるということです。直観的には、まれな出来事はすぐには起こらないと思います。誰かがポアソン分布の仮定の下でのイベント間の時間の理論的または経験的な予想される分布を指摘できますか?(つまり、y軸は頻度または確率であり、x軸は日、週、月、または年などにグループ化された2つの連続した発生間の時間であるヒストグラムです。)ありがとう。

明確化(14年7月28日):見出しは、間隔が広い事故よりも事故のクラスターがある可能性が高いことを示しています。それを運用可能にします。クラスターが3回の飛行機事故であり、短い期間が3か月、長い期間が3年であるとします。3年の期間内よりも3か月の期間内に3つの事故が発生する可能性が高いと考えるのは非論理的なようです。仮に最初の事故を想定したとしても、今後3年以内に比べて今後3か月以内にさらに2つの事故が発生すると考えるのは非論理的です。それが本当なら、ニュースメディアの見出しは誤解を招き、間違っています。何か不足していますか?


1
説明を再確認してください:確率単位時間あたりの確率、および期待値を区別すると役立つ場合があります。まれなイベントを記述するプロセスは(実際には「まれな」という意味で)イベント間で予想される時間が長くなりますが、それは最初に単位時間あたり確率が最大になることと矛盾しません。それにもかかわらず、イベントが次に短時間で発生する確率は非常に小さくなります。
whuber

2
また、私はこのウィキペディアの記事に気付いたばかりです- あなたはそれを気に入るかもしれません。ああ、私もこのpdfに出会ったばかりです。具体的には、飛行機 "落事故の「クラスター化」について言及しています(そして、私がこれまでに持っていたよりもずっとよく問題を説明しています...)。
スティーブS 14

1
@Glen_b:新聞記事(私の投稿のタイトルである記事のタイトルに含まれる)の欠陥は、記事が、特定の数(つまり、クラスター)で発生する事故の確率が高いことを示唆していることです。より長い期間よりも短い期間。それは間違っています。
ジョエルW. 14

1
@JoelW .:どちらかといえば、それが台無しになったのはジャーナリストだろう...とにかく、すべてが片付けられましたか、それともまだ予約が残っていますか?
スティーブS 14

1
私の推測では、ジャーナリストを惑わしたのは統計学者だったということです。私はジャーナリストが自分でそれを間違えたのではないかと疑っています(直感に反するからです)。
ジョエルW. 14

回答:


3

概要:引用されたBBC段落の最初の文は、ずさんで誤解を招く恐れがあります。

以前の回答とコメントはすでに優れた議論を提供していましたが、主な質問には十分に回答されていないと感じています。

だから、私たちは、任意の日に飛行機事故の確率があると仮定しましょうとクラッシュが互いに独立していること。1月1日に飛行機がone落したと仮定しましょう。次の飛行機はいつcrash落しますか?p=1/365

さて、簡単なシミュレーションを行ってみましょう。次の3年間、毎日、別の飛行機が確率でcrash 落したかどうかをランダムに決定し、次のcrash落日を記録します。この手順を繰り返します100p回。結果のヒストグラムは次のとおりです。100000

平面クラッシュの分布、モデル

実際、確率分布は単にで与えられます。ここで、tは日数です。この理論的な分布を赤い線でプロットしましたが、モンテカルロヒストグラムによく適合することがわかります。注:時間をより小さなビンで離散化すると、この分布は指数分布に収束します。しかし、それはこの議論にとっては重要ではありません。Prt=1ptpt

多くの人がすでにここで述べているように、それは減少曲線です。これは、次の飛行機が翌日1月2日にcrash落する確率が、次の飛行機が他の特定の日、例えば来年1月2日にcrash落する確率よりも高いことを意味します(差はほぼ3倍です:および0.10 )。0.270.10

ただし、次の3日間で次の飛行機がcrash落する確率を尋ねると、答えはですが、3日後にit落する可能性を尋ねると、次の3年で、答えは94 です。したがって、明らかに、次の3日間よりも今後3年間(ただし最初の3日間後)にクラッシュする可能性が高くなります。「クラスタ化されたイベント」と言うときは、ディストリビューションの非常に小さな初期チャンクを指しますが、「広い間隔」のイベントと言うときは、その大きなチャンクを指すため、混乱が生じます。0.894 そのため、単調に減少する確率分布であっても、「クラスター」(たとえば、3日間で2機の飛行機のcrash落)が発生する可能性はほとんどありません。

この点を実際に把握するための別のヒストグラムを次に示します。これは、交差しない複数の期間にわたる前のヒストグラムの単純な合計です。

平面のヒストグラムは頻度を押しつぶします


MITの教授は間違っていると言っていますか?
スティーブS 14

1
いいえ、BBC記事のBarnettからの引用は完全に正しいです。しかし、BBC記者によるその解釈はせいぜいずさんです:「Barnettはポアソン分布の理論にも注意を向けています。これは、衝突間の短い間隔が実際には長い衝突よりも可能性が高いことを意味します」。この文の最も自然な解釈はまったく間違っています(そして、バーネットはそれを意味するつもりはなかったと思います)。たぶん私は私の返事でそれについてもっと明確にすべきです。あなたが同意しない私の答えの実質的な部分はありますか?私はあなたの意見に完全に同意するので、期待しないでください。
アメーバは2014

13

記者が言っているのは、飛行機crash 落事故のランダムな発生はポアソン過程としてモデル化できるということです- ある(小さな)間​​隔で発生するイベントの確率は、その間隔の長さに比例し、各発生は他のすべてから独立しています。

これは、説明されているシナリオの合理的なモデルですか?

多分。

確かに、他のパイロットがクラッシュ後に(ごくわずかではあるが)動作を変更する可能性があるため、これらのイベントは100%独立ではない可能性があります。[私は知らない-おそらく少数のパイロットがシミュレーターのトレーニングやそのような何かの余分なビットを行う]。それにもかかわらず、独立性の仮定は依然として完全に合理的です。

飛行機crash落事故のクラスターはどうですか?

はい。ポアソンプロセス(またはその他のランダムプロセス)が与えられた場合、いくつかのクラスターが発生すること予想されます。

実際、Poisson ProcessのエントリにあるOxford Statistics of Statisticsで説明されているように(これは「ランダム性の数学的な記述」です):

[R]andomness usually gives rise to apparent clustering, despite the natural
expectation that randomness would lead to regularity.

たとえば、次の簡単なRコードをご覧ください。

set.seed(123)
x <- runif(500)
y <- runif(500)

plot(x, y, pch=20, col='blue', main="A Random Distribution of Points")

生成するもの:
塊に気づきましたか?

これはランダムな点のプロットであることがわかっていても、ランダムではないビットがあるように見えます。具体的には、グラフの一部には点の塊があり、他の部分は大きく開いています。記事で説明しようとしているのは、これと同じ種類の動作です(時系列データのみであり、空間データではありません)。


更新:

@JoelW .:それで、たとえば、明日(またはその問題の任意の日)に飛行機がthe落する確率を「p」としましょう(「p」は100分の1のようなものだとしましょう)。

次の飛行機crash落事故がちょうど1年(2015年 7月26日)に発生する可能性よりも明日発生する可能性が高い理由は、次のcrash落事故がちょうど1年に発生する確率が次と等しいためです。

= Prob(crash tomorrow) * Prob(365 days with *no* crashes)

理にかなっていますか?

最終的に、これらのものが直感に反する理由は、通常、次のようなフレーズを考えるときだと思います"The odds of a plane crash in one month compared with the odds of one happening tomorrow"。当然、正確に1か月で始まる24時間はすぐには考慮されません。代わりに、私たち(または少なくとも私はそう)は、より柔軟に柔軟に考える傾向があります。次のようになりますa month ± a weekそれと、その間にクラッシュが発生しない可能性を考慮に入れることを忘れているという事実...

ふう!


追加のリソース:

  • クラスタリングイリュージョンに関するウィキペディアの記事
  • PDF具体的かつ簡単に(8ページ)面クラッシュの「クラスタリング」を言及の数学説明ポアソンプロセス

1
@Joel W:実は、私はこの答えにもっと追加する必要があります-編集に私に数分を与える...
スティーブ・S

7
旅行を遅らせるための議論は、TSAが飛行機に乗った爆弾を持つ統計学者をどのように見つけたかについての古いジョークに現れるものと同じです。自分自身を説明するよう求められた場合、統計学者はまあ、爆弾を持つ一人のオッズは快適さのための小さなまだありません十分に小さいですが、オッズ」と述べた2爆弾を持つ人々は微小です。ときので、私は爆弾を持って、そこにあります2発の爆弾が発生する可能性はほとんどなく、完全に安全になります。」
whuber

1
@whuberのジョークは適切ですが、「クラッシュの短い間隔は実際には長いものよりも可能性が高い」と言うことと、明日のクラッシュの確率はクラッシュの有無とは無関係であると言うこととの間に論理的な断絶があるようです今日発生しました。確率は直観に反すると思います。
ジョエル・W.

1
(私にとって)直観に反するのは、まれなイベントは近いうちに発生する傾向があるということです。直観的には、まれな出来事はすぐには起こらないと思います。私はその直感的なビューを持つ唯一のものですか?
ジョエルW. 14

1
@スティーブS:リンクありがとうございます。ニュース記事の想定値(1/365)の指数分布はどのようになりますか?いずれにせよ、おそらく指数分布は記事の見出しに対応していません。これは、特定の数のイベントが短期間に発生する確率と、その数のイベントが長期に発生する確率の比較を意味します。 。
ジョエルW. 14

4

飛行機のof落回数がポアソン分布である場合(彼が述べているように)、crash落間の時間には指数分布があります。指数分布の確率密度関数は、時間の単調減少関数です。したがって、以前のクラッシュは後のクラッシュよりも可能性が高くなります。


「衝突間の短い間隔は、実際には長い衝突よりも可能性が高い」これは、飛行機の衝突が発生したばかりの場合、すべての私たちの今後の旅行を遅らせるべきであると言うこととはどう違いますか?
ジョエルW. 14

2
ジョエル、その引用は、その著者が「短い」と「長い」の意味を定量化するまで意味がありません。年に1回の予想率を持つイベントの彼の例では、次の月に再発する可能性は、次のクラッシュが1年以上後に発生する可能性よりもはるかに低くなります。彼が意味していたのは、単位時間あたり確率が長期よりも短期で大きいということです。実際の確率を比較するには、単位時間あたりの確率に期間を掛ける必要があります(技術的には、期間にわたってそれを統合する必要があります)。
whuber

@whuber:見出しは、飛行機事故のクラスターの可能性について語っています。スタックエクスチェンジについては、これまでのところ、飛行機事故のクラスターが広く間隔を空けた飛行機事故よりもありふれたものであるか、そうであると私を納得させませんでした。ですから、ニュースメディアからの引用はまったく誤解を招くものであると思われます(おそらく、あなたが書いたように時間間隔が特定されていないからでしょう)。どう思いますか?
ジョエルW. 14

「広く間隔を空けた飛行機事故」があなたが何を意味しているのか分かりませんし、そのことに関して、「クラスター」が何であるかを完全に理解していますか。状況を具体的にするために、0、10、11、12、および22年(最初の日付から数えて)に一連のまれなイベントが発生したとします。正確にいくつの「間隔の広い」イベントが発生しましたか?いくつの「クラスター」が発生しましたか?最初の質問に対する防御可能な答えは0から10の範囲であり、2番目の質問に対する答えは0または1です。
whuber

1
@whuber:見出しは、間隔が広い事故よりも事故のクラスターを持っている可能性が高いことを示しています。それを運用可能にしましょう。クラスターが3回の飛行機事故であり、短い期間が3か月、長い期間が3年であるとします。3年の期間内よりも3か月の期間内に3つの事故が発生する可能性が高いと考えるのは非論理的なようです。仮に最初の事故を想定したとしても、今後3年以内に比べて今後3か月以内にさらに2つの事故が発生すると考えるのは非論理的です。
ジョエルW. 14

0

他の答えは、独立したイベントがどのようにクラスター化するかをすでに扱っています。(何年も前に、GleickのChaosを読んで、この考えに目を開きました。)

しかし、実際には、飛行機のcrash落は独立した出来事ではないという強力な証拠があります。Cialdini's Influenceには、これに関する非常に優れた章があります(データへのリンクがいくつかあり、ここでも言及さています。本のその部分の抜粋を見つけまし)。明らかに、これは非常に議論の余地があります。基本的には、飛行機事故が公表されるほど、パイロットに(意識的または無意識的に)影響を与えやすくなると言っています。しかし、仮説の根底にある心理的説明はもっともらしいようであり、データもそれを裏付けているようです。

(コメントに基づいて、統計に基づくデバンキング研究へのリンクを歓迎します。)


それは言わない:「ある種の非常に公表された自殺の物語をすぐに追うと、民間航空のcrash落事故で死ぬ人の数が増加する」と言う。
Scortchi-モニカの復職

申し立ての参考文献は、フィリップス(1978)「殺人と自殺に関する新聞記事の直後に飛行機事故死亡者が増加する」、サイエンス201、pp 748-750です。アブストラクトは「プライベート、ビジネス、および企業経営の飛行機」を指します。
Scortchi -復活モニカ

または、おそらくこれ:フィリップス(1980)、「飛行機事故、殺人、およびマスメディア:模倣と提案の理論に向けて」、ソーシャルフォース58、4、「航空会社」は要約で言及されています。
Scortchi-モニカの復職

2
Altheide(1981)、社会的勢力60むしろの定義のような音- 、2は「非常に公表自殺物語の特定の種類は、」完全に独立して、その後の「平面のクラッシュの定義されていないことを示唆している『有名なラビ』
Scortchi -復活モニカ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.