タグ付けされた質問 「probability」

確率は、特定のイベントの起こりそうな発生の定量的な説明を提供します。

7
(巨大な)ひねりを加えた誕生日のパラドックス:正確に同じ生年月日をパートナーと共有する確率?
私はボーイフレンドと同じ生年月日、同じ日付、同じ年を共有しています。私たちの生年月日はわずか5時間ほどしか離れていません。 私と同じ日に生まれた人に会う可能性はかなり高いことを知っていますし、誕生日のパラドックスについて読んだことはほとんどありませんが、私の誕生日を共有する人を知っていますアカウントに同じ年。以前に確率について議論したことがありますが、私はまだ満足していません。私のポイントは、あなたが関係にある確率を考慮すれば、チャンスはわずかであるということでした(Xの時間の間、それで成功します)。考慮すべき要因の量は非常に膨大です(ポイント、性別、年齢、可用性、地域での分離の可能性など)。 このようなものの確率を計算することさえ可能ですか?どうしますか?

1
ランダム対称行列を生成する場合、正定である可能性はどのくらいですか?
いくつかの凸最適化を実験していたときに、奇妙な質問を受けました。質問は: ランダム(標準正規分布など)で対称マトリックスを生成するとします(たとえば、上三角マトリックスを生成し、下半分を埋めて対称であることを確認します)。これは正定マトリックスである可能性があります?とにかく確率を計算する方法はありますか?N× NN×NN \times N

6
中心極限定理が成り立たない例はありますか?
ウィキペディアによると- 確率理論では、中心極限定理(CLT)は、ほとんどの場合、独立したランダム変数が追加されると、元の変数自体ではなくても、適切に正規化された合計が正規分布(非公式に「ベル曲線」)になる傾向があることを確立します正規分布しています... 「ほとんどの状況で」と書かれている場合、どのような状況で中心極限定理は機能しませんか?

8
最初にベイジアン統計または頻度統計を教える必要がありますか?
私は現在高校生で、統計を理解している少年たちを助けています。そして、理論を垣間見ることなく、いくつかの簡単な例から始めることを考えています。 私の目標は、統計をさらに追求し、定量的学習に興味を持たせるために、統計をゼロから学習するための最も直感的でありながら建設的なアプローチを提供することです。 ただし、始める前に、非常に一般的な意味を持つ特定の質問があります。 ベイジアンまたは頻度主義のフレームワークを使用して統計を教え始める必要がありますか? よく調べてみると、一般的なアプローチは、頻繁な統計の簡単な紹介から始まり、その後にベイジアン統計の詳細な議論が続きます(例:Stangl)。

2
片側チェビシェフ不等式のサンプルバージョンは存在しますか?
チェビシェフ不等式の次の片側Cantelli版に興味があります。 P(X−E(X)≥t)≤Var(X)Var(X)+t2.P(X−E(X)≥t)≤Var(X)Var(X)+t2. \mathbb P(X - \mathbb E (X) \geq t) \leq \frac{\mathrm{Var}(X)}{\mathrm{Var}(X) + t^2} \,. 基本的に、母平均と分散がわかっている場合、特定の値を観測する確率の上限を計算できます。(少なくとも私の理解はそうでした。) ただし、実際の母集団の平均と分散の代わりに、標本の平均と標本の分散を使用したいと思います。 これにより不確実性が高まるため、上限が増加すると推測しています。 上記に類似した不等式はありますが、サンプルの平均と分散を使用していますか? 編集:チェビシェフ不等式の「サンプル」アナログ(片面ではない)が作成されました。Wikipediaのページには、いくつかの詳細を持っています。ただし、上記の片側のケースにどのように変換されるかはわかりません。

8
この人が女性である確率はどのくらいですか?
カーテンの後ろに人がいます-私はその人が女性か男性かを知りません。 私はその人が長い髪を持っていること、そして長い髪を持つすべての人々の90%が女性であることを知っています 私はその人が希少な血液型AX3を持っていること、そしてこの血液型を持つすべての人々の80%が女性であることを知っています。 人が女性である確率はどのくらいですか? 注:この元の定式化は、さらに2つの仮定を加えて拡張されました。1。血液型と髪の長さは独立しています。 (ここでの特定のシナリオはそれほど適切ではありません-むしろ、私はこれに答えるための正しいアプローチを心に留める必要がある緊急のプロジェクトを持っています。異なる統計理論による複数の議論のできる答えを持つものよりも)



13
条件付き確率の式の背後にある直感は何ですか?
以下のための式の条件付き確率のことを考慮起こっが起こったである:B P (AAA\text{A}BB\text{B}P(A | B)=P(A∩B)P(B).P(A | B)=P(A∩B)P(B). P\left(\text{A}~\middle|~\text{B}\right)=\frac{P\left(\text{A} \cap \text{B}\right)}{P\left(\text{B}\right)}. 私の教科書は、ベン図の観点からこの背後にある直感を説明しています。 ことを考える発生したこと、のための唯一の方法イベントがの交差点に入ることで発生するためであると。A A BBB\text{B}AA\text{A}AA\text{A}BB\text{B} その場合には、確率ではないだろう単にの確率に等しくなる交差点ため、それがイベントが発生する唯一の方法ですか?私は何が欠けていますか? A BP(A|B)P(A|B)P\left(\text{A} \middle| \text{B}\right)AA\text{A}BB\text{B}

2
FIFAパニーニアルバムを完成させるには、何枚のステッカーが必要ですか?
FIFA Panini Online Sticker Albumをプレイしています。これは、サッカーワールドカップ、欧州選手権、およびその他のトーナメント向けに通常公開されている古典的なPaniniアルバムをインターネットで採用したものです。 アルバムには、424種類のステッカーのプレースホルダーがあります。ゲームの目的は424個すべてを集めることです。ステッカーは5パック入りで、オンラインで見つけたコードから入手できます(または、古典的な印刷アルバムの場合は、地元の新聞売り場で購入します)。 私は次のことを仮定しています: すべてのステッカーは同じ量で発行されます。 ステッカーの1パックには重複が含まれていません。 424個のユニークステッカーがすべて揃っていることを合理的に(90%の場合)確認するために取得する必要があるステッカーのパックの数を調べるにはどうすればよいですか?

3
誕生日のパラドックスを2人以上に拡大する
伝統的な誕生日のパラドックスでは、質問は「nnn人のグループの2人以上が誕生日を共有する可能性はどれくらいか」です。私はこれの延長である問題で立ち往生しています。 2人が誕生日を共有する確率を知るのではなく、xxx人以上の人が誕生日を共有する確率を知るために質問を拡張する必要があります。ではx=2x=2x=2、あなたには二人が誕生日を共有していないとのことを引く確率を計算することにより、これを行うことができます111が、私はより多くの数にこのロジックを拡張することができるとは思わないxxx。 これをさらに複雑にするために、nnn(数百万)およびxxx(数千)の非常に大きな数に対して機能するソリューションも必要です。

1
統計モデルと確率モデルの違いは?
応用確率は、計算確率を含む確率の重要な分岐です。統計は確率理論を使用してデータを処理するモデルを構築しているため、私の理解では、統計モデルと確率モデルの本質的な違いは何ですか?確率モデルは実際のデータを必要としませんか?ありがとう。

3
R:データセットにNaNがないにもかかわらず、「Forest function call」エラーでNaN / Infをスローするランダムフォレスト[非公開]
キャレットを使用して、データセットに対してクロス検証されたランダムフォレストを実行しています。Y変数は要因です。データセットにNaN、Inf、またはNAはありません。ただし、ランダムフォレストを実行すると、 Error in randomForest.default(m, y, ...) : NA/NaN/Inf in foreign function call (arg 1) In addition: There were 28 warnings (use warnings() to see them) Warning messages: 1: In data.matrix(x) : NAs introduced by coercion 2: In data.matrix(x) : NAs introduced by coercion 3: In data.matrix(x) : NAs introduced by …

2
Statistics.comは間違った答えを公開しましたか?
Statistics.comは今週の問題を発表しました: 住宅保険詐欺の率は10%です(10件の請求のうち1件が不正です)。コンサルタントは、機械学習システムを提案して、クレームをレビューし、それらを詐欺または詐欺に分類しました。このシステムは、不正請求の検出には90%の効果がありますが、詐欺ではない請求を正しく分類するには80%しか効果がありません(誤って5分の1を「詐欺」と分類します)。システムがクレームを不正と分類する場合、実際に不正である可能性はどのくらいですか? https://www.statistics.com/news/231/192/Conditional-Probability/?showtemplate=true 私の同僚と私は両方とも独立して同じ答えを思いつきましたが、公開されているソリューションとは一致しません。 私たちのソリューション: (.9 * .1)/((。9 * .1)+(。2 * .9))= 1/3 彼らの解決策: これは条件付き確率の問題です。(これはベイジアンの問題でもありますが、ベイズ規則に式を適用すると、何が起こっているのかわかりにくくなります。)100件のクレームを検討してください。10は不正であり、システムはそれらのうち9を正しく「詐欺」とラベル付けします。不正であるが、実際に不正であるのはそのうちの9%(11%)のみです。 誰が正しかった

3
Brain-teaser:均一な[0,1]分布から引き出されたときに単調に増加しているiidシーケンスの予想される長さは何ですか?
これは、ここで報告されている定量アナリストの立場に対するインタビューの質問です。均一な分布から描画し、描画がiidであると仮定すると、単調に増加する分布の予想される長さは何ですか?つまり、現在の描画が前の描画以下である場合、描画を停止します。[0,1][0,1][0,1] 最初の数個を取得しました: \ Pr (\ text {length} = 2)= \ int_0 ^ 1 \ int_ {x_1} ^ 1 \ int_0 ^ {x_2} \ mathrm {d} x_3 \、\ mathrm {d} x_2 \、\ mathrm {d} x_1 = 1/3 \ Pr(\ text {length} = 3)= \ int_0 ^ 1 \ int_ {x_1} ^ …

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.