タグ付けされた質問 「probability」

確率は、特定のイベントの起こりそうな発生の定量的な説明を提供します。

10
「尤度」と「確率」の違いは何ですか?
ウィキペディアのページには、可能性と確率が明確な概念であると主張しています。 非技術用語では、「可能性」は通常「確率」の同義語ですが、統計的な使用法では、明確な区別があります。観察された結果が与えられたパラメータ値のセットの尤度。 誰かがこれが何を意味するのか、より現実的な説明を与えることができますか?さらに、「確率」と「可能性」がどのように一致しないかを示す例もあります。

12
95%信頼区間(CI)が95%の平均を含む可能性を意味しないのはなぜですか?
ここで関連するさまざまな質問を通じて、「95%信頼区間」と呼ばれる「95%」の部分は、サンプリングとCI計算の手順を何度も正確に複製するという事実に言及しているというコンセンサスがあるようです。 、こうして計算されたCIの95%に母平均が含まれます。また、この定義はそうではないというコンセンサスのようです単一の95%CIから、平均がCI内のどこかに落ちる可能性が95%あると結論付けることを許可します。ただし、95%の人口が人口の平均を含むと多くのCIを想像している限り、前者が後者を暗示していないことを理解していません(実際に計算されたCIが人口を含むかどうかに関して意味するかどうか)想像されるケースのベースレート(95%)を、実際のケースにCIが含まれる確率の推定値として使用することを強制しますか? 「実際に計算されたCIには母集団の平均が含まれているか含まれていないため、確率は1または0である」という行に沿って議論している記事を見ましたが、これは依存する確率の奇妙な定義を暗示しているようです未知の状態(つまり、友人が公正なコインを裏返し、結果を非表示にし、50%の可能性があると言ってはいけません)。 確かに私は間違っていますが、私のロジックがどこでおかしくなったのかわかりません...

6
1を超える確率分布値でも問題ありませんか?
上の単純ベイズ分類器についてのWikipediaのページ、この行があります: p(height|male)=1.5789p(height|male)=1.5789p(\mathrm{height}|\mathrm{male}) = 1.5789(1を超える確率分布は問題あり。釣鐘曲線の下の面積は1です。) 値でも問題ありませんか?すべての確率値は範囲で表現されると思いました。さらに、そのような値を持つことが可能であるとすると、ページに示されている例ではその値はどのように取得されますか?>1>1>10≤p≤10≤p≤10 \leq p \leq 1

14
Amazonインタビューの質問-2回目のインタビューの確率
Amazonのインタビューでこの質問を受けました。 最初のインタビューを受けるすべての人の50%が2番目のインタビューを受ける 2回目のインタビューを受けた友人の95%が、最初のインタビューが良かったと感じた 2回目のインタビューを受けなかった友人の75%が、最初のインタビューが良かったと感じた あなたが最初の面接が良かったと感じた場合、2回目の面接を受ける確率はどのくらいですか? 誰かがこれを解決する方法を説明できますか?単語の問題を数学に分解するのに苦労しています(インタビューはもう終わりです)。実際の数値的な解決策はないかもしれないと理解していますが、この問題をどのように通り抜けるかについての説明が役立つでしょう。 編集:まあ、2番目のインタビューを取得しました。誰かが興味があるなら、私は以下の回答の組み合わせである説明に行きました:情報が足りない、代表的なサンプルではない友人など、いくつかの確率を通して話をしました。しかし、すべての回答に感謝します。

3
なぜ確率空間を定義するためにシグマ代数が必要なのですか?
サンプル空間形成するさまざまな結果を使用したランダムな実験があり、イベントと呼ばれる特定のパターンに興味を持って調べますシグマ代数(またはシグマフィールド)は、確率測定を割り当てることができるイベントで構成されています。nullセットとサンプル空間全体の包含、ベン図表との結合と交点を記述する代数など、特定のプロパティが満たされています。 Ω,Ω,\Omega,F。P ∅ F.F.\mathscr{F}. PP\mathbb{P}∅∅\varnothing 確率は、代数と区間間の関数として定義されます。全体で、トリプルは確率空間を形成します。σσ\sigma[0,1][0,1][0,1](Ω,F,P)(Ω,F,P)(\Omega, \mathscr{F}, \mathbb{P}) 誰かが代数を持っていなかった場合に確率構造が崩壊する理由を簡単な英語で説明できますか?それらは、その書道「F」がありえないほど真ん中に押し込まれています。それらが必要だと信じています。イベントは結果とは異なることがわかりますが、\ sigma-代数がなければ何がおかしくなりますか?σσ\sigmaσσ\sigma 問題は、どのタイプの確率問題において、σσ\sigma代数を含む確率空間の定義が必要になるかです。 ダートマス大学のWebサイトにあるこのオンラインドキュメントは、わかりやすい英語の説明を提供します。アイデアは、単位周囲の円上で反時計回りに回転する回転ポインターです。 まず、図に示すように、単位円の円とポインターで構成されるスピナーを作成します。円上の点を選択してにラベルを付け、次に、円上の他のすべての点に、から反時計回りに測定した距離(など)のラベルを付けます。実験では、ポインターを回転させ、ポインターの先端にあるポイントのラベルを記録します。ランダム変数にこの結果の値を示します。サンプル空間は明らかに間隔000xxx000XXX[0,1)[0,1)[0,1)。各結果が等しく発生する可能性がある確率モデルを構築したいと思います。可能性のある結果の数が限られている実験で[...]のように進めた場合、可能性のある結果のすべてについて確率の合計がそうでないため、確率を各結果に割り当てる必要があります等しい1(実際、数え切れない数の実数を合計するのは難しい仕事です;特に、そのような合計が何らかの意味を持つためには、せいぜい数え切れないほどの被加数の多くがと異なる場合があり。)割り当てられた確率の全ては、その後、合計があり、 ではなくそれがあるべきように、。000000000000111 したがって、各ポイントに確率を割り当て、(数え切れないほど)無限の数のポイントがあるとすると、それらの合計はます。>1>1> 1

21
制限のある無限プロセスの各ステップで、10個のボールを骨putに入れ、ランダムに1個取り出します。いくつのボールが残っていますか?
次のように質問(わずかに修正)が行くとあなたがそれに遭遇したことがない場合は、実施例6a、第2章、シェルドン・ロスの中でそれを確認することができます前に、最初のコース確率で: 無限に大きなnumberと、ボール番号1、番号2、番号3などのラベルが付いたボールの無限のコレクションを持っているとします。次のように実行される実験について考えてみましょう。1分から12時に、1から10の番号が付けられたボールが骨urに置かれ、1つのボールがランダムに取り除かれます。(撤回に時間がかからないと仮定します。)1/2分から12 PMに、11から20の番号のボールが骨nに置かれ、別のボールがランダムに取り除かれます。14:00から12P.M.に、21から30の番号が付けられたボールが骨nに置かれ、別のボールがランダムに取り除かれます...など。興味深いのは、午後12時に骨nの中にいくつのボールがあるかということです。 この質問は、提起されているように、基本的に誰もが誤解することを強制します-通常、直観は、午後12時に無限に多くのボールがあると言うことです午後12時 確率論を教えるとき、この問題は直感的な説明をするのが非常に難しいものの一つです。 一方で、次のように説明することができます。「午後12時にボールiがurにいる確率を考えてください。無限のランダムドロー中に、最終的に削除されます。これはすべてのボールに当てはまります。それらの最後にあることができます」。 しかし、生徒たちは「しかし、私は毎回10個のボールを入れて、1個のボールを取り除いています。最後にボールがなくなることは不可能です」と正しく主張します。 これらの矛盾する直観を解決するために彼らに与えることができる最良の説明は何ですか? また、この問題は不適切なものであり、より適切に定式化すると「パラドックス」が消えるという議論や、パラドックスが「純粋に数学的」であるという議論も受け入れています(ただし、それについて正確に説明してください)。

9
期待値最大化を理解するための数値例
EMアルゴリズムを十分に把握して、実装して使用できるようにしています。私は丸1日、理論と、レーダーからの位置情報を使用して航空機を追跡するためにEMが使用される論文を読みました。正直なところ、私は根本的なアイデアを完全に理解しているとは思わない。簡単な問題(ガウス分布や正弦波系列のシーケンスの推定、線のフィッティングなど)のためのEMの数回の反復(3-4)を示す数値例を誰かに教えていただけますか。 誰かが(合成データを使用して)コードの一部を指し示すことができたとしても、そのコードをステップスルーしてみることができます。


16
1000人中900人が車が青だと言った場合、青である確率はどのくらいですか?
これは最初、自然なテキストを分類するためにモデルに対して行っているいくつかの作業に関連して生じましたが、私はそれを単純化しました...おそらく多すぎます。 あなたは青い車を持っています(客観的な科学的尺度によると-それは青です)。 1000人に見せます。 900は青だと言います。100はありません。 車を見ることができない人にこの情報を与えます。彼らが知っているのは、900人が青いと言い、100人はそうではなかったということです。あなたはこれらの人々(1000)についてこれ以上何も知りません。 これに基づいて、「車が青くなる確率はいくらですか?」 これは私が尋ねた人々の間で意見の大きな相違を引き起こしました!正しい答えは何ですか?
114 probability 

6
ポイントを獲得する可能性が58%の場合、ピンポンゲームで21を獲得し、2で勝つ可能性はどのくらいですか?
同僚と賭けをして、50のピンポンゲーム(最初に21ポイントを獲得し、2で勝った)のうち、50をすべて勝ち取るという賭けをしました。ポイントに加えて、私はこれまでにすべてのゲームに勝ちました。私はポイントを獲得する可能性が58%であり、ポイントを獲得する可能性が42%あるかどうか疑問に思っています。ゲームに勝つ可能性は何パーセントですか?確率の差を埋めることができる公式はありますか? 私たちはあちこちでグーグル検索を行い、会社のデータサイエンティストに尋ねさえしましたが、正解は見つかりませんでした。 編集:うわー、私は応答の徹底に感銘を受けています。本当にありがとうございました!!! 人々が好奇心を抱いている場合には、賭け方の最新情報があります。50試合中18試合に勝ったので、さらに32試合に勝つ必要があります。私はすべてのポイントの58.7%を獲得したため、対戦相手は41.3%のポイントを獲得しました。私の対戦相手の標準偏差は3.52、彼の平均スコアは14.83、彼の中央値は15.50です。以下は、これまでの各ゲームのスコアのスクリーンショットです。人々が興味を持っている場合、賭けが進むにつれて更新を続けることができます。 編集#2:残念ながら、まだいくつかのゲームしかプレイできませんでした。結果は以下のとおりです。スコアのスクリーンショットの束がないように、写真を交換し続けるだけです。 最終更新:ゲーム#28で同僚についに負けました。彼は私を21-13でbeatった。ご協力ありがとうございます!

5
「クローズドフォームソリューション」とはどういう意味ですか?
「クローズドフォームソリューション」という用語に出くわすことがよくあります。閉じた形式のソリューションとはどういう意味ですか?特定の問題に対して厳密な形式の解決策が存在するかどうかをどのように判断しますか?オンラインで検索すると、いくつかの情報が見つかりましたが、統計的または確率的モデル/ソリューションを開発するという文脈では何も見つかりませんでした。 私は回帰を非常によく理解しているので、だれかが回帰またはモデルのあてはめを参照して概念を説明できるなら、それは使いやすいでしょう。:)

9
現実の単一の将来のイベントの確率:「ヒラリーは75%の確率で勝つ」と言うとき、それはどういう意味ですか?
選挙は1回限りのイベントであるため、繰り返すことのできる実験ではありません。「ヒラリーは勝つ可能性が75%ある」という言葉は、厳密には技術的に何を意味するのでしょうか?直感的または概念的な定義ではなく、統計的に正しい定義を求めています。 私は、アマチュア統計のファンであり、議論の中で出てきたこの質問に答えようとしています。客観的な反応があると確信していますが、自分で考え出すことはできません...

3
例:バイナリ結果にglmnetを使用したLASSO回帰
私は興味のある結果が二分されglmnetているLASSO回帰の使用に手を出し始めています。以下に小さな模擬データフレームを作成しました。 age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67, 0.91, 0.29, 0.88) m_edu <- c(0, 1, 1, 2, 2, 3, 2, 0, 1) p_edu <- c(0, 2, 2, …
77 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 

10
ベイジアン対頻繁な議論の*数学的な*根拠はありますか?
ウィキペディアでは次のように述べています: [確率の]数学は、確率の解釈とはほとんど無関係です。 質問:私たちは数学的に正しいことをしたい場合はその後、我々は禁止すべきではない任意の確率の解釈を?すなわち、ベイジアンと頻度の両方が数学的に間違っていますか? 私は哲学が好きではありませんが、数学は好きです。コルモゴロフの公理の枠組みの中で独占的に働きたいです。これが私の目標である場合、ウィキペディアでベイジアン主義と頻度主義の両方を拒否すべきであると言っていることに従うべきでしょうか?概念が純粋に哲学的であり、数学的なものではない場合、最初に統計に表示されるのはなぜですか? 背景/コンテキスト: このブログ投稿ではまったく同じことを言っていませんが、テクニックを「ベイジアン」または「フリークエンシー」に分類しようとすることは、実際的な観点からは逆効果であると主張しています。 ウィキペディアからの引用が真である場合、哲学的観点から統計的方法を分類しようとすることも逆効果であるように思われます-方法が数学的に正しい場合、基礎となる数学の仮定の際に方法を使用することは有効ですそうでなければ、数学的に正しくない場合、または仮定が成り立たない場合、それを使用することは無効です。 一方、多くの人が確率論(つまりコルモゴロフの公理)で「ベイジアン推論」を特定しているように見えますが、その理由はよくわかりません。いくつかの例は、ジェームズ・ストーンの本「ベイズ・ルール」と同様に、「確率」と呼ばれるベイズ推論に関するジェインズの論文です。したがって、これらの主張を額面どおりに受けた場合、それはベイジアン主義を好むべきであることを意味します。 しかし、Casella and Bergerの本は、最尤推定量について説明しているが、最大事後推定量を無視しているため、頻繁に使用されているように見えますが、その中のすべてが数学的に正しいようにも見えます。 それでは、統計的に数学的に正しいバージョンのみが、ベイジアン主義と頻度主義に関して完全に不可知ではないことを拒否するということになるのではないでしょうか?両方の分類のメソッドが数学的に正しい場合、正確で明確に定義された数学よりも曖昧で不明確な哲学を優先するため、他のものよりもいくつかを好むのは不適切な実践ではありませんか? 要約:要するに、ベイジアン対頻繁な議論の数学的根拠が理解できず、議論の数学的根拠がない場合(これはウィキペディアが主張するものです)、なぜそれが容認されるのか分かりませんすべてが学術的な談話です。

6
確率の収束とほぼ確実な収束
これら2つの収束の尺度の違いを実際に見たことはありません。(または、実際には、さまざまなタイプの収束のいずれかですが、特にこれらの2つは、多数の弱法則と強力な法則のために言及しています。) 確かに、私はそれぞれの定義を引用し、それらが異なる場合の例を与えることができますが、それでもまだよくわかりません。 違いを理解する良い方法は何ですか?なぜ違いが重要なのですか?それらが異なる特に記憶に残る例はありますか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.