タグ付けされた質問 「probability」

確率は、特定のイベントの起こりそうな発生の定量的な説明を提供します。

1
ランダム変数とその分布の表記規則
意味の適切な表記法だけでなく、ランダム変数とその分布に関連する表記法の意味についても混乱しています。以下に、私が真実だと思う事柄と、私が理解していない事柄をリストし、入力/修正が大好きです。参照しやすいように、各ポイント/質問に番号を付けました。このような単一の質問に項目をリストするのが適切でない場合は、お知らせください。全部短いので大丈夫だと思いました。 ランダム変数は大文字で表記されます(例:。XXX ランダム変数の操作とはどういう意味ですか?(たとえば、を言葉でどのように解釈しますか?)。X2X2X^2 ランダム変数からの特定の描画は、小文字(例:)、添え字付き小文字(例:)、または大文字付き数字(例:)のいずれかで表記されます。x 1 x 1xxxx1x1x_1X1X1X_1 ある確率変数の順序統計値ランダム変数から引くと表記されて。n X X k nkthkthkthnnnXXXXknXknX_{kn} 「XはF(x)(または「cdf F(x)」または「B(a、b)」または分布を特徴付ける任意の方法で分布する確率変数です)」と書く簡単な方法はありますか? CAN Iライトに従って分布変数の期待値を意味するために?F (x )EF(x)EF(x)\mathbb{E}F(x)F(x)F(x)F(x) たとえば、変数Xのcdfで演算を実行し、を実行して、から最大2つのドローのcdfを取得します。何とか? X XFnew(x)=Fold(x)2Fnew(x)=Fold(x)2F_{new}(x) = F_{old}(x)^2XXXXXX 簡潔に書くのに適切な方法はまたはですか?F 2(x )F (x )2(F(x))2(F(x))2(F(x))^2F2(x)F2(x)F^2(x)F(x)2F(x)2F(x)^2 離散変数と連続変数に表記上の違いはありますか?


3
Nが成功するまでフリップをモデリングするにはどうすればよいですか?
あなたと私は、コインを投げて交代するゲームをすることにしました。最初に合計10個のヘッドをフリップしたプレーヤーがゲームに勝利します。当然、誰が先に行くべきかという議論があります。 このゲームのシミュレーションでは、最初に弾くプレーヤーのほうが2番目に弾くプレーヤーよりも6%多く勝ちます(最初のプレーヤーが約53%勝つ)。これを分析的にモデリングすることに興味があります。 これは二項確率変数ではありません。試行回数が固定されていないためです(誰かが10頭になるまで反転します)。これをどのようにモデル化できますか?負の二項分布ですか? 結果を再作成できるように、ここに私のpythonコードがあります: import numpy as np from numba import jit @jit def sim(N): P1_wins = 0 P2_wins = 0 for i in range(N): P1_heads = 0 P2_heads = 0 while True: P1_heads += np.random.randint(0,2) if P1_heads == 10: P1_wins+=1 break P2_heads+= np.random.randint(0,2) if P2_heads==10: P2_wins+=1 break return P1_wins/N, …


1
対数確率対確率積
このウィキペディアの記事によると、計算をより計算的に最適化するものx⋅yとして確率の積を表すことができ-log(x) - log(y)ます。しかし、例を試してみると言う: p1 = 0.5 p2 = 0.5 p1 * p2 = 0.25 -log(p1) - log(p2) = 2 p3 = 0.1 p4 = 0.1 p3 * p4 = 0.01 -log(p3) - log(p4) = 6.64 確率の積p1とp2高いその後のいずれかp3とp4が、ログ確率が低くなります。 どうして?

3
pdfとpmfとcdfには同じ情報が含まれていますか?
pdfとpmfとcdfには同じ情報が含まれていますか? 私にとって、pdfは特定のポイント(基本的には確率の下の領域)に確率全体を与えます。 pmfは、特定のポイントの確率を示します。 cdfは、特定のポイントの下での確率を​​示します。 だから私にはpdfとcdfは同じ情報を持っていますが、pmfはx分布上の点の確率を与えるのでそうではありません。

3
ロジスティック回帰とデータセット構造
この質問に正しい方法で質問できることを望んでいます。プレイバイプレイのデータにアクセスできるため、最適なアプローチとデータの適切な構築が問題になります。 私がやろうとしているのは、規定に残っているスコアと時間を考慮して、NHLゲームに勝つ確率を計算することです。ロジスティック回帰を使用できると考えていますが、データセットがどのように見えるかはわかりません。ゲームごとに、また興味のある時間ごとに複数の観察結果がありますか?ゲームごとに1つの観測値があり、時間のスライスごとに個別のモデルに適合しますか?ロジスティック回帰は正しい方法でもありますか? あなたが提供できるどんな援助も大歓迎です! 宜しくお願いします。

3
統計と確率は帰納と演ductionに似ていると言えますか?
私はこのスレッドを読みましたが、それは次のように言えるように見えます: 統計=誘導? 確率=控除? しかし、私が見逃している比較について、さらに詳細があるのではないかと思っています。たとえば、統計は帰納法と同等ですか、それとも特定のケースですか?確率は演mathematicalのサブケースであるように見えます(数学的思考のサブケースであるため)。 私はこれが難しい質問であることを知っていますが、ある意味でこれが私が尋ねている理由です-これらの用語を正確に比較する方法を確認したいので。

4
累積ハザード関数の直観(生存分析)
私は、保険数理科学の主な各機能(特にCox比例ハザードモデル)について直感を得ようとしています。ここに私が持っているものがあります: f(x)f(x)f(x):開始時間から始まり、死ぬときの確率分布。 F(x)F(x)F(x):累積分布のみ。時間で、人口の何パーセントが死亡しますか?TTT S(x)S(x)S(x):。時間で、人口の何パーセントが生き残りますか?1−F(x)1−F(x)1-F(x)TTT h(x)h(x)h(x):ハザード関数。まだ生きている人々の与えられた時間で、これは次の時間間隔で死亡する人の数を推定するために使用することができます。TTT H(x)H(x)H(x):累積ハザード。わからない。 特に連続的である場合、ハザード値を組み合わせる背後にある考え方は何ですか?4つの季節の死亡率を示す個別の例を使用し、ハザード関数は次のとおりです。 春から、誰もが生きていて、20%が死ぬ 今、夏に残りの50%が死ぬ 今、秋に残りの75%が死ぬ 最終シーズンは冬です。残りのうち、100%が死ぬ 累積ハザードは20%、70%、145%、245%?? それはどういう意味ですか、なぜこれが便利なのですか?

2
どのような分布形態が「ピタゴラスの期待」を生み出しますか?
ましょと同一の不特定の分布形状からではなく、異なるパラメータ値のための余裕で生成独立した連続的な確率変数です。許容されるすべてのパラメーター値について、次のサンプリング確率が保持されるパラメトリック分布形式を見つけることに興味があります。Y 〜ディスト(θ Y)バツ〜距離(θバツ)X∼Dist(θX)X \sim \text{Dist}(\theta_X)Y〜距離(θY)Y∼Dist(θY)Y \sim \text{Dist}(\theta_Y) P(X> Y| θバツ、θY)= θ2バツθ2バツ+ θ2Y。P(X>Y|θX,θY)=θX2θX2+θY2.\mathbb{P}(X > Y| \theta_X, \theta_Y) = \frac{\theta_X^2}{\theta_X^2 + \theta_Y^2}. 私の質問:誰もがこれが当てはまる継続的な分布形態を教えてくれますか?これにつながる(重要な)一般的な条件はありますか? 私の予備的な考え:両方のパラメーターにゼロ以外の定数を掛けると、確率は変化しないため、が何らかのスケールパラメーターであることが理にかなっています。θθ\theta

6
どのようにして正規分布を発見できましたか?
あなたがすることができ、正規分布の一次微分は何だったその派生を再現し、またその歴史的文脈の中でそれを説明しますか? 人類が正規分布を忘れた場合、私がそれを再発見する最も可能性の高い方法は何ですか?また、最も可能性の高い派生物は何ですか?最初の派生は、二項分布などの基本的な離散確率分布を計算する高速な方法を見つけようとする副産物として来たに違いないと思います。あれは正しいですか?

1
離散均一分布から置換せずに描画されたサンプル間の最大ギャップ
この問題は、ロボットカバレッジに関する私の研究室の研究に関連しています。 セットから数字を置換せずにランダムに描画し、数字を昇順で並べ替えます。 。nnn{1,2,…,m}{1,2,…,m}\{1,2,\ldots,m\}1≤n≤m1≤n≤m1\le n\le m この並べ替えられた数字のリスト、連続する数字と境界の差を生成します。これにより、ギャップが与えられます。{a(1),a(2),…,a(n)}{a(1),a(2),…,a(n)}\{a_{(1)},a_{(2)},…,a_{(n)}\}g={a(1),a(2)−a(1),…,a(n)−a(n−1),m+1−a(n)}g={a(1),a(2)−a(1),…,a(n)−a(n−1),m+1−a(n)}g = \{a_{(1)},a_{(2)}−a_{(1)},\ldots,a_{(n)}−a_{(n-1)},m+1-a_{(n)}\}n+1n+1n+1 最大ギャップの分布は何ですか? P(max(g)=k)=P(k;m,n)=?P(max(g)=k)=P(k;m,n)=?P(\max(g) = k) = P(k;m,n) = ? これは、使用することができるフレーム順序統計量を: P(g(n+1)=k)=P(k;m,n)=?P(g(n+1)=k)=P(k;m,n)=?P(g_{(n+1)} = k) = P(k;m,n) = ? ギャップの分布についてはリンクを参照してくださいが、この質問は最大ギャップの分布を求めています。 平均値\ mathbb {E} [g _ {(n + 1)}]に満足しE[g(n+1)]E[g(n+1)]\mathbb{E}[g_{(n+1)}]ます。 n = mの場合n=mn=mn=m、すべてのギャップはサイズ1ですn+1=mn+1=mn+1 = m場合、サイズ2のギャップが1つ222あり、n+1n+1n+1可能な場所があります。最大のギャップサイズはm−n+1m−n+1m-n+1であり、このギャップはnnn 数字の前または後に配置でき、合計でn+1n+1n+1可能な位置になります。最小の最大ギャップサイズは⌈m−nn+1⌉⌈m−nn+1⌉\lceil\frac{m-n}{n+1}\rceilです。任意の組み合わせT = {m \ choose n} ^ {-1}の確率を定義しますT=(mn)−1T=(mn)−1T= {m \choose n}^{-1}。 P(g …

2
中央極限定理の動的システムビュー?
(元々MSEに投稿されました。) 古典的な中心極限定理のヒューリスティックな議論の多くは、確率密度の空間における「アトラクター」として正規分布(または任意の安定した分布)を語っています。たとえば、Wikipediaの扱いの最上位にあるこれらの文を考えてみましょう。 より一般的な使用法では、中心極限定理は確率論における弱収束定理のセットのいずれかです。それらはすべて、多くの独立した同一に分布した(iid)ランダム変数、または特定の種類の依存関係を持つランダム変数の合計が、アトラクタ分布の小さなセットの1つに従って分布する傾向があるという事実を表しています。iid変数の分散が有限の場合、アトラクタ分布は正規分布です。 この動的システム言語は非常に暗示的です。フェラーはまたに(つまり、言語のソースである場合、私の不思議)彼の第二のボリュームにCLTの彼の治療に「魅力」のことを話す、とのYuval Flimus このノートさえ話す「の魅力の流域。」(私は彼が本当に「の正確な形式意味はないと思うの魅力の流域は、」の正確な形式推論事前にある「のではなくアトラクターが演繹事前にある」;まだ、言語があります。)私の質問は次のとおりです。これらのことができます動的なアナロジーを正確にできますか?多くの本は、正規分布が畳み込み下での安定性(およびフーリエ変換下での安定性)に特別であることを強調しているが、私はそれらの本を知らない。これは基本的に、固定小数点であるため、法線が重要であることを示しています。CLTはさらに進んで、固定小数点ではなく、アトラクタであることを示しています。 この幾何学的な図を正確にするために、位相空間を適切な無限次元関数空間(確率密度の空間)とし、進化演算子を初期条件で畳み込みを繰り返すことを想像します。しかし、私はこの絵をうまく機能させるために必要な技術や、追求する価値があるかどうかについては理解していません。 私はこのアプローチを明確に追求する治療法を見つけることができないので、それができる、または面白いという私の感覚に何か間違っているに違いないと思います。その場合は、その理由を聞きたいです。 編集:Math Stack ExchangeとMathOverflowには、読者が興味を持ちそうな3つの同様の質問があります。 いくつかの分布空間(MO)の固定小数点としてのガウス分布 最大エントロピー(MO)による中心極限定理 いくつかの不動点定理による中心極限定理の証明はありますか?(MSE)

4
十分な試行を行うと、まれなことが起こるという法律がありますか?
ロードされたサイコロに関するビデオを作成しようとしています。ビデオのある時点で、サイコロを約200回転し、すべての6を取り、それらをもう一度ロールし、すべての6を取り、3回目をロールします。連続して3回6を出した1つのダイがありましたが、これは1/216のチャンスがあり、約200のサイコロがあるため、明らかに異常ではありません。それで、それが異常ではないことをどのように説明しますか?大数の法則のようには見えません。「十分なテストを行うと、起こりそうにないことが起こる可能性があります」などのようなことを言いたいのですが、私のパートナーは、人々が「にバインドされた」用語で問題を起こすかもしれないと言いました。 この概念を述べる標準的な方法はありますか?

7
2つのエンベロープの問題の再検討
私はこの問題を考えていました。 http://en.wikipedia.org/wiki/Two_envelopes_problem 私は解決策を信じており、それを理解していると思いますが、次のアプローチをとると完全に混乱します。 問題1: 次のゲームを提供します。あなたは私に10 ドルを支払い、私は公正なコインを投げます。私はあなたに5 ドルを与えて、私はあなたに20 ドルを与えます。 予想は12.5 ドルなので、常にゲームをプレイします。 問題2: 私はあなたに10 ドルの封筒を渡します。封筒は開いていて、確認できます。私はその後、あなたに別の封筒を示し、この時間を閉じて、あなたを教えて:このエンベロープはありどちらか$等しい確率でそれで5か$ 20。交換しますか? これは問題1とまったく同じだと思うので、$ 10を$ 5または$ 20で忘れてしまうので、常に切り替えます。 問題3: 上記と同じですが、封筒を閉じます。したがって、$ 10が存在することはわかりませんが、Xの量があります。他の封筒には2倍または半分があることを伝えます。これで、切り替えたい同じロジックに従う場合。これは封筒のパラドックスです。 封筒を閉じると何が変わりましたか? 編集: 問題3はエンベロープの問題ではないと主張する人もいますが、それぞれがゲームをどのように見ているかを分析することで、なぜだと思うのかを以下に説明します。また、ゲームのセットアップも改善されます。 問題3の明確化を提供します。 ゲームを整理する人の観点から: 私は2つの封筒を持っています。1つに10 ドルを入れてプレーヤーに渡します。それから私は彼に言った、私はあなたに与えた封筒の量の2倍または半分の封筒をもう1つ持っている。切り替えますか?その後、公正なコインと5 ドルを入れたヘッズと20 ドルを入れたテールを裏返します。そして彼に封筒を渡します。それから私は彼に尋ねます。あなたが私にくれた封筒は、あなたが持っている封筒の量の2倍または半分です。切り替えますか? プレーヤーの観点から: 封筒が渡され、同じ確率で2倍または半分の量の封筒がもう1つあると言われます。切り替えますか?私はを持っていると思うので、なので、切り替えたいと思います。私は封筒を手に入れ、突然同じ状況に直面しています。もう1つのエンベロープの量が2倍または半分になったので、もう一度切り替えたいと思います。XXX12(12X+2X)>X12(12X+2X)>X\frac{1}{2}(\frac{1}{2}X + 2X) > X

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.