タグ付けされた質問 「probability」

確率は、特定のイベントの起こりそうな発生の定量的な説明を提供します。

4
並列の抵抗の分散
抵抗Rのセットがあり、そのすべてが平均μと分散σで分布しているとします。 次のレイアウトの回路のセクションを考えてみましょう:(r)|| (r + r)|| (r + r + r)。各部品の等価抵抗は、r、2r、および3rです。各セクションの分散は次のようになりσ2σ2σ^2、2σ22σ22σ^2、3σ23σ23σ^2。 回路全体の抵抗の変動はどのくらいですか? 数百万点をサンプリングした後、分散は約.10286 \ sigma ^ 2であることがわかりました.10286σ2.10286σ2.10286\sigma^2。 この結論に分析的にどのように到達するのでしょうか? 編集:抵抗値は、いくつかの平均抵抗rと分散σ^ 2で正規分布していると想定されていますσ2σ2σ^2。

1
R線形回帰のカテゴリ変数「非表示」の値
これは私が何度か遭遇した例にすぎないため、サンプルデータはありません。Rで線形回帰モデルを実行する: a.lm = lm(Y ~ x1 + x2) x1は連続変数です。x2カテゴリ型で、「低」、「中」、「高」の3つの値があります。ただし、Rによって与えられる出力は次のようになります。 summary(a.lm) Estimate Std. Error t value Pr(>|t|) (Intercept) 0.521 0.20 1.446 0.19 x1 -0.61 0.11 1.451 0.17 x2Low -0.78 0.22 -2.34 0.005 x2Medium -0.56 0.45 -2.34 0.005 私は、Rがそのような要因(要因x2であること)に何らかのダミーコーディングを導入していることを理解しています。私はただ疑問に思っていx2ます。「高」の値をどのように解釈しますか?たとえば、ここで示した例の「High」x2は応答変数にどのような影響を与えますか? これの例を他の場所(例:ここ)で見ましたが、理解できる説明は見つかりませんでした。
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 

1
シーケンスの減少を証明する(多数の点をプロットすることでサポートされます)
先月私がSEに投稿した質問の多くは、この特定の問題を解決する手助けをすることを目的としています。質問はすべて答えられましたが、それでも解決策は思いつきません。それで、私が直接解決しようとしている問題を尋ねるだけでよいと考えました。 LET、、、(整数)、毎オーバー累積分布関数である 。Xn∼FnXn∼FnX_n \sim F_nFn=(1−(1−Fn−1)c)cFn=(1−(1−Fn−1)c)cF_n = (1-(1-F_{n-1})^c)^cF0=xF0=xF_0 = xc≥2c≥2c\geq 2FnFnF_n(0,1)(0,1)(0,1) がすべての(または特定の)でもとともに減少することを証明したい!私が見ることができ、そのに固有の溶液でディラック質量に収束 の場合、。同じに対してを増加させるための累積分布関数のプロットを見ると、すべての累積分布関数が交差しています。値の値について減少する未満の値に対する増加より大きいEXnEXn\mathbb{E}X_nnnnccccccFnFnF_nxc=(1−(1−x)c)c)xc=(1−(1−x)c)c)x_c = (1-(1-x)^c)^c)c=2c=2c=2x2=(3−5–√)/2≈.38x2=(3−5)/2≈.38x_2 = (3-\sqrt{5})/2 \approx .38nnncccxnxnx_nF(x)F(x)F(x)xxxxnxnx_nxxxxnxnx_n(が増加するにつれて)垂直線に収束します。nnnxnxnx_n 下のプロットであるためのののためのに。もちろん離散プロットですが、見やすくするために線をつないでいます。このプロットを生成するために、MathematicaでNIntegrateを使用しましたが、何らかの理由でMathematicaが元の関数高い値で応答を生成できなかったため、で実行する必要がありました。ヤングの定理に従って、2つは同等である必要があります。私の場合、、。EXnEXn\mathbb{E}X_nn=1n=1n = 1404040c=2c=2c = 27771−F−1n1−Fn−11-F^{-1}_nnnn∫10F(x)dx=∫101−F−1(x)dx∫01F(x)dx=∫011−F−1(x)dx\int_0^1F(x)\,dx = \int_0^1 1-F^{-1}(x)\,dxF−1n(x)=1−(1−(F−1n−1)1c)1cFn−1(x)=1−(1−(Fn−1−1)1c)1cF^{-1}_n(x) = 1-(1-(F^{-1}_{n-1})^{\frac{1}{c}})^{\frac{1}{c}}F−1n=xFn−1=xF^{-1}_n = x ご覧のとおり、は、固定点から微小距離まで非常に移動します。以下のように増加、固定小数点減少は(最終的に0になります)。EXnEXnEX_nxcxcx_cccc したがって、すべてのについて、がとともに減少することは確かに事実です。しかし、それを証明することはできません。誰かが私を助けてくれますか?(繰り返しになりますが、が1つでも満足します)できない場合でも、この特定の問題が解決できない理由について洞察があれば、その洞察も共有してください。 EXnEXnEX_nnnncccccc

1
複数のクラスがある場合、分類子の確率しきい値をどのように調整できますか?[重複]
この質問にはすでにここで答えがあります: 混同行列を取得するためにマルチクラス確率予測をしきい値処理する方法は? (1つの答え) 3か月前に閉鎖。 上記は、いくつかの確率に基づいて、バイナリクラスのケースの確率分類子出力が0または1の非常に単純な例です。 さらに、しきい値を変更する方法は簡単です。しきい値を50%より高くまたは低く設定して、精度/再現率のバランスを変更し、独自の状況に合わせて最適化します。 ただし、マルチクラスシナリオで同じ考え方をしようとすると、下の図に示すように3つのクラスでも(これらは確率であると想像してください) どのようにして、しきい値をシフトする方法を考え始めますか? デフォルトでは、最も確率の高いクラスを使用します(ここではクラス3)。 このバランスを取りたい場合(精度/再現率に影響を与えるため)、何ができますか? 最初の最も支配的なクラスをそれらを再正規化し、これらの2つの間にしきい値を設定することを検討することもできますが、これは洗練されたソリューションのようには聞こえません。 従うべき確かな方法論はありますか?

5
場合はと  独立した事象であり、と独立したイベントです、どのように私がいることを示しますと  独立していますか?
ましょうと 独立したイベントも、と聞かせて と独立したイベントも。 とも独立したイベントであることをどのように示すのですか?あAABBBあAACCCあAAB ∪ CB∪CB\cup C 独立したイベントの定義によれば、 とは、場合に限り、独立していあAAB ∪ CB∪CB\cup CP(A ∩ (B ∪ C))= P(A )P(B ∪ C)。P(A∩(B∪C))=P(A)P(B∪C).P(A\cap (B\cup C)) = P(A)P(B\cup C). 以来、と とと 独立している、私が知っている あAABBBあAACCCP(A ∩ B )= P(A )P(B )そしてP(A ∩ C)= P(A )P(C)。P(A∩B)=P(A)P(B)andP(A∩C)=P(A)P(C).P(A\cap B) = P(A)P(B) \quad\text{and}\quad P(A\cap C)=P(A)P(C). しかし、私はこれを解決する方法がわかりません。私が知っている確率のルールを適用しようとしましたが、どこにも行きませんでした。

13
「BにAが与えられる可能性が高い」場合、「AにBが与えられる可能性が高い」
私は背後にあるより明確な直感を得ようとしています:「あAAがBBBより可能にするなら、BBBはあAAより可能にする」すなわち ましょn (S)n(S)n(S)する空間の大きさ示すあAA及びBBB、その後、あるを 主張:P(B | A )> P(B )P(B|A)>P(B)P(B|A)>P(B) so n (A B )/ n (A )> n (B )/ n (S)n(AB)/n(A)>n(B)/n(S)n(AB)/n(A) > n(B)/n(S) so n (A B )/ n (B )> n (A )/ n (S)n(AB)/n(B)>n(A)/n(S)n(AB)/n(B) > n(A)/n(S) これはP(A | B )> P(A )P(A|B)>P(A)P(A|B)>P(A) 私は数学を理解していますが、なぜこれが直感的に理解できるのですか?

1
コインが公正かどうかの確認
友人から次の質問をされました。私は彼女を助けることができませんでしたが、誰かがそれを私に説明してくれることを願っています。同様の例は見つかりませんでした。ヘルプと説明をありがとうございます。 Q:100コイントス実験の結果が0 = "Tail"および1 = "Head"として記録されます。出力xは、0と長さ100の1の文字列です。xで1-0-0を取得する回数が計算され、20になります(例:if x =(001001110100)、1-0-0 2回発生します)。これは公正なコインだと思いますか?

5
連続一様分布の確率の合計が無限ではないのはなぜですか?
一様分布(連続)の確率密度関数を上に示します。曲線の下の領域は1です。これは、確率分布のすべての確率の合計が1であるため意味があります。 正式には、上記の確率関数(f(x))は次のように定義できます。 1 /(ba)in x in [a、b] それ以外の場合は0 a(たとえば2)とb(たとえば6)の間の実数を選択する必要があることを考慮してください。これにより、均一確率= 0.25になります。ただし、その間隔には無数の数があるため、すべての確率の合計を無限大にしてはいけませんか?私は何を見落としているのですか? f(x)は、数xが発生する確率ではありませんか?

1
0打ち切り多変量正規分布の平均と分散は何ですか?
してみましょうZ∼N(μ,Σ)Z∼N(μ,Σ)Z \sim \mathcal N(\mu, \Sigma)であることRdRd\mathbb R^d。の平均と共分散行列は何ですかZ+=max(0,Z)Z+=max(0,Z)Z_+ = \max(0, Z)(最大値は要素ごとに計算されます)? たとえば、ディープネットワーク内でReLUアクティベーション機能を使用し、CLTを介して、特定のレイヤーへの入力がほぼ正常であると想定すると、これが出力の分布になります。 (多くの人がこれを以前に計算したことがあると私は確信しているが、合理的に読みやすい方法でどこにもリストされている結果を見つけることができなかった。)

2
独立した二乗均一確率変数の合計の平方根の期待
ましょX1,…,Xn∼U(0,1)X1,…,Xn∼U(0,1)X_1,\dots,X_n \sim U(0,1)独立したidenticallly標準一様確率変数を分散させること。 Let Yn=∑inX2iI seek: E[Yn−−√]Let Yn=∑inXi2I seek: E[Yn]\text{Let }\quad Y_n=\sum_i^nX_i^2 \quad \quad \text{I seek: } \quad \mathbb{E}\big[\sqrt{Y_n } \big] YnYnY_nの予想は簡単です。 E[X2]E[Yn]=∫10y2y√=13=E[∑inX2i]=∑inE[X2i]=n3E[X2]=∫01y2y=13E[Yn]=E[∑inXi2]=∑inE[Xi2]=n3\begin{align} \mathbb{E}\left[X^2\right] &=\int_0^1\frac{y}{2\sqrt{y}}=\frac{1}{3}\\ \mathbb{E}\left[Y_n\right] &=\mathbb{E}\left[\sum_i^nX_i^2\right] = \sum_i^n\mathbb{E}\left[X_i^2\right]=\frac{n}{3} \end{align} 退屈な部分です。LOTUSを適用するには、YnYnY_n pdfが必要です。もちろん、2つの独立確率変数の和の確率密度関数は、それらの確率密度関数のたたみ込みです。しかし、ここにはnnn確率変数があり、たたみ込みは...複雑な式(恐ろしいしゃれが意図されたもの)につながると思います。もっと賢い方法はありますか? 私は正しい解決策を見たいと思いますが、それが不可能であるか複雑すぎる場合は、大きなnnn漸近近似は許容できる可能性があります。ジェンセンの不平等によって、私はそれを知っています E[Yn]−−−−−√=n3−−√≥E[Yn−−√]E[Yn]=n3≥E[Yn]\sqrt{\mathbb{E}[Y_n]}=\sqrt{\frac{n}{3}}\geq\mathbb{E}\left[\sqrt{Y_n}\right] しかし、自明ではない下限も見つけられない限り、これはあまり役に立ちません。独立したRVの合計だけでなく、独立したRVの合計の平方根があるため、CLTはここでは直接適用されないことに注意してください。たぶん、ここで役立つかもしれない他の限界定理(私は無視します)があるかもしれません。

3
または
確率テストを行ったので、この質問には答えられませんでした。それはちょうどこのようなものを尋ねました: 「考慮すること確率変数であり、X ⩾ 0、より高いか又は等しい何を証明するために正しい不等式を使用E (X 2 )3、またはE (X 3 )2。バツXXバツXX ⩾⩾\geqslant 000E(X2)3E(X2)3E(X^2)^3E(X3)2E(X3)2E(X^3)^2 私が考えた唯一のことはジェンセンの不平等でしたが、私はそれをここでどのように適用するか本当に知りません。

1
確率変数を平均
ましょ IIDこととˉ X = Σ nは、私は= 1 X Iを。 E [ X iXiXiX_iX¯=∑ni=1XiX¯=∑i=1nXi\bar{X} = \sum_{i=1}^{n} X_i 当たり前のようですが、正式に導出するのに苦労しています。E[XiX¯]= ?E[XiX¯]= ? E\left[\frac{X_i}{\bar{X}}\right] = \ ?

2
1%未満のオブジェクトが不良である可能性を95%にしたい場合、いくつのサンプルが必要ですか?
XMLサイトマップのゴミ(リンク切れ)が未満であることを確認する必要があります。URLのリストは数十万にのぼり、それらすべてを1つずつテストすることが可能であるとしても、多くの理由で、私はむしろそうではありません。1%1%1\% 1 - Saved bandwidth 2 - Faster traffic for real clients 3 - Less noise in visitor statistics (because my test would count as a visit) 5 - I could go on... ランダムなサブセットを取るだけで十分だと思います。問題は確率がわからないことです。 使えるシンプルな機能はありますか? それが役立つ場合は、リンクが実行全体で壊れる可能性に関する事前情報があると仮定できます。実行全体で、特定のリンクが切断されるのにあるとしましょう。0.75%0.75%0.75\%

1
ええと、 興味深い反例については、たとえばhttps://en.wikipedia.org/wiki/Subindependenceを参照できません。しかし、本当の問題は、独立が続くように条件を強化する方法はありますか?たとえば、関数g 1、… 、g nのセットがあるため、E g i(X )g j(Y )= E g i(X )E g j(Y )の場合、すべてのi 、jg1,…,gng1,…,gng_1, \dotsc, g_nEgi(X)gj(Y)=Egi(X)Egj(Y)E⁡gi(X)gj(Y)=E⁡gi(X)E⁡gj(Y)\E g_i(X) g_j(Y) =\E g_i(X) \E g_j(Y)i,ji,ji,jその後、独立が続きますか?そして、そのような一連の関数は無限大である必要がありますか? そして、さらに、この質問を扱う良い参考文献はありますか?

2
非iidベルヌーイ変数のこのランダムな合計の確率分布は何ですか?
一様に分布していないランダムな数の変数の合計の確率分布を見つけようとしています。次に例を示します。 ジョンはカスタマーサービスのコールセンターで働いています。彼は問題のある電話を受け、それらを解決しようとします。彼が解決できないものは、彼を上司に転送します。彼が1日に受け取る通話の数が平均ポアソン分布に従うと仮定します。それぞれの問題の難易度は、かなり単純なもの(間違いなく対処できるもの)から、解決方法がわからない非常に専門的な質問までさまざまです。i番目の問題を解くことができる確率p iは、パラメーターαおよびβのベータ分布に従い、以前の問題とは無関係であると仮定します。彼が1日に解決する通話数の分布はどのようになっていますか?μμ\mupipip_iαα\alphaββ\beta より正式には、私は: のために、私は= 0 、1 、2 、。。。、NY=I(N>0)∑Ni=0XiY=I(N>0)∑i=0NXiY = I(N > 0)\sum_{i = 0}^{N} X_ii=0,1,2,...,Ni=0,1,2,...,Ni = 0, 1, 2, ..., N ここで、、(X I | P I)〜BのEのR 、N 、O 、U 、L 、L 、I(P I)及びP I〜BのE T(α 、β )N∼Poisson(μ)N∼Poisson(μ)N \sim \mathrm{Poisson}(\mu)(Xi|pi)∼Bernoulli(pi)(Xi|pi)∼Bernoulli(pi)(X_i | p_i) \sim \mathrm{Bernoulli}(p_i)pi∼Beta(α,β)pi∼Beta(α,β)p_i \sim \mathrm{Beta}(\alpha, \beta) 今のところ、は独立していると思います。μが大きい場合の実際の例では、パラメーターαおよびβは、ベータ分布の成功率が低いほど多くの質量を持つようになっていますが、パラメーターμ 、αおよびβは互いに影響しないことも受け入れます。レートp。しかし、今はそれを無視しましょう。XiXiX_iμ,αμ,α\mu, \alphaββ\betaμμ\muαα\alphaββ\betappp …

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.