タグ付けされた質問 「distributions」

分布は、確率または頻度の数学的記述です。

3
累積/累積プロット(または「ローレンツ曲線の視覚化」)
私はそのようなプロットが何と呼ばれるのかわからないので、私はこの質問に愚かなタイトルを付けました。 次のように順序付けられたデータセットがあるとしましょう 4253 4262 4270 4383 4394 4476 4635 ... 各数字は、特定のユーザーがWebサイトに投稿した投稿の数に対応しています。ここで定義されている「参加の不平等」現象を経験的に調査しています。 わかりやすくするために、「ユーザーの10%がデータの50%に貢献している」などのステートメントを読者がすばやく推測できるプロットを作成したいと思います。それはおそらくこの明らかにかなりひどいペイントのスケッチに似ているはずです: これがどのように呼ばれるのか私には手がかりがないので、どこを探すべきか分かりません。また、誰かがで実装したR場合、それは素晴らしいことです。


2
割合データの分布
データを使用してモデルを作成するために使用する正しい分布について質問があります。私は50区画の森林インベントリを実施しました。各区画は20m×50mです。プロットごとに、地面を遮る樹冠の割合を推定しました。各プロットには、キャノピーカバーの1つの値(パーセント)があります。割合の範囲は0〜0.95です。衛星画像と環境データに基づいた独立したX変数の行列を使用して、樹冠のカバー率(Y変数)のモデルを作成しています。 二項確率変数はn回の独立した試行の合計(つまり、ベルヌーイ確率変数)であるため、二項分布を使用する必要があるかどうかはわかりません。パーセンテージ値は試行の合計ではありません。実際の割合です。上限はありませんが、ガンマを使用する必要がありますか?パーセンテージを整数に変換し、ポアソンをカウントとして使用する必要がありますか?私はガウシアンに固執するべきですか?この方法でパーセンテージをモデル化しようとする文献や教科書には、多くの例はありません。ヒントや洞察は大歓迎です。 回答ありがとうございます。実際、ベータ版の配布はまさに私が必要としているものであり、この記事で徹底的に議論されています: Eskelson、BN、Madsen、L.、Hagar、JC、およびTemesgen、H(2011)。ベータ回帰とコピュラモデルを使用した河岸下層植生被覆の推定。Forest Science、57(3)、212-221。 これらの作者は、Cribari-NetoとZeileisによるRのbetaregパッケージを使用しています。 次の記事では、パーセンテージの範囲に真の0または1が含まれている場合に、ベータ分布の応答変数を変換する適切な方法について説明しています。 Smithson、M.、J。Verkuilen、2006。より良いレモン絞り器?ベータ分布の従属変数を使用した最尤回帰、Psychological Methods、11(1):54–71。



3
最大でクローズされた分布のクラス
レッツ非負実数の確率分布のクラスもによってパラメータだから、 ディストリビューションの既知のクラスがあれば最大値を取って、すなわち下に閉じている私の不思議とは独立していて、です。QpQpQ_ppppQp([0,∞))=1.Qp([0、∞))=1。 Q_p([0,\infty)) = 1. X1∼Qp1バツ1〜Qp1X_1\sim Q_{p_1}X2∼Qp2バツ2〜Qp2X_2\sim Q_{p_2}max(X1,X2)∼Qp3最高(バツ1、バツ2)〜Qp3\max(X_1,X_2)\sim Q_{p_3}

4
同じ試験を最短で受けることにより、すべての回答を正解する
雨は勉強しないので、はい/いいえの質問のみで構成されていても、中期には完全に無知です。幸い、Rainの教授は彼女が好きなだけ何度でも同じ中間学期を再受験することを許可していますが、彼はスコアを報告するだけなので、Rainは彼女が間違った問題を知りません。Rainは、最低限の回数の再受験ですべての正解を得るにはどうすればよいですか? より正式に言えば、試験の合計は nnn はい/いいえの質問、その正解は X1,X2,…,Xn∼iidBernoulli(0.5)X1,X2,…,Xn∼iidBernoulli(0.5)X_1, X_2, \dots, X_n \stackrel{iid}{\sim} \text{Bernoulli}(0.5)。Rainが再受験する必要があると予想される回数を最小限に抑える戦略を見つけたいです。 しばらく考えていました。レインが初めて中期を取るとき、彼女のスコアは常にBinom(n,0.5)Binom(n,0.5)\text{Binom}(n, 0.5)、彼女の答えに関係なく、各戦略は同じ量のエントロピーを減少させます。しかし、これが何を意味するのかはわかりません。ランダムな推測がすべて「はい」またはすべて「いいえ」で答えるのと同じくらい良いということですか? これは宿題ではありませんが、次の研究プロジェクトをベースに計画しているので、 本格的な答えの代わりにいくつかのヒントを提供してください。 この質問にすでに回答している場合は、ポインタを教えてください。

1
指数とガンマの間の分布の名前?
密度ここで、はパラメータであり、指数関数()の間に存在しますおよび()分布。これがたまたま分布のより一般的なファミリの例であるかどうかだけ知りたいですか?そのように私はそれを認識していません。f(s)∝ss+αe−s,s>0f(s)∝ss+αe−s,s>0f(s)\propto \frac{s}{s+\alpha}e^{-s},\quad s > 0α≥0α≥0\alpha \ge 0α=0α=0\alpha=0Γ(2,1)Γ(2,1)\Gamma(2,1)α→∞α→∞\alpha \to \infty

2
一般化正規分布の提案分布
私は、確率密度関数を持つ一般化された正規分布(wikipediaエントリー)を使用して、植物の分散をモデル化しています。 b2 Γ (1 / B )e− (da)bb2aΓ(1/b)e−(da)b \frac{b}{2a\Gamma(1/b)} e^{-(\frac{d}{a})^b} ここで、は移動距離、はスケールパラメーター、は形状パラメーターです。平均移動距離は、この分布の標準偏差によって与えられます。dddaaabbb a2Γ (3 / b )Γ (1 / b )−−−−−−−−√a2Γ(3/b)Γ(1/b) \sqrt{\frac{a^2 \Gamma(3/b)}{\Gamma(1/b)}} これは、場合は指数関数型、場合はガウス型、場合はレプトリック分布を可能にするため便利です。この分布は、一般的には非常にまれであり、したがって情報を見つけるのが難しいにもかかわらず、植物散布に関する文献で定期的に発生します。b = 1b=1b=1b = 2b=2b=2b &lt; 1b&lt;1b<1 最も興味深いパラメータはと平均分散距離です。bbb 私は推定しようとしていると MCMCを使用して、私はサンプルの提案値への効率的な方法を考え出すのに苦労しています。これまでのところ、私はMetropolis-Hastingsを使用し、および均一分布から描画しました。約200〜400メートルの後方平均分散距離が得られます。これは生物学的に意味があります。ただし、収束は非常に遅く、パラメーター空間全体を調査しているとは思いません。aaabbb0 &lt; a &lt; 4000&lt;a&lt;4000 < a < 400 0 &lt; b &lt; 30&lt;b&lt;3 0 < b<3 とプロポーザル分布をより適切に作成するのは難しいことです。なぜなら、それらは、それ自体にはあまり意味がなく、互いに依存しているためです。平均分散距離は、明確な生物学的な意味を持っていますが、与えられた平均分散距離は無限に多くの組み合わせによって説明できると。このようにとの後方に相関しています。aaabbbaaabbbaaabbb これまでのところ、Metropolis …

2
ランダムグラフの三角形の数の分布と分散
Erdos-Renyiランダムグラフ考えます。個の頂点のセットは、ラベル付けされます。エッジのセットは、ランダムプロセスによって作成されます。N V V = { 1 、2 、... 、N } EG=(V(n),E(p))G=(V(n),E(p))G=(V(n),E(p))nnnVVVV={1,2,…,n}V={1,2,…,n}V = \{1,2,\ldots,n\}EEE ましょう確率であり、各非順序対頂点()内のエッジとして生じる確率で独立他の対の、。0 &lt; p &lt; 1 { i 、j } i ≠ j E pppp0&lt;p&lt;10&lt;p&lt;10<p<1{i,j}{i,j}\{i,j\}i≠ji≠ji \neq jEEEppp の三角形は、、、がエッジであるような、異なる頂点の順序付けされていないトリプルです。。{ i 、j 、k } { i 、j } { j 、k } { k 、i } GGGG{i,j,k}{i,j,k}\{i,j,k\}{i,j}{i,j}\{i,j\}{j,k}{j,k}\{j,k\}{k,i}{k,i}\{k,i\}GGG 可能な三角形の最大数は(n3)(n3)\binom{n}{3}です。確率変数XXXをグラフG内の観測された三角形の数と定義しますGGG。 3つのリンクが同時に存在する確率はp3p3p^3です。したがって、Xの期待値はE(X)= \ …

2
UMVUE
ましょう密度からのランダムサンプルである(X1,X2,…,Xn)(X1,X2,…,Xn)(X_1,X_2,\ldots,X_n)fθ(x)=θxθ−110&lt;x&lt;1,θ&gt;0fθ(x)=θxθ−110&lt;x&lt;1,θ&gt;0f_{\theta}(x)=\theta x^{\theta-1}\mathbf1_{00 のUMVUEを見つけようとしています。θ1+θθ1+θ\frac{\theta}{1+\theta} の結合密度は(X1,…,Xn)(X1,…,Xn)(X_1,\ldots,X_n) fθ(x1,⋯,xn)=θn(∏i=1nxi)θ−110&lt;x1,…,xn&lt;1=exp[(θ−1)∑i=1nlnxi+nlnθ+ln(10&lt;x1,…,xn&lt;1)],θ&gt;0fθ(x1,⋯,xn)=θn(∏i=1nxi)θ−110&lt;x1,…,xn&lt;1=exp⁡[(θ−1)∑i=1nln⁡xi+nln⁡θ+ln⁡(10&lt;x1,…,xn&lt;1)],θ&gt;0\begin{align} f_{\theta}(x_1,\cdots,x_n)&=\theta^n\left(\prod_{i=1}^n x_i\right)^{\theta-1}\mathbf1_{00 \end{align} 母集団pdfは1パラメータ指数ファミリに属しているため、これは完全な十分な統計がfθfθf_{\theta}θθ\thetaT(X1,…,Xn)=∑i=1nlnXiT(X1,…,Xn)=∑i=1nln⁡XiT(X_1,\ldots,X_n)=\sum_{i=1}^n\ln X_i 以降、最初の考えで、の私に与えるUMVUEによってレーマン・シェッフェの定理。この条件付き期待値が直接見つかるか、条件付き分布を見つける必要があるかどうかはわかりません 。E(X1)=θ1+θE(X1)=θ1+θE(X_1)=\frac{\theta}{1+\theta}E(X1∣T)E(X1∣T)E(X_1\mid T)θ1+θθ1+θ\frac{\theta}{1+\theta}X1∣∑ni=1lnXiX1∣∑i=1nln⁡XiX_1\mid \sum_{i=1}^n\ln X_i 一方、私は次のアプローチを検討しました: 我々は、つまり。Xi∼i.i.dBeta(θ,1)⟹−2θlnXi∼i.i.dχ22Xi∼i.i.dBeta(θ,1)⟹−2θln⁡Xi∼i.i.dχ22X_i\stackrel{\text{i.i.d}}{\sim}\text{Beta}(\theta,1)\implies -2\theta\ln X_i\stackrel{\text{i.i.d}}{\sim}\chi^2_2−2θT∼χ22n−2θT∼χ2n2-2\theta\, T\sim\chi^2_{2n} したがって、カイ2乗pdfを使用して計算された次の未加工モーメントはrrr−2θT−2θT-2\theta\,TE(−2θT)r=2rΓ(n+r)Γ(n),n+r&gt;0E(−2θT)r=2rΓ(n+r)Γ(n),n+r&gt;0E(-2\theta\,T)^r=2^r\frac{\Gamma\left(n+r\right)}{\Gamma\left(n\right)}\qquad ,\,n+r>0 したがって、異なる整数の選択に対して、異なる整数の累乗の不偏推定量(およびUMVUE)が得られるようです。たとえば、およびとのUMVUEを直接指定してください。rrrθθ\thetaE(−Tn)=1θE(−Tn)=1θE\left(-\frac{T}{n}\right)=\frac{1}{\theta}E(1−nT)=θE(1−nT)=θE\left(\frac{1-n}{T}\right)=\theta1θ1θ\frac{1}{\theta}θθ\theta さて、我々が持っている。θ&gt;1θ&gt;1\theta>1θ1+θ=(1+1θ)−1=1−1θ+1θ2−1θ3+⋯θ1+θ=(1+1θ)−1=1−1θ+1θ2−1θ3+⋯\frac{\theta}{1+\theta}=\left(1+\frac{1}{\theta}\right)^{-1}=1-\frac{1}{\theta}+\frac{1}{\theta^2}-\frac{1}{\theta^3}+\cdots などのUMVUEを確実に取得できます。したがって、これらのUMVUEを組み合わせると、の必要なUMVUEを取得できます。この方法は有効ですか、それとも最初の方法から続行しますか?UMVUEが存在する場合、UMVUEは一意であるため、どちらも同じ答えを返すはずです。1θ,1θ2,1θ31θ,1θ2,1θ3\frac{1}{\theta},\frac{1}{\theta^2},\frac{1}{\theta^3}θ1+θθ1+θ\frac{\theta}{1+\theta} 明確にするために、E(1+Tn+T2n(n+1)+T3n(n+1)(n+2)+⋯)=1−1θ+1θ2−1θ3+⋯E(1+Tn+T2n(n+1)+T3n(n+1)(n+2)+⋯)=1−1θ+1θ2−1θ3+⋯E\left(1+\frac{T}{n}+\frac{T^2}{n(n+1)}+\frac{T^3}{n(n+1)(n+2)}+\cdots\right)=1-\frac{1}{\theta}+\frac{1}{\theta^2}-\frac{1}{\theta^3}+\cdots つまり、E(∑r=0∞Trn(n+1)...(n+r−1))=θ1+θE(∑r=0∞Trn(n+1)...(n+r−1))=θ1+θE\left(\sum_{r=0}^\infty \frac{T^r}{n(n+1)...(n+r-1)}\right)=\frac{\theta}{1+\theta} 場合、必要なUMVUEがである可能性はありますか?∑r=0∞Trn(n+1)...(n+r−1)∑r=0∞Trn(n+1)...(n+r−1)\displaystyle\sum_{r=0}^\infty \frac{T^r}{n(n+1)...(n+r-1)}θ&gt;1θ&gt;1\theta>1 用、私はなるだろう、及びUMVUEが異なることになるので。0&lt;θ&lt;10&lt;θ&lt;10<\theta<1g(θ )= θ (1 + θ + θ2+ ⋯ )g(θ)=θ(1+θ+θ2+⋯)g(\theta)=\theta(1+\theta+\theta^2+\cdots) 最初のアプローチの条件付き期待値を直接見つけることができなかったと確信しており、、私は先に進みました条件付き分布を検索します。そのため、の結合密度が必要でした。E(X1| Σ LNバツ私= t )= E(X1| Π X私= et)E(X1∣∑ln⁡Xi=t)=E(X1∣∏Xi=et)E(X_1\mid \sum\ln …

1
ペアワイズ周辺分布から共同分布を取得
3つの確率変数があり、ペアワイズ周辺分布がわかっていると仮定しますが他には何も知りません(そのような条件付き独立として)。結合分布を取得できますか? P (X 1、X 2)、P (X 2、X 3)、P (X 3、X 1)P (X 1、X 2、X 3)バツ1、X2、X3X1,X2,X3X_1,X_2,X_3P(X1、X2)、P(X2、X3)、P(X3、X1)P(X1,X2),P(X2,X3),P(X3,X1)P(X_1,X_2), P(X_2,X_3), P(X_3,X_1)P(X1、X2、X3)P(X1,X2,X3)P(X_1,X_2,X_3)

2
並べ替えられたリストの分布
アイテムの順序付きリストがあるとしましょう [a, b, c, ... x, y, z, ...] 上記のリストでサポートされている、いくつかのパラメータalphaによって管理されているディストリビューションのファミリーを探しています。 alpha = 0の場合、最初のアイテムaに確率1を割り当て、残りに確率0を割り当てます。つまり、このリストからサンプルを抽出すると、置換すると常にが得られaます。 アルファが増加するにつれて、〜指数関数的減衰に従って、リストの順序を尊重しながら、リストの残りの部分にますます高い確率を割り当てます。 alpha = 1の場合、リスト内のすべてのアイテムに等しい確率を割り当てるため、リストからのサンプリングはその順序を無視するのと同じです。 これは幾何学的分布とよく似ていますが、いくつかの顕著な違いがあります。 幾何分布分布は、すべての自然数に対して定義されます。上記の私の場合、リストのサイズは固定されています。 alpha = 0の場合、幾何分布は定義されていません。

2
ファットフィンガー分布
簡単な質問: 太い指の分布はありますか?存在する場合は別の名前になっているはずです。 分析関数としてどのように定式化するかわかりません。それの既存のバージョンを見つけるか、巨大なシミュレーションよりもきれいなものでそれを公式化することから始めることができますか? これは、特定の数値を対象としたときに実際にヒットする数値の分布ですが、ボタンは指よりもはるかに小さいため、近くのボタンが誤ってヒットする場合があります。 このような分布の使用は、携帯電話のボタンを押す際の誤ったエントリです。「今すぐ1を押す」か何かをする必要があり、「1を押したのは正しい」という会社を経営していた場合、2列に並ぶ太い指で混乱する可能性はありますが、太った指の確率はまともな近似になるでしょう。いくつか。 (太った指のハミング距離?太い指のマルコフ連鎖?) 私はそれを使って、キーを押すことでエラー訂正を試みたいと思います。私は自分のサンプルをいくつか持っていますが、指の「太さ」や携帯電話のキーボードトポロジのバリエーションが十分でないため、堅牢ではありません。 背景と詳細: 通常の携帯電話のキーパッドレイアウトは次のとおりです。 私の指がキーよりもはるかに大きいことを想像してください。そのため、5を押すと、ほとんどの場合5を獲得しますが、2、4、6、または8も獲得する可能性があります(等しく可能性があります) )そして、1,3,7,9を得る可能性が低く(ゼロではない)、等しく(可能性が高い)、0を得る可能性はほとんどありません。 固定された「指の直径」に対して無数の5を入力しようとすると、値の分布が得られると想像できます。私の指の値が小さい場合、分布が変化します。別の数をヒットしようとすると、分布が変化します。 実際には、これはキーのレイアウトに依存します。それらが3x3グリッドではなく巨大なリングにある場合、それは別の種類の質問になります。この場合、3x3の長方形グリッドのみを扱うことになると思います。また、キーパッドにはデジタルラッチが付いているため、1回のキー操作しか検出できないと思われます。「0」が押されたときなど、他のボタンには最大7つの周波数があります。私はそれに従事するためのきれいな方法がわかりません。おそらく、ターゲットキーとトリガーされた候補キーの間の正規化された2乗距離の因数倍ですか? 5つが押されたときの分布をシミュレートする方法は次のとおりです(重みは多少任意です)。 #number of presses npress &lt;- 1000 #hack this (not quadratic) myprobs &lt;- c(0.85) myprobs &lt;- c(myprobs, 0.1275/4, 0.1275/4, 0.1275/4, 0.1275/4) myprobs &lt;- c(myprobs, 0.019125/4, 0.019125/4, 0.019125/4, 0.019125/4) myprobs &lt;- c(myprobs,1-sum(myprobs) ) #order of number my_button &lt;- …

2
上限が別の連続均一RVである連続均一RVの分布
場合と、そして、私が言うことができるY 〜U (、X )Y 〜U (、B )?X∼U(a,b)X∼U(a,b)X \sim U(a, b)Y〜U(a 、X)Y∼U(a,X)Y \sim U(a, X)Y〜U(a 、b )?Y∼U(a,b)?Y \sim U(a, b)? 制限のある連続的な均一分布について話している。証明(または反証!)をいただければ幸いです。[ a 、b ][a,b][a, b]

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.