タグ付けされた質問 「distributions」

分布は、確率または頻度の数学的記述です。

4
Rを使用した風データの分析
こんにちは、風力タービンからのエネルギーを推定するための風データを分析しています。 私は10年間の風のデータを取得し、ヒストグラムをグラフ化しました。 第2段階は、ワイブル分布をデータに適合させることでした。 パッケージでRを使用してlmom、Weibulの形状とスケールを計算し、これは私が使用したコードです。 >library(lmom) wind.moments<-samlmu(as.numeric(pp$WS)) moments<-pelwei(wind.moments) x.wei<-rweibull(n=length(pp$WS), shape=moments["delta"], scale=moments["beta"]) hist(as.numeric(pp$WS), freq=FALSE) lines(density(x.wei), col="red", lwd=4) データと密度関数の間に若干の遅れがあるようです。これで私を助けてもらえますか?別の質問は、密度関数から年次エネルギーを計算するのに役立ちますか? ありがとうございました
12 r  distributions 

1
分布の自由度の良い事前分布とは何ですか?
分布で使用して、ベイジアンモデルで短い間隔の資産収益をモデル化します。分布の両方の自由度(モデル内の他のパラメーターと共に)を推定したいと思います。資産のリターンが非常に異常であることは知っていますが、それ以上のことはあまり知りません。 そのようなモデルの自由度の適切な、やや有益な事前分布とは何ですか?


2
2つの正規分布変数の比率、または1つの逆数をパラメーター化する方法は?
問題: ベイズのメタ分析で事前分布およびデータとして使用する分布をパラメーター化しています。データは文献で要約統計として提供されており、ほぼ独占的に正規分布していると想定されています(ただし、変数は0未満にはならず、一部は比率、一部は質量など)。 解決策がない2つのケースに遭遇しました。対象のパラメーターは、データの逆数または2つの変数の比率である場合があります。 例: 2つの正規分布変数の比率: データ:窒素と炭素の割合の平均とsd パラメーター:窒素と炭素の比率。 正規分布変数の逆: データ:質量/面積 パラメーター:面積/質量 私の現在のアプローチは、シミュレーションを使用することです: たとえば、平均xbar.n、c、分散:se.n、c、およびサンプルサイズ:nn、ncの炭素と窒素のパーセントデータのセットの場合: set.seed(1) per.c <- rnorm(100000, xbar.c, se.c*n.c) # percent C per.n <- rnorm(100000, xbar.n, se.n*n.n) # percent N ratio.cn = perc.c / perc.nをパラメーター化したい # parameter of interest ratio.cn <- perc.c / perc.n 次に、事前分布に対して範囲の最適な分布を選択します0→∞0→∞0 \rightarrow \infty library(MASS) dist.fig <- list() …

2
2つの独立した一様確率変数の積のpdf
ましょ〜と〜与えられた分布を持つ2つの独立したランダム変数です。分布は?U (0 、2 )Y U (- 10 、10 )V = X YバツバツXU(0 、2 )U(0、2)U(0,2)YYYU(- 10 、10 )U(−10,10)U(-10,10)V= XYV=XYV=XY 私は畳み込みを試みましたが、 h (v )= ∫y= + ∞y= - ∞1yfY(y)fバツ(vy)dyh(v)=∫y=−∞y=+∞1yfY(y)fバツ(vy)dyh(v) = \int_{y=-\infty}^{y=+\infty}\frac{1}{y}f_Y(y) f_X\left (\frac{v}{y} \right ) dy また、、 fY(y)= 120fY(y)=120f_Y(y) = \frac{1}{20} h(v)=1h (v )= 120∫y= 10y= − 101y⋅ 12dyh(v)=120∫y=−10y=101y⋅12dyh(v)= \frac{1}{20} \int_{y=-10}^{y=10} \frac{1}{y}\cdot …

2
ノイズのある正弦波の確率分布
測定誤差がある場合、振動関数からサンプリングポイントの確率分布を分析的に計算しようとしています。「ノイズなし」の部分の確率分布はすでに計算していますが(最後に追加します)、「ノイズ」を含める方法がわかりません。 数値見積もり より明確にするために、1つのサイクル中にランダムにポイントを選択する関数あるとします。ヒストグラムのポイントをビニングすると、分布に関連するものが得られます。y(x )= 罪(x )y(x)=sin⁡(x)y(x) = \sin(x) ノイズなし たとえば、これはと対応するヒストグラムですs i n (x )sin(x)sin(x) ノイズあり これで、測定エラーが発生すると、ヒストグラムの形状が変化します(したがって、基になる分布だと思います)。例えば 分析計算 うまくいけば、私は2つの間にいくつかの違いがあると確信しました。ここで、私が「ノイズなし」の場合の計算方法を書き出します。 ノイズなし y(x )= 罪(x )y(x)=sin⁡(x) y(x) = \sin(x) 次に、サンプリングする時間が均一に分布している場合、の確率分布は次の条件を満たす必要があります。yyy P(y)dy= dバツ2個のπP(y)dy=dx2π P(y) dy = \frac{dx}{2\pi} それから dバツdy= ddy(arcsin(y)) = 11 − y2−−−−−√dxdy=ddy(arcsin⁡(y))=11−y2\frac{dx}{dy} = \frac{d}{dy}\left(\arcsin(y)\right) = \frac{1}{\sqrt{1 - y^{2}}} など P(y)= 12個のπ1 − …

1
重要性サンプリングの直感的な例
私のバックグラウンドはコンピュータサイエンスです。私はモンテカルロサンプリング手法にかなり慣れていないので、数学は理解していますが、重要性サンプリングの直感的な例を思い付くのに苦労しています。より正確には、誰かが以下の例を提供できますか? 元の分布はサンプリングできないが、推定できる この元の分布からサンプリングして適切な重要度分布。

1
フィッシャーの厳密検定と超幾何分布
私はフィッシャーの正確なテストをよりよく理解したかったので、次のおもちゃの例を考案しました。ここで、fとmは男性と女性に対応し、nとyは次のように「ソーダ消費」に対応します。 > soda_gender f m n 0 5 y 5 0 明らかに、これは大幅な簡略化ですが、コンテキストが邪魔になりたくありませんでした。ここで私は男性がソーダを飲まず、女性がソーダを飲まないと仮定し、統計手順が同じ結論になるかどうかを確認したかっただけです。 Rでフィッシャーの正確検定を実行すると、次の結果が得られます。 > fisher.test(soda_gender) Fisher's Exact Test for Count Data data: soda_gender p-value = 0.007937 alternative hypothesis: true odds ratio is not equal to 1 95 percent confidence interval: 0.0000000 0.4353226 sample estimates: odds ratio 0 ここでは、p値が0.007937であるため、性別とソーダ消費が関連付けられていると結論付けます。 フィッシャーの正確な検定が超幾何分布に関連していることを知っています。だから私はそれを使って同様の結果を得たいと思った。つまり、この問題は次のように表示できます。10個のボールがあり、5個が「男性」、5個が「女性」とラベル付けされており、交換せずに5つのボールをランダムに描画すると、0個の男性ボールが表示されます。 。この観察の可能性は何ですか?この質問に答えるために、次のコマンドを使用しました。 …

1
三角分布のMLE?
通常のMLE手順を三角形の分布に適用することは可能ですか?-私は試していますが、分布が定義されている方法によって、数学のいずれかのステップでブロックされているようです。私は、cの上下のサンプル数を知っている(cを知らなくても)という事実を使用しようとしています。nがサンプルの総数である場合、これらの2つの数はcnと(1-c)nです。しかし、それは導出には役立たないようです。瞬間のモーメントは、cの推定量をほとんど問題なく与えます。ここでMLEに対する閉塞の正確な性質は何ですか(実際にある場合)? 詳細: さんが考えるで[ 0 、1 ]と上に定義されたディストリビューション[ 0 、1 ]によって: ccc[ 0 、1 ][0,1][0,1][ 0 、1 ][0,1][0,1] X <Cの場合、F(X、C)=2(1-X)f(x ; c )= 2 xcf(x;c)=2xcf(x;c) = \frac{2x}{c} c <= xの場合 f(x ; c )= 2 (1 - x )(1 − c )f(x;c)=2(1−x)(1−c)f(x;c) = \frac{2(1-x)}{(1-c)} このサンプルから与えられたcの対数尤度からこの分布から iidサンプル{ x i }を取りましょう:んnn{ x私}{xi}\{x_{i}\} l^(c | …

5
同じ分布族からの2つのランダム変数が同じ期待値と分散を持つが、より高いモーメントが異なる可能性はありますか?
ロケーションスケールの家族の意味を考えていました。私の理解では、ロケーションスケールファミリーのすべてのメンバーについて、パラメーターがロケーションとbスケールである場合、Z = (X − a )/ bの分布はパラメーターに依存せず、それに属するすべてのXについて同じです。家族。XXXaaabbbZ=(X− a )/ bZ=(X−a)/bZ =(X-a)/bバツXX だから私の質問は、同じ分布ファミリーからの2つのランダムが標準化されているが、同じ分布のランダム変数にならない例を提供できますか? セイとYは、同じ分布族から来た(家族と私は例ノーマルまたは両方ガンマなどの両方の意味で...)。定義:バツXXYYY Z1= X- μσZ1=X−μσZ_1 = \dfrac{X-\mu}{\sigma} Z2= Y- μσZ2=Y−μσZ_2 = \dfrac{Y-\mu}{\sigma} 我々は両方のことを知っている及びZ 2は同じ期待と分散、持っているμ Z = 0 、σ 2 Z = 1。Z1Z1Z_1Z2Z2Z_2μZ= 0 、σ2Z= 1μZ=0,σZ2=1\mu_Z =0, \sigma^2_Z =1 しかし、彼らは異なるより高い瞬間を持つことができますか? この質問に答えようとする私の試みは、とYの分布が2つ以上のパラメーターに依存している場合、それよりも大きくなる可能性があるということです。そして、私は3つのパラメーターを持つ一般化されたt − s t u d e n tについて考えています。バツXXYYYt − …

2
多様体上の統計のグラフィカル直観
で、この記事は、文を読むことができます: モデルは通常、有限次元多様体上の点θθ\thetaで表されます。 上の微分幾何学と統計マイケル・K・マレーとジョン・W・ライスによってこれらの概念は、数学的な表現を無視して散文読めるでもで説明されています。残念ながら、イラストはほとんどありません。同じことがのために行くこの記事 MathOverflowに。 トピックをより正式に理解するための地図または動機として役立つ視覚的表現の支援をお願いしたいと思います。 マニホールドのポイントは何ですか?このオンライン検索からのこの引用は、データポイントまたは分布パラメーターのいずれかである可能性があることを示しているようです: 多様体と情報幾何学に関する統計は、微分幾何学が統計学と出会う2つの異なる方法です。多様体に関する統計では、多様体上にあるのはデータですが、情報幾何学では、データはRnRnR^nにありますが、パラメーター化された対象の確率密度関数のファミリーは多様体として扱われます。このような多様体は統計的多様体として知られています。 ここで、接線空間の説明に触発されてこの図を描きました。 C∞C∞C^\infty(M)(M)(\mathcal M)p∈Mp∈Mp\in \mathcal M(ψ:R→M)(ψ:R→M)(\psi: \mathbb R \to \mathcal M)p.p.p.p,p,p,C∞(t)→R,C∞(t)→R,C^\infty (t)\to \mathbb R,(f∘ψ)′(t)(f∘ψ)′(t)\left(f \circ \psi \right )'(t)ψψ\psiMM\mathcal Mp,p,p,f,f,f,fffppp 同等性(または統計に適用される同等性の1つ)はここで説明されており、次の引用に関連しています。 sss RsRs\mathcal R^ss.s.s. RR\mathbb Rψ:R→Mψ:R→M\psi: \mathbb R \to \mathcal Mfff(f∘ψ)′(t).(f∘ψ)′(t).\left(f \circ \psi \right)'(t).f:M→Rf:M→Rf: \mathbb M \to \mathbb Rψψ\psifff 背景が追加されたもの: 注目に値するのは、これらの概念がMLの非線形次元削減に直接関係しないことだと思います。それらは情報ジオメトリに似ています。ここに引用があります: RnRnR^nnnn Oren Freifeldによる形状変形のモデリングへの応用を伴う多様体に関する統計からの以下の情報: MMMTpMTpMTpMp∈Mp∈Mp …



1
対数均一分布とはどういう意味ですか?
128と4000の間の対数均一分布からデータがサンプリングされると誰かが言ったとき、それはどういう意味ですか?均一分布からのサンプリングとどう違うのですか? このペーパーを参照してください:http : //www.jmlr.org/papers/volume13/bergstra12a/bergstra12a.pdf ありがとう!

3
離散分布と連続分布の間にKLダイバージェンスを適用することは可能ですか?
私は数学者ではありません。KL Divergenceについてインターネットで検索しました。私が学んだことは、KLダイバージェンスは、入力分布に対してモデルの分布を近似したときに失われた情報を測定することです。これらは、2つの連続または離散分布の間で見られます。連続と離散の間、またはその逆でそれを行うことができますか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.