タグ付けされた質問 「beta-distribution」

間隔で定義された一変量分布の2パラメーターファミリー [0,1]

11
ベータ配布の背後にある直感とは何ですか?
免責事項:私は統計学者ではなく、ソフトウェアエンジニアです。統計に関する私の知識のほとんどは独学から得たものなので、ここでは他の人にとってはささいな概念の理解にまだ多くのギャップがあります。したがって、回答に具体性の低い用語とより多くの説明が含まれていれば、非常に感謝します。おばあちゃんと話していると想像してください:) 私が把握しようとしている自然のベータ分布をどのようにそれぞれの場合に、それを解釈することはのために使用すべきかと- 。たとえば、正規分布について話している場合、電車の到着時間として説明することができます。最も頻繁にちょうど間に合うように到着し、少し少ない頻度で1分早くまたは1分遅れて、非常にまれに差で到着することはありません平均から20分。均一配布は、特に、宝くじの各チケットのチャンスを説明します。二項分布は、コインフリップなどで説明できます。しかし、ベータ分布のそのような直感的な説明はありますか? たとえば、およびとしましょう。この場合のベータ分布は、次のようになります(Rで生成):α=.99α=.99\alpha=.99β=.5β=.5\beta=.5B(α,β)B(α,β)B(\alpha, \beta) しかし、実際にはどういう意味ですか?Y軸は明らかに確率密度ですが、X軸には何がありますか? この例または他の例を使用して、説明をいただければ幸いです。


3
0〜1の結果(比率または分数)の回帰
私は、比率の予測モデルの構築を考えています、≤ B及び> 0及びB > 0を。だから、比率が間になる0と1。a / ba/ba/b≤ Ba≤ba \le ba > 0a>0a > 0b > 0b>0b > 0000111 線形回帰を使用できますが、自然に0.1に制限されるわけではありません。関係が線形であると信じる理由はありませんが、もちろん、とにかく、単純な最初のモデルとしてしばしば使用されます。 ロジスティック回帰を使用できますが、通常は2状態の結果の確率を予測するために使用され、範囲0.1からの連続値を予測するためではありません。 これ以上何も知らない場合、線形回帰、ロジスティック回帰、または非表示オプションcを使用しますか?


5
一般的な分布の実際の例
私は統計に興味を持っている大学院生です。私は素材全体が好きですが、実際の生活への応用について考えるのに苦労することがあります。具体的には、私の質問は一般的に使用される統計分布(通常-ベータガンマなど)についてです。場合によっては、分布を非常に良くする特定のプロパティ、たとえば指数関数のメモリレスプロパティを取得すると思います。しかし、他の多くの場合、私は教科書に見られる一般的な分布の重要性と応用分野の両方について直観を持っていません。 おそらく、私の懸念に対処する多くの優れた情報源があります。それらを共有していただければ幸いです。現実の例と関連付けることができれば、私はこの資料にもっとや​​る気が出ます。

6
二項分布とベータ分布の関係
私は統計学者というよりもプログラマーなので、この質問があまりにも素朴ではないことを願っています。 ランダムにプログラムの実行をサンプリングするときに発生します。プログラムの状態のN = 10のランダムな時間のサンプルを取得すると、たとえば、それらのサンプルのI = 3で関数Fooが実行されていることがわかります。Fooが実行されている時間Fの実際の割合について、それが何を教えてくれるのか興味があります。 私は平均F * Nで二項分布していることを理解しています。IとNが与えられると、Fはベータ分布に従うことも知っています。実際、私はこれらの2つのディストリビューション間の関係をプログラムで検証しました。 cdfBeta(I, N-I+1, F) + cdfBinomial(N, F, I-1) = 1 問題は、私が関係について直感的な感覚を持っていないことです。なぜそれが機能するのかを「描く」ことはできません。 編集:すべての答えは、特に@whuberのように挑戦的でした。これはまだ理解する必要がありますが、統計を整理することは非常に役に立ちました。それにもかかわらず、私はもっと基本的な質問をするべきだったことに気付きました:IとNを考えると、Fの分布は何ですか?誰もがベータ版だと指摘しましたが、それは私が知っていました。私はついにウィキペディア(以前の共役)からそれがあるように思えたBeta(I+1, N-I+1)。プログラムでそれを調べた後、それは正しい答えのように見えます。だから、私が間違っているかどうかを知りたいです。そして、上記の2つのcdfの関係、なぜ合計が1になるのか、そして私が本当に知りたいことと何か関係があるのか​​どうか、まだ混乱しています。

3
次元の2つのランダムな単位ベクトルのスカラー積の分布
場合と内の2つの独立したランダムな単位ベクトルでありそれらのスカラー積(内積)の分布が何であるか(均一単位球面上に分布)、?、Y のR D X ⋅ Yバツバツ\mathbf{x}yy\mathbf{y}RDRD\mathbb{R}^DX ⋅ Yバツ⋅y\mathbf x \cdot \mathbf y ように私は推測迅速に配布を成長より高い次元でゼロと正常になる平均及び分散減少(?)しかしのための明示的な公式がある\ sigma ^ 2(D)?DDDリムD → ∞σ2(D )→ 0 、リムD→∞σ2(D)→0、\lim_{D\to\infty}\sigma^2(D) \to 0,σ2(D )σ2(D)\sigma^2(D) 更新 簡単なシミュレーションをいくつか実行しました。最初に、D = 1000のランダムな単位ベクトルの10000ペアを生成D = 1000D=1000D=1000すると、それらのドット積の分布が完全にガウス分布であることが簡単にわかります(実際、すでにD = 100の場合はかなりガウス分布ですD = 100D=100D=100)。左側のサブプロットを参照してください。次に、1から10000までの各Dに対してDDD(ステップを増やしながら)1000ペアを生成し、分散を計算しました。ログ-ログプロットは右側に示されており、式が1 / Dで非常によく近似されていることは明らかです1 / D1/D1/D。D = 1D=1D=1およびD = 2D=2D=2この式で正確な結果が得られることにも注意してください(ただし、後で何が起こるかわかりません)。

0
Jaynesの分布
ジェーンズの著書「確率論:科学の論理」では、ジェーンズは「分布と継承のルール」というタイトルの章(Ch 18)を持ち、この章で分布の概念を紹介しています。ApApA_pApApA_p [...]これを見るには、新しい情報を取得する効果を想像してください。コインを5回投げると、毎回テールが現れます。次の投球での頭の確率は何ですか?私はまだ1/2と言います。ただし、火星に関するもう1つの事実を教えていただければ、[ 火星にかつて生命が存在したという ] 確率の割り当てを完全に変更する準備ができています。私の信念の状態をペニーの場合非常に安定させるが、火星の場合非常に不安定にする何かがあります これは、論理としての確率論に対する致命的な反対のように思えるかもしれません。おそらく、命題に、妥当性を表す1つの数字だけでなく、2つの数値を関連付ける必要があります。そして、ある種の二価理論が必要になるでしょう。[...] 彼は、よう な新しい命題を導入しApApA_pP(A|ApE)≡pP(A|ApE)≡pP(A|A_pE) ≡ p 「ここで、Eは、追加の証拠である、我々はレンダリングしなければならなかった場合。口頭声明として、それはこのようなものを出してくるでしょう: 関係なく、あなたが言われたかもしれない何か他のものの、Aの確率はPです。」ApApA_pApApA_p ≡≡≡ 私は、これらの基準を満たすベータ分布を使用するだけで、2つの数字のアイデア(「信頼性、および新しい証拠に直面した場合の安定性」)の違いを見ようとしています。 図18.2は(say)を使用するのと非常に似ていますが、火星ではBeta(1 / 2,1 / 2)であり、信念の状態は「非常に不安定」ですα=β=100α=β=100\alpha=\beta=100 オリジナル命題は、上記の、ベータ(かもしれない非常に大きいため)よう /(。そうすれば、との分布を変える証拠はありませんApApA_pα,βα,β\alpha,\betaα,βα,β\alpha,\betaαα\alphaα+β)=pα+β)=p\alpha+\beta)=ppppP(A|ApE)≡pP(A|ApE)≡pP(A|A_pE) ≡ p 本全体でベータ分布について説明しているので、ここでの区別が微妙であり、新しい理論(分布)を保証していることをますか?彼は次の段落で「「確率の確率」について話しているかのように見える」と述べています。ApApA_p

3
毎日の時系列分析
私は時系列分析を行おうとしており、この分野は初めてです。2006年から2009年までのイベントを毎日数えており、時系列モデルをそれに合わせたいと考えています。これが私が達成した進歩です。 timeSeriesObj = ts(x,start=c(2006,1,1),frequency=365.25) plot.ts(timeSeriesObj) 結果のプロットは次のとおりです。 データに季節性と傾向があるかどうかを確認するには、この投稿に記載されている手順に従います。 ets(x) fit <- tbats(x) seasonal <- !is.null(fit$seasonal) seasonal そしてロブ・J・ハインドマンのブログで: library(fma) fit1 <- ets(x) fit2 <- ets(x,model="ANN") deviance <- 2*c(logLik(fit1) - logLik(fit2)) df <- attributes(logLik(fit1))$df - attributes(logLik(fit2))$df #P value 1-pchisq(deviance,df) どちらの場合も、季節性がないことを示しています。 シリーズのACFとPACFをプロットすると、次のようになります。 私の質問は: これは、毎日の時系列データを処理する方法ですか?このページは、週ごとと年ごとのパターンを検討する必要があることを示唆していますが、そのアプローチは明確ではありません。 ACFプロットとPACFプロットを取得した後、どのように進めるかわかりません。 auto.arima関数を単純に使用できますか? fit <-arima(myts、order = c(p、d、q) ***** Auto.Arimaの結果を更新****** ここでRob Hyndmanのコメントに従ってデータの頻度を7に変更すると、auto.arimaは季節ARIMAモデルを選択して出力します。 …

4
ベータ回帰で0,1値を処理する
[0,1]にいくつかのデータがあり、ベータ回帰で分析したいと思います。もちろん、0,1値に対応するために何かをする必要があります。モデルに合わせてデータを変更するのは嫌いです。また、この場合、0が非常に小さい正の値であると考える必要があると考えているため、ゼロと1のインフレが良い考えだとは思いません(しかし、どの値が適切であるかを正確に言いたくありません。 .001や.999などの小さな値を選択し、ベータの累積distを使用してモデルに適合させることになると思います。したがって、観測y_iの場合、対数尤度LL_iは if y_i < .001 LL+=log(cumd_beta(.001)) else if y_i>.999 LL+=log(1.0-cum_beta(.999)) else LL+=log(beta_density(y_i)) このモデルで私が気に入っているのは、ベータ回帰モデルが有効な場合、このモデルも有効ですが、極値に対する感度が少し削除されることです。しかし、これは非常に自然なアプローチであるように思えるので、なぜ文献に明白な参照が見つからないのか疑問に思います。だから私の質問は、データを変更するのではなく、なぜモデルを変更しないのですか。データを変更すると結果にバイアスがかかります(元のモデルが有効であるという仮定に基づいて)が、極値をビニングしてモデルを変更しても結果にバイアスはかかりません。 おそらく私が見落としている問題がありますか?

5
1と0を含む比率データのベータ回帰
0と1の間の比率である応答変数を持つモデルを作成しようとしています。これには、かなりの数の0と1が含まれますが、その間の多くの値も含まれます。ベータ回帰を試みることを考えています。R(betareg)で見つかったパッケージでは、0から1の間の値のみが許可されますが、0または1自体は含まれません。私は理論的にはベータ分布が0または1の値を処理できるはずであることを他の場所で読みましたが、RIでこれを処理する方法がわかりませんが、ゼロに0.001を追加し、1から0.001を取る人がいますこれは良いアイデアだと思いますか? あるいは、応答変数をロジット変換し、線形回帰を使用することもできます。この場合、ログ変換できない0と1の問題があります。

3
ベータ分布密度関数に-1があるのはなぜですか?
ベータ分布は2つのパラメーター化(またはここ)で表示されます F (X )α X α(1 - X )βf(x)∝xα(1−x)β(1) f(x) \propto x^{\alpha} (1-x)^{\beta} \tag{1} または、より一般的に使用されると思われるもの F (X )α X α - 1(1 - X )β - 1f(x)∝xα−1(1−x)β−1(2) f(x) \propto x^{\alpha-1} (1-x)^{\beta-1} \tag{2} しかし、なぜ2番目の式に「− 1−1-1」があるのですか? 最初の定式化は直観的に二項分布に直接対応するように思われます g (k )∝ p k(1 − p )n − kg(k)∝pk(1−p)n−k(3) g(k) \propto p^k (1-p)^{n-k} \tag{3} …

2
応答変数の0と1をベータ回帰で正確に処理できないのはなぜですか?
多くの場合、0から1の間の値をとる分数、比率、確率などの応答を処理するために、ベータ回帰(ベータ分布と通常はロジットリンク関数を使用するGLM)が推奨されます:結果の回帰(比率または分数) 0と1の間。 ただし、応答変数が0または1に少なくとも1回等しくなるとすぐにベータ回帰を使用できないと常に主張されています。その場合、ゼロ/ 1膨張ベータモデルを使用するか、応答の変換などを行う必要があります。1および0を含む比率データのベータ回帰。 私の質問は次のとおりです。ベータ分布のどのプロパティが、ベータ回帰が正確な0と1を処理するのを妨げますか、そしてその理由は何ですか? とはベータ配布をサポートしていないと思います。しかし、すべての形状パラメータのためにと、両方の0と1があるベータ分布の支援では、分布が片側または両側に無限大に行くことをより小さな形状パラメータのみです。そしておそらく、サンプルデータは、とが最適に適合し、両方とも超えるようなものです。000111α>1α>1\alpha>1β>1β>1\beta>1αα\alphaββ\beta111 場合によっては、実際にはゼロ/ 1でもベータ回帰を使用できるということですか? もちろん、0と1がベータ分布をサポートしている場合でも、正確に0または1を観測する確率はゼロです。しかし、他の与えられた数えられる値のセットを観察する確率はそうなので、これは問題になりえないでしょうか?(@Glen_bによるこのコメント)。 \hskip{8em} ベータ回帰のコンテキストでは、ベータ分布は異なる方法でパラメーター化されますが、では、すべてのに対してで明確に定義される必要があります。ϕ=α+β>2ϕ=α+β>2\phi=\alpha+\beta>2[0,1][0,1][0,1]μμ\mu

1
情報のないベータ事前分布の選択
私は、二項プロセス(ヒット/ミス)で機能するベータ分布の情報価値のない事前分布を探しています。最初は、均一なPDFを生成する、またはJeffrey以前のを使用することを考えました。しかし、事後結果に最小限の影響しか与えない事前分布を実際に探しています。そして、不適切な事前分布を使用することを考えました。ここでの問題は、少なくとも1つのヒットと1つのミスがある場合にのみ、事後分布が機能することです。これを克服するために、ような非常に小さな定数を使用して、後部のおよびがなるようにすることを考えました。α=1,β=1α=1,β=1\alpha=1, \beta=1α=0.5,β=0.5α=0.5,β=0.5\alpha=0.5, \beta=0.5α=0,β=0α=0,β=0\alpha=0, \beta=0α=0.0001,β=0.0001α=0.0001,β=0.0001\alpha=0.0001, \beta=0.0001αα\alphaββ\beta>0>0>0 このアプローチが受け入れられるかどうかは誰にも分かりますか?私はこれらの事前を変更することの数値的効果を見ますが、誰かがこのような小さな定数を事前として置くことの一種の解釈を私に与えることができますか?

3
ベータ分布とロジスティック回帰モデルの関係は何ですか?
私の質問は次のとおりです。ベータ分布とロジスティック回帰モデルの係数の数学的な関係は何ですか? 例として、ロジスティック(シグモイド)関数は f(x)=11+exp(−x)f(x)=11+exp⁡(−x)f(x) = \frac{1}{1+\exp(-x)} また、ロジスティック回帰モデルで確率をモデル化するために使用されます。ましょAAA二分である(0,1)(0,1)(0,1)採点結果とXXXデザインマトリックス。ロジスティック回帰モデルは次で与えられます P(A=1|X)=f(Xβ).P(A=1|X)=f(Xβ).P(A=1|X) = f(X \beta). 注XXX一定の最初の列有する111(切片)及びββ\beta回帰係数の列ベクトルです。例えば、我々は1(標準正常)回帰を有する場合xxx選択しますβ0=1β0=1\beta_0=1(切片)およびβ1=1β1=1\beta_1=1、我々は、得られる「確率分布」をシミュレートすることができます。 このプロットは、ベータ分布を思い出させます(他の選択のプロットと同様ββ\beta)。その密度は g(y;p,q)=Γ(p)Γ(q)Γ(p+q)y(p−1)(1−y)(q−1).g(y;p,q)=Γ(p)Γ(q)Γ(p+q)y(p−1)(1−y)(q−1).g(y;p,q) = \frac{\Gamma(p)\Gamma(q)}{\Gamma(p+q)} y^{(p-1)} (1-y)^{(q-1)}. 最尤法またはモーメント法を使用して、P (A = 1 | X )の分布からpppおよびを推定することができます。したがって、私の質問は次のようになります:βとpとqの選択の関係は何ですか?これは、そもそも上記の2変量の場合を扱います。qqqP(A=1|X)P(A=1|X)P(A=1|X)ββ\betapppqqq

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.