タグ付けされた質問 「poisson-distribution」

平均が分散と等しいという特性を持つ、非負の整数で定義された離散分布。


2
ロングテールのポアソン累積分布の単純な近似?
Iは、容量を決定する未満で残留確率を有するようにテーブルのを2 - Pオーバーフローに対して所定のためのp ∈ [ 40 ... 120 ]、エントリの数が所定の期待とポアソン法則に従うと仮定E ∈ [ 10 3 … 10 12 ]。CCC2− p2−p2^{-p}P ∈ [ 40 ... 120 ]p∈[40…120]p\in[40\dots 120]E∈ [ 103… 1012]E∈[103…1012]E\in[10^3\dots 10^{12}] 理想的には、与えられたおよびのCような最小の整数が必要です。でもそれより少し高いので満足です。Mathematicaは手動計算には問題ありませんが、コンパイル時とコンパイル時に計算したいので、64ビット整数演算に制限されています。1-CDF[PoissonDistribution[E],C] < 2^-ppECCpE 更新:Mathematica(バージョン7)e = 1000; p = 40; c = Quantile[PoissonDistribution[e], 1 - 2^-p]では1231、ほぼ正しいと思われます(@Procrastinatorに感謝)。しかし、両方のための結果p = 50とp = 60され1250、安全でない側に間違っている、(そして事項:私の実験のような繰り返し倍以上、私は明らか未満たい2 - 30の全体のオッズ故障のを)。コンパイル時にC(++)で使用できるように、64ビット整数演算のみを使用して、粗雑ではあるが安全な近似が必要です。2252252^{25}2− …

2
ポアソン分布を正規分布に変換
私は主にコンピューターサイエンスのバックグラウンドを持っていますが、今は自分自身に基本的な統計を教えようとしています。ポアソン分布があると思うデータがあります 2つの質問があります。 これはポアソン分布ですか? 次に、これを正規分布に変換することは可能ですか? 任意の助けいただければ幸いです。どうもありがとう

2
ホッケー選手が記録した総キャリア目標を予測するときにポアソン回帰でオフセットを使用するかどうか
オフセットを使用するかどうかについて質問があります。ホッケーのゴールの(全体的な)数を記述したい非常に簡単なモデルを想定します。つまり、ゴール、プレイしたゲームの数、およびダミー変数「ストライカー」があり、プレーヤーがストライカーの場合は1、それ以外の場合は0になります。次のモデルのどれが正しく指定されていますか? Goals = games + striker、または ゴール=オフセット(ゲーム)+ストライカー 繰り返しになりますが、目標は全体的な目標であり、ゲームの数は1人のプレーヤーの全体的なゲームです。たとえば、100ゲームで50ゴールを獲得したプレーヤーと、50ゲームで20ゴールを獲得した別のプレーヤーがいる場合などです。 目標の数を見積もるにはどうすればよいですか?ここでオフセットを使用する必要がありますか? 参照: 一般にポアソン回帰でオフセットを使用する場合について説明しているこの前の質問を参照してください。

2
カイ二乗検定を使用して、データがポアソン分布に従うかどうかを判断する方法
次の図(このペーパーの 646ページの図1 )は、ポアソン分布の下で観測値と期待値を比較しています。次に、カイ二乗検定を実行して、観測値がポアソン分布での期待値と異なるかどうかを確認します。 Rを使用して、ポアソン分布の下で期待値を生成し、カイ2乗検定を使用して観測値を比較するにはどうすればよいですか? 編集: これが彼らが紙でしたことをやろうとする私の試みです。の観測された分布がvariableポアソン分布と異なるかどうか知りたい。また、私が以下で行ったことは、彼らが紙で行ったのと同じ手順であるかどうかも知りたいです。P値が> 0.05であるため、variable以下の分布はポアソン分布に従うと結論しました-誰かがこれを確認できますか? df <- data.frame(variable = 0:5, frequency = c(20, 10, 5, 3, 2, 1)) # estimate lambda mean_df_variable <- mean(df$variable) # calculate expected values if df$frequency follows a poisson distribution library(plyr) expected <- laply(0:5, function(x) dpois(x=x, lambda=mean_df_variable, log = FALSE)) # calculate actual distribution …

1
lme4 glmerおよびglmer.nbを使用してカウントデータGLMMを解釈するのに役立ちます-負の2項対ポアソン
GLMMの仕様と解釈につ​​いて質問があります。3つの質問は間違いなく統計的で、2つはRについてより具体的です。最終的に問題はGLMMの結果の解釈だと思うので、ここに投稿します。 私は現在GLMMに適合させようとしています。Longitudinal Tract Databaseの米国国勢調査データを使用しています。私の観察は国勢調査地区です。私の従属変数は空いている住宅の数で、空室と社会経済変数の関係に興味があります。ここの例は単純で、2つの固定効果を使用しています。非白人人口の割合(人種)と中央値世帯収入(クラス)、およびそれらの相互作用です。私は2つの入れ子にされたランダム効果を含めたいと思います:数十年から数十年以内のトラクト、つまり(10年/トラクト)。私はこれらのランダムを、空間的(すなわちトラクト間)および時間的(すなわち数十年間)の自己相関を制御するために検討しています。ただし、固定効果としては10年にも興味があるので、固定要素としても含めています。 私の独立変数は非負の整数カウント変数であるため、ポアソンおよび負の二項GLMMを近似しようとしています。オフセットとして、総住宅数のログを使用しています。これは、係数が空き家の総数ではなく、空室率への影響として解釈されることを意味します。 私は現在、ポアソンと負の二項GLMMの結果からglmerとglmer.nbを用いて推定していlme4。係数の解釈は、データと研究領域に関する私の知識に基づいて私には理にかなっています。 データとスクリプトが必要な場合は、私のGithubにあります。スクリプトには、モデルを構築する前に行った記述的調査の詳細が含まれています。 これが私の結果です: ポアソンモデル Generalized linear mixed model fit by maximum likelihood (Laplace Approximation) ['glmerMod'] Family: poisson ( log ) Formula: R_VAC ~ decade + P_NONWHT + a_hinc + P_NONWHT * a_hinc + offset(HU_ln) + (1 | decade/TRTID10) Data: scaled.mydata AIC BIC logLik deviance df.resid …

2
インフレ率がゼロのGAMM
RのゼロインフレデータにGAMM(一般化された加法混合モデル)を適合させることは可能ですか? そうでない場合、ゼロインフレートされたデータに対してRに負の二項分布または準ポアソン分布をもつGAM(一般化された加法モデル)を当てはめることは可能ですか?(私はポアソン分布のCOZIGAM :: zigamおよびmgcv:ziP関数を見つけました)

1
独立したポアソンプロセスが他のプロセスを追い抜く確率
他のstackexchangesで以前に別の方法でこの質問をしたので、多少再投稿して申し訳ありません。 私は教授と2人の博士課程の学生に、明確な答えなしに尋ねました。最初に問題を述べ、次に私の潜在的な解決策と私の解決策の問題を述べます。テキストの壁に申し訳ありません。 問題: 二つの独立したポアソン処理想定及びRを用いて、λ Rおよびλ M同じ間隔で、対象λ R > λ M。プロセスMの合計出力がプロセスRプラスDの合計出力よりも大きい、つまり、P (M > R + D )の任意の時点で、時間が無限大になる傾向がある確率はどのくらいですか。例で説明するために、2つのブリッジRとMを平均してλMMMRRRλRλR\lambda_RλMλM \lambda_MλR>λMλR>λM\lambda_R>\lambda_MMMMRRRDDDP(M>R+D)P(M>R+D)P(M>R+D)RRRMMMおよび λ Mの車がブリッジ上ドライブ R及び M間隔ごとにそれぞれ、および λ R > λ M。Dの車はすでに橋 Rを運転しており、どの時点でも合計で Rよりも多くの車が橋 Mを運転した確率はどれくらいですか。λRλR\lambda_RλMλM\lambda_MRRRMMMλR>λMλR>λM\lambda_R>\lambda_MDDDRRRMMMRRR この問題を解決する私の方法: まず、2つのポアソンプロセスを定義します。 M(I)∼Poisson(μM⋅I)R(I)∼Poisson(μR⋅I)M(I)∼Poisson⁡(μM⋅I)R(I)∼Poisson⁡(μR⋅I)M(I) \sim \operatorname{Poisson}(\mu_M\cdot I ) \\ R(I) \sim \operatorname{Poisson}(\mu_R\cdot I ) \\ 次のステップは、与えられた数の間隔Iの後にを表す関数を見つけることです。このような場合に起こるM (I )> K + Dの出力に条件をR (I …

2
ポアソンパラメーターの不偏推定量
1日あたりの事故の数は、パラメーター持つポアソン確率変数であり、ランダムに選択された10日に、事故の数が1,0,1,1,2,0,2,0,0,1として観測されました。公平な推定者になりますか?λλ\lambdaeλeλe^{\lambda} 私はこのようにしてみました:であることがわかりが、です。それでは、必要な不偏推定量は何でしょうか?E(x¯)=λ=0.8E(x¯)=λ=0.8E(\bar{x})=\lambda=0.8E(ex¯)≠ eλE(ex¯)≠ eλE(e^{\bar{x}})\neq\ e^{\lambda}

5
2つのパラメーターのポアソン仮説検定
だから、楽しみのために、私は私が働いているコールセンターからの通話のデータの一部を取り、それらについていくつかの仮説テストを実行しようとしています。具体的には、1週間に受信した通話の数と、ポアソン分布を使用してそれに適合しています。私の仕事の主題により、2種類の週があります。そのうちの1つを、私がより多くの呼び出しがあると仮定する週にオンにし、より少ないと仮定する週外に呼び出します。 私が持っているという理論オン週間から(のは、それを呼びましょう)1からのオフ週のそれよりも大きいの(さんがそれを呼びましょう)λλ\lambdaλ1λ1\lambda_1λ2λ2\lambda_2 したがって、テストしたい仮説はH0:λ1>λ2,H1:λ1≤λ2H0:λ1>λ2,H1:λ1≤λ2H_0: \lambda_1 > \lambda_2, H_1: \lambda_1 \leq \lambda_2 1つのパラメーター(たとえば、)をテストする方法を知っていますが 、データセットを指定して2を実行する方法がわかりません。たとえば、からおよび、週におよびからそれぞれ2週間分のデータを取得するとします。誰かがこの簡単なバージョンを使って私をウォークして、より大きなデータセットに適用できるようにすることはできますか?どんな助けでもありがたいです、ありがとう。H0:λ1>1,H1:λ1≤1H0:λ1>1,H1:λ1≤1H_0: \lambda_1 > 1, H_1: \lambda_1 \leq 1 X1=2X1=2X_1 = 2X2=3X2=3X_2 = 3Y1=2Y1=2Y_1 = 2Y2=6Y2=6Y_2=6

1
glmnetは過剰分散をどのように処理しますか?
カウントデータに対してテキストをモデル化する方法、特にこの機能を使用してlasso機能を削減する方法について質問があります。 オンライン記事がN個あり、各記事のページビュー数があるとします。記事ごとに1グラムと2グラムを抽出しましたが、1,2グラムに対して回帰を実行したいと思いました。特徴(1,2グラム)は観測数よりもはるかに多いため、なげなわは特徴の数を減らすための良い方法です。また、glmnetなげなわ分析を実行するのに本当に便利であることがわかりました。 しかし、ページビューのカウント数は、(分散>平均)overdispersedされていますが、glmnet提供していませんquasipoisson(明示的)またはnegative binomialが、poissonカウントデータについて。私が考えた解決策はlog transform、カウントデータ(社会科学者の間で一般的に使用される方法)であり、応答変数をほぼ正規分布に従うようにすることです。そのため、を使用して、ガウスファミリーでデータをモデル化できglmnetます。 だから私の質問は、そうすることは適切ですか?または、glmnetケースglmnetハンドルにpoissonを使用しますquasipoissonか?または、他のRパッケージがこの状況を処理しますか? どうもありがとうございました!

2
Distribution \ CLTの収束
その所与の、条件競合製品。です。は限界的な歪みがあります。Poisson()の場合、は正の定数です。N=nN=nN = nYYYχ2(2n)χ2(2n)\chi ^2(2n)NNNθθ\thetaθθ\theta 、それを示すよう、分布です。(Y − E (Y ))/ √θ→∞θ→∞\theta \rightarrow \infty (Y−E(Y))/Var(Y)−−−−−−√→N(0,1) (Y−E(Y))/Var⁡(Y)→N(0,1)\space \space (Y - E(Y))/ \sqrt{\operatorname{Var}(Y)} \rightarrow N(0,1) 誰かがこれを解決するための戦略を提案できますか?CLT(Central Limit Theorem)を使用する必要があるようですが、に関する情報を独自に取得するのは難しいようです。サンプルを取り、を生成するために導入できるrvはありますか?YYYYYY これは宿題なのでヒントをいただければ幸いです。

2
ポアソン分布の最尤の推定量の分散を見つける
場合パラメータでポアソン分布IIDされたβ Iは、最尤推定値であることが働いたβ(K 1、... 、K N)= 1K1,…,KnK1,…,KnK_1, \dots, K_nββ\betaデータのためのK1、...、Knは。したがって、対応する推定量T=1を定義できます。 β^(k1,…,kn)=1n∑i=1nkiβ^(k1,…,kn)=1n∑i=1nki\hat\beta (k_1, \dots, k_n) = \frac{1}{n} \sum_{i=1}^n k_ik1,…,knk1,…,knk_1, \dots, k_n 私の質問は、この推定量の分散をどのようにして計算するのですか?T=1n∑i=1nKi.T=1n∑i=1nKi.T = \frac{1}{n} \sum_{i=1}^n K_i . 具体的には、各としてパラメータを持つポアソン分布以下β分布することを、ポアソンの特性から、私は知っているが、Σ N iは= 1 K iはパラメータを持つポアソン分布続くN βが、しかしの分布何T?KiKiK_iββ\beta∑ni=1Ki∑i=1nKi\sum_{i=1}^n K_inβnβn \betaTTT


1
合計を条件として、負の二項式の分布は何ですか
場合は負の二項をIIDされ、その後の分布ものです与えられたが(x 1、x 2、… 、x n)x1,x2,…,xnx1,x2,…,xnx_1, x_2, \ldots, x_n(x1,x2,…,xn)(x1,x2,…,xn)(x_1, x_2, \ldots, x_n) x1+x2+…+xn=Nx1+x2+…+xn=Nx_1 + x_2 + \ldots + x_n = N\quad? NNNは固定です。 場合ポアソンは、その後、合計の条件としている、多項です。混合ポアソンであるため、負の2項に当てはまるかどうかはわかりません。(x 1、x 2、… 、x n)x1,x2,…,xnx1,x2,…,xnx_1, x_2, \ldots, x_n(x1,x2,…,xn)(x1,x2,…,xn)(x_1, x_2, \ldots, x_n) あなたが知りたいのであれば、これは宿題の問題ではありません。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.