タグ付けされた質問 「distributions」

分布は、確率または頻度の数学的記述です。

2
多変量ガウス分布の共分散事後分布の推定
サンプル数の少ない2変量ガウス分布を「学習」する必要がありますが、事前分布に関する仮説は良好なので、ベイジアンアプローチを使用したいと思います。 :私は私の前に定義された P(μ)∼N(μ0,Σ0)P(μ)∼N(μ0,Σ0) \mathbf{P}(\mathbf{\mu}) \sim \mathcal{N}(\mathbf{\mu_0},\mathbf{\Sigma_0}) μ0=[00] Σ0=[160027]μ0=[00] Σ0=[160027] \mathbf{\mu_0} = \begin{bmatrix} 0 \\ 0 \end{bmatrix} \ \ \ \mathbf{\Sigma_0} = \begin{bmatrix} 16 & 0 \\ 0 & 27 \end{bmatrix} そして、私の分布は、仮説与えられた P(x|μ,Σ)∼N(μ,Σ)P(x|μ,Σ)∼N(μ,Σ) \mathbf{P}(x|\mathbf{\mu},\mathbf{\Sigma}) \sim \mathcal{N}(\mathbf{\mu},\mathbf{\Sigma}) μ=[00] Σ=[180018]μ=[00] Σ=[180018] \mathbf{\mu} = \begin{bmatrix} 0 \\ 0 \end{bmatrix} \ \ \ \mathbf{\Sigma} = …

9
非負データの標準偏差は平均を超えることができますか?
三角形の3Dメッシュがいくつかあります。三角形領域の統計は次のとおりです。 最小0.000 最大2341.141 平均56.317 標準開発98.720 では、数値が上記のように機能する場合、標準偏差に関して特に役立つ何かを意味するのか、それとも計算にバグがあることを示唆するのか?領域は確かに正規分布からはほど遠い。 また、以下の回答のいずれかで言及したように、数字が負になり、したがって法定範囲外になったのは平均から1 SDしかかからなかったことに本当に驚いたことです。 ありがとう

2
「メッセージパッシングメソッド」とは何ですか?
私は、メッセージパッシングメソッドとは何かという漠然とした感覚を持っています。他のすべての要因のすべての近似を条件として、分布の各要因の近似を繰り返し構築することにより、分布の近似を構築するアルゴリズムです。 私は両方が変分メッセージの受け渡しと期待の伝播の例であると信じています。メッセージパッシングアルゴリズムとは、より明示的/正確に何ですか?参照は大歓迎です。

1
分布についてアルゴリズム的に(シミュレーション)対数学的に学習することの長所と短所は何ですか?
分布の特性をアルゴリズム的に(コンピューターシミュレーションを介して)対数学的に学習することの長所と短所は何ですか? 特に計算に強いと感じていない新入生にとっては、コンピュータシミュレーションが代替学習方法になる可能性があるようです。 また、コーディングシミュレーションは、分布の概念をより早く、より直感的に把握できるようです。

2
関数の分布とは何ですか?
CE RasmussenとCKI Williamsによる教科書の機械学習のためのガウス過程を読んでいますが、関数上の分布が何を意味するのか理解するのに苦労しています。教科書では、関数を非常に長いベクトルと考えるべきであるという例が示されています(実際、無限に長いはずですか?)。したがって、関数全体の分布は、そのようなベクトル値の「上」に描かれた確率分布であると思います。それでは、関数がこの特定の値を取る可能性はありますか?それとも、関数が特定の範囲内の値をとる確率でしょうか?または、関数の分布は関数全体に割り当てられた確率ですか? 教科書からの引用: 第1章:はじめに、2ページ ガウス過程は、ガウス確率分布の一般化です。確率分布はスカラーまたはベクトル(多変量分布の場合)であるランダム変数を記述しますが、確率的プロセスは関数のプロパティを管理します。数学的な洗練はさておき、関数を非常に長いベクトルと大まかに考えることができます。ベクトルの各エントリは特定の入力xで関数値f(x)を指定します。この考えは少し素朴ではありますが、驚くべきことに私たちが必要とするものに近いことがわかりました。実際、これらの無限次元オブジェクトをどのように計算的に処理するかという問題は、想像できる限り最も快適な解像度を持っています。有限数の点で関数のプロパティのみを要求する場合、 第2章:回帰、7ページ ガウス過程(GP)回帰モデルを解釈する方法はいくつかあります。ガウス過程は、関数の分布を定義し、関数の空間である関数空間ビューで直接行われる推論と考えることができます。 最初の質問から: この概念図を作成して、自分でこれを視覚化しようとしました。私が自分のために作ったそのような説明が正しいかどうかはわかりません。 更新後: Gijsの回答の後、私は写真を更新して、概念的には次のようにしました。

4
期待値と最も可能性の高い値(モード)
分布の期待値はf(x)f(x)f(x)平均、つまり加重平均値 E[x]=∫+∞−∞xf(x)dxE[x]=∫−∞+∞xf(x)dxE[x]=\int_{-\infty}^{+\infty} x \, \, f(x) dx 最も可能性の高い値はモードであり、最も可能性の高い値です。 しかし、何回かを何度も見ると予想しますか?ここから引用:E[x]E[x]E[x] 結果確率が等しくない場合、単純平均を加重平均に置き換える必要があります。これは、一部の結果が他の結果よりも高い可能性があるという事実を考慮に入れています。ただし、直観は同じままですの期待値は、平均して発生すると予想される値です。xixix_ixxx。 「平均して」とはどういう意味か理解できませんが、これは、重要な意味で、他のの値よりもを見るのに多くの時間を費やすことを意味しますE[x]E[x]E[x]xxxますか?しかし、これはモードの定義ではありませんか? それでは、ステートメントをどのように解釈するのでしょうか?そして、確率的意味は何ですか?E[x]E[x]E[x] また、私が混乱する例を示したいと思います。研究χ2χ2\chi^2分布私はそれを学んだモードが あるχ2mode=ν−2χmode2=ν−2\chi^2_{mode}=\nu-2、つつ、E[χ2]=νE[χ2]=νE[\chi^2]=\nu、νν\nuデータの自由度です。 私がやったときに、ことを大学で聞いたχ2χ2\chi^2のデータセットにフィットするように最小二乗法を使用した後にテストを、私は得ることを期待すべきであるχ2≈νχ2≈ν\chi^2 \approx \nu「それは一般的に何が起こるかだ」ので。 私はこのすべてを誤解しましたか、それとも期待値はどういうわけか非常にありそうですか?(最も可能性の高い値がもちろんモードであっても)

3
実際にカルバック・ライブラーの発散を計算しますか?
2 p間の非類似性の尺度としてKL発散を使用しています。メートル。F 。p 。メートル。f。p。m。f。p.m.f. PPPとQQQ。 DKL(P| | Q)= ∑i = 1Nln(P私Q私)P私DKL(P||Q)=∑私=1Nln⁡(P私Q私)P私D_{KL}(P||Q) = \sum_{i=1}^N \ln \left( \frac{P_i}{Q_i} \right) P_i = − ∑ P(X私)l n (Q (X私)) + ∑ P(X私)l n (P(X私))=−∑P(バツ私)ln(Q(バツ私))+∑P(バツ私)ln(P(バツ私))=-\sum P(X_i)ln\left(Q(X_i)\right) + \sum P(X_i)ln\left(P(X_i)\right) もし 、我々は簡単に計算することができ、その P (X I)L N ( Q (X I)) = 0 P (X I)L N …

2
いくつかの待機が私たちをより多くの待機を期待する状況を反映する分布
スタートアップに関するPeter Thielの講義に関するBlake Masterのメモを読んで、テクノロジーフロンティアのこの比phorに出会いました。 池、湖、海に覆われている世界を想像してください。あなたはボートに乗って、水域にいます。しかし、それは非常に霧が深いので、反対側までの距離はわかりません。池にいるのか、湖にいるのか、海にいるのかわかりません。 池にいる場合は、横断に約1時間かかることが予想されます。ですから、一日中外に出たら、あなたは湖か海のどちらかにいます。あなたが1年間外に出ていたら、あなたは海を渡っています。旅が長いほど、予想される残りの旅も長くなります。時間が経つにつれて反対側に近づくことに近づいているのは事実です。しかし、ここで、時間の経過は、あなたがまだ進むべき道があることを示しています。 私の質問:この状況、特に太字の部分を最もよくモデル化する確率分布または統計的枠組みはありますか?

2
過分散を伴うポアソン分布のモデリング
ポアソン分布に従うと思われるデータセットがありますが、それは約3倍過剰に分散しています。現時点では、Rの次のコードのようなものを使用して、この過分散をモデリングしています。 ## assuming a median value of 1500 med = 1500 rawdist = rpois(1000000,med) oDdist = rawDist + ((rawDist-med)*3) 視覚的には、これは私の経験データに非常によく当てはまるようです。フィットに満足している場合、ここで説明するように、負の二項分布を使用するなど、もっと複雑なことをする必要がある理由はありますか?(もしそうなら、そうすることへのポインターかリンクは大いに感謝されるでしょう)。 ああ、私はこれがわずかにギザギザの分布を作成することを知っています(3の乗算のため)が、それは私のアプリケーションにとっては問題ではありません。 更新: この質問を検索して見つける他の人のために、負の二項分布を使用して過分散ポアソンをモデル化する単純なR関数を次に示します。dを目的の平均/分散比に設定します。 rpois.od<-function (n, lambda,d=1) { if (d==1) rpois(n, lambda) else rnbinom(n, size=(lambda/(d-1)), mu=lambda) } (Rメーリングリスト経由:https : //stat.ethz.ch/pipermail/r-help/2002-June/022425.html)


3
2つの頻度分布間の統計的な「距離」を測定する方法は?
私は、年間を通じてウェブサイトの使用時間を調査するデータ分析プロジェクトに取り組んでいます。私がやりたいのは、使用パターンがどの程度「一貫性がある」かを比較することです。たとえば、週に1回1時間使用するパターン、または1回10分間使用するパターンにどれだけ近いかを比較します。週に数回。私は計算できるいくつかのことを知っています: シャノンエントロピー:結果の「確実性」がどれだけ異なるか、つまり確率分布が均一な分布とどれだけ異なるかを測定します。 カルバック・リーブラー発散:ある確率分布が他の確率分布とどれだけ異なるかを測定します Jensen-Shannon発散: KL 発散と似ていますが、有限値を返すため、より有用です スミルノフ・コルモゴロフ検定:連続したランダム変数の2つの累積分布関数が同じサンプルに由来するかどうかを判定する検定。 カイ2乗検定:頻度分布が予想される頻度分布とどれだけ異なるかを判断する適合度検定。 私がやりたいのは、実際の使用期間(青)が理想的な使用時間(オレンジ)とどれだけ異なるかを比較することです。これらの分布は離散的であり、以下のバージョンは正規化されて確率分布になります。水平軸は、ユーザーがWebサイトで費やした時間(分単位)を表します。これは、年の各日について記録されています。ユーザーがウェブサイトにまったくアクセスしていない場合、これはゼロ期間としてカウントされますが、これらは度数分布から削除されています。右側は累積分布関数です。 私の唯一の問題は、JSダイバージェンスを取得して有限値を返すことができても、異なるユーザーを見て、それらの使用量分布を理想的なものと比較すると、ほとんど同じ値を取得することです(したがって、これは良くありませんそれらがどれだけ異なるかの指標)。また、頻度分布ではなく確率分布に正規化すると、かなりの情報が失われます(たとえば、学生がプラットフォームを50回使用する場合、バーの長さの合計が50になるように青色の分布を垂直にスケーリングする必要があります。オレンジ色のバーの高さは1ではなく50にする必要があります。「一貫性」とは、ユーザーがWebサイトにアクセスする頻度が、Webサイトからの離脱に影響するかどうかです。彼らがウェブサイトにアクセスした回数が失われた場合、確率分布の比較は少し疑わしいです。ユーザーの継続時間の確率分布が「理想的な」使用量に近い場合でも、そのユーザーは1年間にプラットフォームを1週間しか使用しなかった可能性があり、おそらく一貫性はありません。 2つの頻度分布を比較し、それらがどれほど似ている(または似ていない)かを特徴付ける何らかのメトリックを計算するための確立された手法はありますか?

2
コーシー分布はどういうわけか「予測不可能な」分布ですか?
コーシー分布はどういうわけか「予測不可能な」分布ですか? やってみた cs <- function(n) { return(rcauchy(n,0,1)) } Rで多数のn値を取得し、時折非常に予測不可能な値を生成することに気付きました。 例と比較してください as <- function(n) { return(rnorm(n,0,1)) } 常に「コンパクトな」ポイントクラウドが得られるようです。 この写真では、正規分布のように見えるはずですか?ただし、値のサブセットに対してのみ有効な場合があります。または、おそらく、コーシーの標準偏差(下の写真)がはるかにゆっくり(左右に)収束するため、低い確率ではあるが、より深刻な外れ値が許容されるのでしょうか? ここで通常のrvとcsはコーシーrvです。 しかし、外れ値の極値によって、Cauchy pdfのテールが収束しない可能性はありますか?


3
分布のファミリーの定義?
分布のファミリーには、他の分野とは異なる統計の定義がありますか? 一般に、曲線のファミリーは一連の曲線であり、それぞれが1つ以上のパラメーターが変化する関数またはパラメーター化によって与えられます。このようなファミリは、たとえば電子部品の特性評価に使用されます。 統計の場合、1つのソースに基づくファミリは、形状パラメータを変化させた結果です。ガンマ分布には形状とスケールのパラメーターがあり、一般化されたガンマ分布のみに位置パラメーターがあることに、どうして理解できるでしょうか?それは、ファミリーをロケーションパラメーターを変化させた結果になりますか?@whuberによれば、ファミリーの意味は暗黙のうちにあります。ファミリーの「パラメーター化」とは、ℝサブセットからその通常のトポロジーを持つ分布の空間への連続したマップです。nn^n 簡単な言葉で言えば、統計分布の家族とは何ですか? 同じ家族の分布の統計的性質の関係についての質問は、別の質問についてすでにかなりの論争を引き起こしているので、意味を探求する価値があるようです。 これは必ずしも単純な質問ではないということは、指数の族というフレーズで使用することで生まれます。これは曲線の族とは関係ありませんが、パラメーターの再パラメーター化による分布のPDFの形式の変更に関連しています、独立したランダム変数の関数の置換も。

1
複数のパラメーターのジェフリーズ事前
特定のケースでは、完全な多次元モデルのジェフリーズ事前分布は一般に不適切と見なされます。これは、たとえば、、、 (ここで、および不明)、次の事前分布が優先されます(ジェフリーズの事前の完全な): ここでは、固定したときに取得したジェフリーズ事前分布です(同様に)。この事前分布は、処理するときの参照事前分布と一致します。p (σ )σy私= μ + ε私、y私=μ+ε私、 y_i=\mu + \varepsilon_i \, , ε 〜N(0 、σ2)ε〜N(0、σ2)\varepsilon \sim N(0,\sigma^2)μμ\muσσ\sigmaπ(μ 、σ)α σ− 2π(μ、σ)∝σ−2\pi(\mu,\sigma)\propto \sigma^{-2}p (μ 、σ)= π(μ )⋅ π(σ)α σ− 1、p(μ、σ)=π(μ)⋅π(σ)∝σ−1、 p(\mu,\sigma) = \pi(\mu) \cdot \pi(\sigma) \propto \sigma^{-1}\, , π(μ )π(μ) \pi(\mu)σσ\sigmap (σ)p(σ)p(\sigma)σσ\sigmaおよびは別々のグループになります。μμ\mu 質問1:なぜそれらを別々のグループとして扱うのが同じグループで扱うよりも理にかなっているのか(私が正しい場合(?)、以前の完全な次元のジェフリーズでは[1]を参照)。 次に、次の状況を考えます: ここでは不明、、は未知であり、は既知の非線形関数です。そのような場合、魅力的であり、私の経験から、次の分解を考慮することは時々有益です: ここでとは、前の縮尺位置の例と同様に、2つのサブモデルのジェフリーズです。θ ∈ R N ε I〜N …

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.