タグ付けされた質問 「distributions」

分布は、確率または頻度の数学的記述です。

5
Casella&Bergerの後に学ぶべきことは?
私は数学の基礎がほとんどない純粋な数学の大学院生です。昨年の秋以来、Casella&Bergerの本の授業を受けており、この本の何百ページ(230+)の運動問題を終えました。今、私は10章にいます。 ただし、統計学を専攻していないか、統計学者になることを計画していないため、データ分析を学習し続けるために定期的に時間を費やすことができるとは思いません。これまでの私の経験から、統計学者になるには、さまざまな分布(ワイブル、コーシー、、F ...)を含む多くの退屈な計算に耐える必要があることがわかりました。基本的な考え方はシンプルですが、実装(たとえば、仮説テストでのLRT)は、技術的な理由から依然として難しい場合があります。tttFFF 私の理解は正しいですか?より高度な資料をカバーするだけでなく、現実の生活でデータ分析が必要な場合に役立つ確率と統計を学習する方法はありますか?以前のように週に20時間費やす必要がありますか?≥≥\ge 数学を学ぶ上で王道はないと思いますが、多くの場合、実際のデータの分布が何であるかわからないため、分布のさまざまなファミリーに専念する目的は何ですか? ?サンプルサイズが小さく、中心極限定理が適用されない場合、分布が不明な場合にサンプル平均と分散以外のデータを適切に分析するにはどうすればよいですか? 私の学期は1か月で終了します。博士課程の研究に集中し始めた後、私の知識が消えてほしくありません。だから私は尋ねることにした。私はRを学んでおり、プログラミングのバックグラウンドがありますが、私のレベルはコードモンキーとほぼ同じです。


1
太い尾と太い尾の分布の違い
太い尾=太い尾だと思っていましたが、読んだ記事の中にはそうではないという感覚がありました。 それらの1つは言う:重い尾は、分布が整数jに対して無限のj番目のモーメントを持つことを意味します。さらに、パレートdfの引力のポット領域内のすべてのdfは、尾が重いです。密度の中央ピークが高く、裾が長い場合、尖度は通常大きくなります。尖度が3より大きいdfは、ファットテールまたはレプトクルティックです。私はまだ、これら2つ(太い尾と太い尾)の間に明確な区別はありません。関連する記事への考えやポインタをいただければ幸いです。

9
ping応答時間に関するこのデータがどのような分布を表しているのかを知るにはどうすればよいですか?
ネットワークping時間の実世界のプロセスをサンプリングしました。「往復時間」はミリ秒単位で測定されます。結果はヒストグラムにプロットされます。 ping時間には最小値がありますが、長い上側の尾があります。 これがどのような統計分布であり、そのパラメーターを推定する方法を知りたいです。 ディストリビューションは通常のディストリビューションではありませんが、達成しようとしていることを示すことができます。 正規分布は次の関数を使用します。 2つのパラメーター μ(平均) σ 2 (分散) パラメータ推定 2つのパラメーターを推定する式は次のとおりです。 Excelにあるデータに対してこれらの式を適用すると、次のようになります。 μ= 10.9558(平均) σ 2 = 67.4578(分散) これらのパラメーターを使用すると、サンプリングしたデータの上に「正規」分布をプロットできます。 明らかに正規分布ではありません。正規分布は、無限の上部および下部テールを持ち、対称です。この分布は対称ではありません。 どの原則を適用しますか。これがどのような分布であるかを判断するために、どのフローチャートを適用しますか? 分布に負のテールがなく、長い正のテールがある場合、どの分布がそれに一致しますか? あなたが取っている観測値に分布を一致させる参照はありますか? そして、簡単に言えば、この分布の式は何ですか?また、そのパラメーターを推定する式は何ですか? 「平均」値と「スプレッド」を取得できるように、分布を取得したい: 私は実際にソフトウェアでヒストグラムをプロットしており、理論的な分布をオーバーレイしたい: 注:math.stackexchange.comからクロスポスト 更新:160,000サンプル: 月と月、および無数のサンプリングセッションは、すべて同じ分布を提供します。数学的表現が必要です。 Harveyは、データをログスケールにすることを提案しました。対数スケールでの確率密度は次のとおりです。 タグ:サンプリング、統計、パラメーター推定、正規分布 それは答えではなく、質問の補遺です。これが配布バケットです。もっと冒険好きな人は、Excel(またはあなたが知っているプログラム)にそれらを貼り付けて、分布を見つけることができると思います。 値は正規化されます Time Value 53.5 1.86885613545469E-5 54.5 0.00396197500716395 55.5 0.0299702228922418 56.5 0.0506460012708222 57.5 0.0625879919763777 58.5 0.069683415770654 59.5 0.0729476844872482 …

1
なぜ分散のサンプリング分布はカイ二乗分布なのですか?
声明 サンプル分散のサンプリング分布は、自由度が等しいカイ二乗分布です。ここで、はサンプルサイズです(対象のランダム変数が正規分布している場合)。nn−1n−1n-1nnn ソース 私の直感 1)カイ2乗検定は2乗和のように見えるため、2)カイ2乗分布は2乗正規分布の和にすぎないため、直感的に理解できます。それでも、私はそれをよく理解していません。 質問 ステートメントは本当ですか?どうして?

3
不適切な事前はどのようにして適切な事後分布に導くことができますか?
適切な事前配布の場合、 P(θ∣X)=P(X∣θ)P(θ)P(X)P(θ∣X)=P(X∣θ)P(θ)P(X)P(\theta \mid X) = \dfrac{P(X \mid \theta)P(\theta)}{P(X)} ∝P(X∣θ)P(θ)∝P(X∣θ)P(θ) \propto P(X \mid \theta)P(\theta)。 このステップのための通常の正当化は、周辺分布することである、、に対して一定であると事後分布を導出する際に、したがって無視することができます。XXXP(X)P(X)P(X)θθ\theta しかし、不適切な事前分布の場合、事後分布が実際に存在することをどのように知っていますか?この一見円形の議論には何かが欠けているようです。つまり、事後が存在すると仮定した場合、事後を導出する方法のメカニズムは理解しますが、事後が存在する理由についての理論的正当性が欠落しているようです。 PS私はまた、不適切な事前が不適切な事後につながる場合があることを認識しています。


7
誰かが独立とランダムの違いを説明するのを助けることができますか?
統計では、独立とランダムは同じ特性を記述していますか?それらの違いは何ですか?「2つの独立したランダム変数」や「ランダムサンプリング」などの説明によく出くわします。それらの正確な違いは何だろうと思っています。誰かがこれを説明し、いくつかの例を挙げることができますか?たとえば、独立ではないがランダムなプロセスですか?

2
この離散分布には名前がありますか?
この離散分布には名前がありますか?以下のためのi∈1...Ni∈1...Ni \in 1...N f(i)=1N∑Nj=i1jf(i)=1N∑j=iN1jf(i) = \frac{1}{N} \sum_{j = i}^N \frac{1}{j} この分布に出くわしたのは次のとおりです。ユーティリティ機能によってランク付けされたアイテムのリストがあります。リストの先頭にバイアスをかけながら、アイテムの1つをランダムに選択します。そこで、最初に1とNの間のインデックスjを一様に選択します。次に、インデックス1とjの間のアイテムを選択します。このプロセスにより上記の分布が得られると思います。NNNjjjNNNjjj

3
壊れたスティックの最大の断片の分布(間隔)
長さ1のスティックを、ランダムに一様に断片に分割します。最も長いフラグメントの長さの分布は何ですか?k + 1k+1k+1 より正式には、をIIDとし、関連する順序統計、つまり単純に順序付けします。そのような方法で試料。ましょう。(U1、… Uk)(うん1、…うんk)(U_1, \ldots U_k)うん(0 、1 )うん(0、1)U(0,1)(U(1 )、… 、U(k ))(うん(1)、…、うん(k))(U_{(1)}, \ldots, U_{(k)})うん(1 )≤ U(2 )≤,…,≤U(k)U(1)≤U(2)≤,…,≤U(k)U_{(1)} \leq U_{(2)} \leq, \ldots , \leq U_{(k)}Zk= 最大(U(1 )、U(2 )− U(1 )、… 、U(k )− U(k − 1 )、1 − U(k ))Zk=最大(うん(1)、うん(2)−うん(1)、…、うん(k)−うん(k−1)、1−うん(k))Z_k = \max \left(U_{(1)}, U_{(2)}-U_{(1)}, \ldots, U_{(k)} - U_{(k-1)}, 1-U_{(k)}\right) Z_kの分布に興味がありますZkZkZ_k。モーメント、漸近結果、またはk \ uparrow …


2
非心カイ二乗確率変数の合計
私は、確率変数の分布を見つける必要が ここで、X 、I〜N(μ I、σ 2 I)と全X I S個の独立しています。X iの関数を生成するすべてのモーメントの積を最初に見つけ、次に変換してYの分布を取得することが可能であることを知っています。しかし、Yには一般的な形式があるのだろうかY=∑i=1n(Xi)2Y=∑i=1n(Xi)2Y=\sum_{i=1}^{n}(X_i)^2Xi∼N(μi,σ2i)Xi∼N(μi,σi2)X_i\sim{\cal{N}}(\mu_i,\sigma^2_i)XiXiX_iXiXiX_iYYYYYY ガウスの場合のように:独立したガウスの合計がまだガウスであることがわかっているため、合計の平均と分散の合計を知るだけで済みます。 どのようにすべてについて?この状態は一般的な解決策になりますか?σ2i=σ2σi2=σ2\sigma^2_i=\sigma^2


1
逆ウィシャート分布行列の対角線の周辺分布
仮定。対角要素の周辺分布に興味があります。の部分行列の分布に関するいくつかの簡単な結果があります(少なくとも一部はウィキペディアにリストされています)。これから、対角線上の任意の単一要素の周辺分布は逆ガンマであることがわかります。しかし、私は共同分布を推測することができませんでした。DIAG (X )= (X 11、... 、X P P)Xバツ〜InvWishart(ν、Σ0)バツ〜InvWishart⁡(ν、Σ0)X\sim \operatorname{InvWishart}(\nu, \Sigma_0)診断(X)= (x11、… 、xP P)診断⁡(バツ)=(バツ11、…、バツpp)\operatorname{diag}(X) = (x_{11}, \dots, x_{pp})バツバツX 多分それは次のような構成によって導き出せると思った p (x11| バツ私私、i > 1 )p (x22| バツ私私、i > 2 )… p (x(p − 1 )(p − 1 )| バツP P)p (xP P)、p(バツ11|バツ私私、私>1)p(バツ22|バツ私私、私>2)…p(バツ(p−1)(p−1)|バツpp)p(バツpp)、p(x_{11} | x_{ii}, i\gt 1)p(x_{22}|x_{ii}, i>2)\dots p(x_{(p-1)(p-1)}|x_{pp})p(x_{pp}), しかし、私はそれをどこにも持ってこなかったし、さらに何か簡単なものを見逃していると疑っています。この「知られている」べきであるように思えますが、私はそれを見つけることができませんでした。

4
スケールパラメーターの弱く有益な事前分布
私は、スケールがどうあるべきかについて大まかな考えを持っているが、わからないという言い方をしたいときに、スケール正規分布の事前分布として対数正規分布を使用しました(正規分布、t分布など)。それについて多く。その使用は直感的に理にかなっているので使用しますが、他の人が使用するのを見たことはありません。これに隠れた危険はありますか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.