タグ付けされた質問 「mathematical-statistics」

形式的な定義と一般的な結果に関係する統計の数学的理論。

3
分析にCDFおよびPDF統計を使用する方法
これは一般的な質問の多すぎるかもしれませんが、私はここで助けを見つけることができると思います。私は大学でRAの仕事を始めており、私のトピックはインターネットトラフィック分析に関連しています。私は分析の世界ではかなり新しいですが、研究の世界ではこれが私がしなければならないことだと思います。 私はいくつかの論文を読みましたが、多くの場合、得られた結果を説明するために確率密度(PDF)、CDF、CCDFなどを使用しています。たとえば、ユーザーセッション期間のPDF、毎日転送されるバイトのCDFなど。確率と統計のクラスを取得したので、それらが何であるかを理解していますが、そのような表現が選択される場合にはまだ混乱しています。 したがって、そのようなグラフと分析を行う人がいる場合(他の一般的なトピックまたはこれで)、どのような状況でこれらの表現のどちらを使用するかを簡単に教えてもらえますか?


1
漸近的不偏性と一貫性の違いは何ですか?
それぞれが他を暗示していますか?そうでない場合、一方は他方を意味しますか?なぜ/そうでないのですか? この問題は、私がここに投稿した回答に対するコメントへの応答として生じました。 関連する用語をグーグル検索しても、特に役立つと思われるものは何も生成されませんでしたが、数学のスタック交換に関する回答に気付きました。しかし、この質問はこのサイトにも適切だと思いました。 コメントを読んだ後に編集する math.stackexchangeの回答と比較して、コメントスレッド@whuber linkedで扱われた問題のいくつかをカバーするために、私はより深い何かを求めていました。また、私が見ているように、math.stackexchangeの質問は、一貫性が漸近的に公平であることを意味するのではなく、理由について何かを説明していません。そこのOPも当然のことながら、漸近的な不偏性は一貫性を意味するものではないため、これまでのところ唯一の回答者はこれがなぜであるかについては触れていません。

1
三角分布のMLE?
通常のMLE手順を三角形の分布に適用することは可能ですか?-私は試していますが、分布が定義されている方法によって、数学のいずれかのステップでブロックされているようです。私は、cの上下のサンプル数を知っている(cを知らなくても)という事実を使用しようとしています。nがサンプルの総数である場合、これらの2つの数はcnと(1-c)nです。しかし、それは導出には役立たないようです。瞬間のモーメントは、cの推定量をほとんど問題なく与えます。ここでMLEに対する閉塞の正確な性質は何ですか(実際にある場合)? 詳細: さんが考えるで[ 0 、1 ]と上に定義されたディストリビューション[ 0 、1 ]によって: ccc[ 0 、1 ][0,1][0,1][ 0 、1 ][0,1][0,1] X <Cの場合、F(X、C)=2(1-X)f(x ; c )= 2 xcf(x;c)=2xcf(x;c) = \frac{2x}{c} c <= xの場合 f(x ; c )= 2 (1 - x )(1 − c )f(x;c)=2(1−x)(1−c)f(x;c) = \frac{2(1-x)}{(1-c)} このサンプルから与えられたcの対数尤度からこの分布から iidサンプル{ x i }を取りましょう:んnn{ x私}{xi}\{x_{i}\} l^(c | …

5
同じ分布族からの2つのランダム変数が同じ期待値と分散を持つが、より高いモーメントが異なる可能性はありますか?
ロケーションスケールの家族の意味を考えていました。私の理解では、ロケーションスケールファミリーのすべてのメンバーについて、パラメーターがロケーションとbスケールである場合、Z = (X − a )/ bの分布はパラメーターに依存せず、それに属するすべてのXについて同じです。家族。XXXaaabbbZ=(X− a )/ bZ=(X−a)/bZ =(X-a)/bバツXX だから私の質問は、同じ分布ファミリーからの2つのランダムが標準化されているが、同じ分布のランダム変数にならない例を提供できますか? セイとYは、同じ分布族から来た(家族と私は例ノーマルまたは両方ガンマなどの両方の意味で...)。定義:バツXXYYY Z1= X- μσZ1=X−μσZ_1 = \dfrac{X-\mu}{\sigma} Z2= Y- μσZ2=Y−μσZ_2 = \dfrac{Y-\mu}{\sigma} 我々は両方のことを知っている及びZ 2は同じ期待と分散、持っているμ Z = 0 、σ 2 Z = 1。Z1Z1Z_1Z2Z2Z_2μZ= 0 、σ2Z= 1μZ=0,σZ2=1\mu_Z =0, \sigma^2_Z =1 しかし、彼らは異なるより高い瞬間を持つことができますか? この質問に答えようとする私の試みは、とYの分布が2つ以上のパラメーターに依存している場合、それよりも大きくなる可能性があるということです。そして、私は3つのパラメーターを持つ一般化されたt − s t u d e n tについて考えています。バツXXYYYt − …

1
ヘッセ行列と共分散行列の関係
私は最尤推定を研究していますが、最尤推定で推論を行うには、分散を知る必要があります。分散を見つけるには、曲率に2次微分を持つヘッセ行列のように見えるクラマーのラオ下限を知る必要があります。共分散行列とヘッセ行列の間の関係を定義するために、私はちょっと混乱しています。質問についてのいくつかの説明を聞くことを願っています。簡単な例が評価されます。

3
離散分布と連続分布の間にKLダイバージェンスを適用することは可能ですか?
私は数学者ではありません。KL Divergenceについてインターネットで検索しました。私が学んだことは、KLダイバージェンスは、入力分布に対してモデルの分布を近似したときに失われた情報を測定することです。これらは、2つの連続または離散分布の間で見られます。連続と離散の間、またはその逆でそれを行うことができますか?

1
線形回帰の二乗和誤差の分布?
サンプル分散の分布 これは、は行列形式 xAx '(A:対称)で表すことができ、x'QDQ'x(Q:正規直交、D:対角行列)でも表すことができます。 ∑(Xi−X¯)2σ2∼χ2(n−1)∑(Xi−X¯)2σ2∼χ(n−1)2 \sum\frac{(X_i-\bar{X})^2}{\sigma^2}\sim \chi^2_{(n-1)} ∑(Xi−X¯)2n−1∼σ2n−1χ2(n−1)∑(Xi−X¯)2n−1∼σ2n−1χ(n−1)2 \sum\frac{(X_i-\bar{X})^2}{n-1}\sim \frac{\sigma^2}{n-1}\chi^2_{(n-1)} (X−X¯)2(X−X¯)2(X-\bar{X})^2xAx′xAx′xAx'x′QDQ′xx′QDQ′xx'QDQ'x 何約∑(Yi−β^0−β^1Xi)2∑(Yi−β^0−β^1Xi)2\sum(Y_i-\hat{\beta}_0-\hat{\beta}_1X_i)^2仮定が与えられると、(Y−β0−β1X)∼N(0,σ2)(Y−β0−β1X)∼N(0,σ2)(Y - \beta_0 - \beta_1X)\sim \mathcal{N}(0, \sigma^2)? I図∑(Yi−β^0−β^1Xi)2σ2∼χ2(n−2).∑(Yi−β^0−β^1Xi)2σ2∼χ(n−2)2.\sum\frac{(Y_i-\hat{\beta}_0-\hat{\beta}_1X_i)^2}{\sigma^2}\sim \chi^2_{(n-2)}. しかし、それを証明したり、見せたりする方法はわかりません。 \ chi ^ 2 _ {(n-2)}として正確に配布されていχ2(n−2)χ(n−2)2\chi^2_{(n-2)}ますか?

2
「パーセンタイル」の定義
現在、PMT Educationによって記述された生物統計に関するメモを読んでおり、セクション2.7の次の文に注意してください。 質量の50パーセンタイルで生まれた赤ちゃんは、赤ちゃんの50%より重いです。 質量の25パーセンタイルで生まれた赤ちゃんは、赤ちゃんの75%より重いです。 質量の75パーセンタイルで生まれた赤ちゃんは、赤ちゃんの25%より重いです。 しかし、私が知っているように、質量の25パーセンタイルで生まれた赤ちゃんは、赤ちゃんの25%より重いはずです。この分野で「パーセンタイル」の特別な定義はありますか、それとも非ネイティブスピーカーとしての文を誤解していますか?

5
信頼区間は役に立ちますか?
頻出統計では、95%信頼区間は、時間を生成する手順であり、無限の回数を繰り返すと、95%の時間で真のパラメーターが含まれます。なぜこれが便利なのですか? 信頼区間はしばしば誤解されます。これらは、パラメーターが含まれていることを95%確実にすることができる間隔ではありません(同様のベイズ信頼性間隔を使用している場合を除く)。信頼区間は、私にとって餌とスイッチのように感じます。 私が考えることができる1つの使用例は、パラメーターがその値であるという帰無仮説を棄却できなかった値の範囲を提供することです。p値はこの情報を提供しませんか?それほど誤解を招くことなく、 つまり、信頼区間が必要なのはなぜですか?正しく解釈すると、それらはどのように役立ちますか?

2
場合
私は声明を証明しようとしています: もし及びの独立確率変数であり、Y 〜N(0 、σ 2 2)バツ〜N( 0 、σ21)X∼N(0,σ12)X\sim\mathcal{N}(0,\sigma_1^2)Y〜N( 0 、σ22)Y∼N(0,σ22)Y\sim\mathcal{N}(0,\sigma_2^2) その場合、も正規確率変数です。バツYバツ2+ Y2√XYX2+Y2\frac{XY}{\sqrt{X^2+Y^2}} 特殊なケース(たとえば)の場合、というよく知られている結果が得られますいつでも及び独立している変数。実際、は独立した変数です。X Yσ1= σ2= σσ1=σ2=σ\sigma_1=\sigma_2=\sigmaXYN(0、σ2)XYバツYバツ2+ Y2√〜N( 0 、σ24)XYX2+Y2∼N(0,σ24)\frac{XY}{\sqrt{X^2+Y^2}}\sim\mathcal{N}\left(0,\frac{\sigma^2}{4}\right)バツXXYYYN( 0 、σ2)N(0,σ2)\mathcal{N}(0,\sigma^2) N(0、σ2バツYバツ2+ Y2√、X2− Y22 X2+ Y2√XYX2+Y2,X2−Y22X2+Y2\frac{XY}{\sqrt{X^2+Y^2}},\frac{X^2-Y^2}{2\sqrt{X^2+Y^2}}N( 0 、σ24)N(0,σ24)\mathcal{N}\left(0,\frac{\sigma^2}{4}\right) 最後の結果の証明は、変換続きます。ここで、および。確かに、ここではおよび。目の前の問題のこの証拠を模倣しようとしましたが、乱雑になっているようです。X = R COS θ 、Y = Rの罪θ U = R(X、Y)→ (R 、Θ )→ (U、V)(X,Y)→(R,Θ)→(U,V)(X,Y)\to(R,\Theta)\to(U,V)x = r cosθ 、y= r sinθx=rcos⁡θ,y=rsin⁡θx=r\cos\theta,y=r\sin\thetaU=XYu = …



2
p値の2つの定義:それらの等価性をどのように証明するか?
私はLarry Wassermanの本、All of Statisticsを読んでいますが、現在はp値(187ページ)について読んでいます。最初にいくつかの定義を紹介しましょう(引用します): 定義1拒絶領域を有する試験のパワー関数によって定義される 試験のサイズがあると定義される テストのサイズが\ alpha以下の場合、テストはレベル\ alphaであると言います。RRRβ(θ)=Pθ(X∈R)β(θ)=Pθ(X∈R)\beta(\theta)=P_{\theta}(X\in R)α=supθ∈Θ0β(θ)α=supθ∈Θ0β(θ)\alpha = \sup_{\theta\in\Theta_0}\beta(\theta)αα\alphaαα\alpha これは基本的にαα\alphaであり、サイズはタイプIのエラーの「最大の」確率であることを示しますppp値は(I quote)によって定義されます 定義2すべてのα∈(0,1)α∈(0,1)\alpha\in(0,1)に対して、棄却領域R_ \ alphaを持つサイズαα\alphaテストがあると仮定します。次に、 p \ text {-value} = \ inf \ {\ alpha:T(X ^ n)\ in R_ \ alpha \} where X ^ n =(X_1、\ dots、X_n)です。RαRαR_\alphap-value=inf{α:T(Xn)∈Rα}p-value=inf{α:T(Xn)∈Rα}p\text{-value}=\inf\{\alpha:T(X^n)\in R_\alpha\}Xn=(X1,…,Xn)Xn=(X1,…,Xn)X^n=(X_1,\dots,X_n) 私にとってこれは意味します:特定のαα\alphaが与えられると、テストとリジェクション領域RαRαR_\alphaがあり、α=supθ∈Θ0(α)Pθ(T(Xn)∈Rα)α=supθ∈Θ0(α)Pθ(T(Xn)∈Rα)\alpha=\sup_{\theta\in\Theta_{0}(\alpha)}P_\theta(T(X^n)\in R_\alpha)。ppp値については、これらすべての\ alphaの最小値をとりαα\alphaます。 質問1これが当てはまる場合、任意に小さい\ epsilonに対してα=ϵα=ϵ\alpha = \epsilonを明確に選択できます。定義2の誤った解釈とは何ですか。つまり、正確にはどういう意味ですかϵϵ\epsilon 現在、Wassermanは連続的であり、私がよく知っているppp値の「同等の」定義を持つ定理を述べています(引用します)。 定理サイズがという形式で …

2
分布の平均についての瞬間の直感?
なぜp(x)、3番目と4番目のモーメントのような確率分布のより高いモーメントが、それぞれ歪度と尖度に対応するのかについて、誰かが直感を提供できますか? 特に、平均の3乗または4乗の偏差は、なぜ歪度と尖度の測定値に変換されるのですか?これを関数の3次または4次導関数に関連付ける方法はありますか? 尖度のこの定義を考えてみましょう: Kurtosis(X)=E[(x−μX)4]/σ4Kurtosis(X)=E[(x−μX)4]/σ4Kurtosis(X) = E[(x - \mu_{X})^4] / \sigma^4 繰り返しますが、なぜを上げると「凸凹」が生じるのか、またはが歪むのはなぜかは明らかではありません。魔法のようで神秘的です。(X - μ )3(x−μ)4(x−μ)4(x-\mu)^4(x−μ)3(x−μ)3(x-\mu)^3 編集:クイックフォローアップ。尖度のような指標の中央値ではなく、平均についてモーメントを定義することの利点は何ですか?次のような推定量のプロパティは何ですか? MedianKurtosis(X)=E[(x−x~)4]/σ4MedianKurtosis(X)=E[(x−x~)4]/σ4MedianKurtosis(X) = E[(x - \tilde{x})^4] / \sigma^4 ここで、は中央値です。これはおそらく、平均を捨てる分布の外れ値の影響をあまり受けず、おそらくピーク度のより公平な尺度になるでしょうか?x~x~\tilde{x}

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.