タグ付けされた質問 「mathematical-statistics」

形式的な定義と一般的な結果に関係する統計の数学的理論。

2
不偏推定量がUMVUEになるために必要な条件は何ですか?
Rao-Blackwellの定理によれば、統計値TTTがθθ\thetaに対して十分かつ完全であり、E(T)= θE(T)=θE(T)=\thetaである場合、TTTは均一最小分散不偏推定量(UMVUE)です。 公平な推定者がUMVUEであることを正当化する方法を私は思っています: もしTTTが十分でない、UMVUEになりますか? もしTTTが完全でない、UMVUEになりますか? TTTが不十分または完全でない場合、UMVUEになる可能性がありますか?

1
二項分布は、バイナリ選挙をモデル化できるすべての「合理的な」分布の中で可能な限り最小の分散を持っていますか?
人が二者択一をする選挙を想像してみてください。彼らはAに投票するか反対に投票します。その結果、人がAに投票するため、Aの結果はます。nnnmmmp=m/np=m/np=m/n これらの選挙をモデル化する場合、各人が確率で独立してAに投票し、投票の二項分布につながると想定でき。この分布には、平均と分散ます。pppvotes for A∼Binom(n,p).votes for A∼Binom(n,p).\text{votes for A}\sim\mathsf{Binom}(n,p).m=npm=npm=npnp(1−p)np(1−p)np(1-p) 他の仮定も可能です。たとえば、確率自体が何らかの分布(ベータなど)からの確率変数であると想定できます。これはA.のための投票のベータ二項分布につながることができますまたは私はのグループでその人の投票と仮定することができの各グループ、人々が同じ選択を行い、それが確率でAである。これにより、分散がより大きい二項分布が得られます。これらすべてのケースで、結果の分布の分散は、最も単純な二項方式の場合よりも大きくなります。pppkkkkkkppp 二項分布の分散が最小であると主張できますか?言い換えると、この主張は、たとえば可能な分布にいくつかの合理的な条件を指定することによって、どういうわけか正確にすることができますか?これらの条件は何でしょうか? それとも、分散の少ない合理的な分布があるのでしょうか? 私がすることができ、すべての例とき、低分散を想像して人々は、彼らが投票する方法について事前に合意し、そう本当にランダム変数ではなく、一定の数の。その場合、分散はゼロになります。あるいは、ほとんどすべての人が同意したが、同意しなかった人もいるため、周りにわずかな差異がある可能性が。しかし、これは不正行為のように感じます。各人が何らかの意味でランダムに投票する場合など、事前の準備なしで二項よりも小さい分散を持つことができますか?nnnvotes for Avotes for A\text{votes for A}mmmmmm

1
ランダム分布からの逸脱の背後にある力学
私たちが取り組んでいるシステムは生物学的であり、より具体的には、プログラムされたDNA損傷イベントが染色体全体に分布しています。これは、ポイントを選択できる1Dアレイ(染色体)と考えることができます(意図的な損傷の部位)。これらのイベントの位置を実験的にマッピングし、ランダムな分布に当てはまるかどうかを最初に質問しました。つまり、染色体に沿った任意のポイントで等確率で損傷が発生する可能性があり、特定の損傷部位は互いに独立しています。MATLAB(randi)でランダム分布を生成することにより、これは事実ではないことがわかりました。 実際のデータとモデル化されたデータの両方からポイント間距離(IPD)を分析すると、実際のデータは、特定のIPDサイズ以下でのみランダム分布から逸脱し、その後、その上にランダム分布に再結合します。実際のデータで偶然に予想されるよりも短いIPD。 IPD結果の例: Red = random modelled distribution Blue = real data Y-axis = IPD size (log-scale) X-axis = IPD number (IPDs are just plotted in numerical order) ここでは、IPDが対数Y軸にプロットされ、ヒストグラムのように昇順でプロットされます。特定のIPDサイズ(Y軸)の下を見るとわかるように、青い線は赤い線からずれています。 私たちがテストしている仮説(これは健全な生物学的根拠を持っています)は、1つのイベントの位置がすでに形成されたイベントに依存するというものです。具体的には、サイトが選択されるとすぐに、周囲の抑圧ゾーンが呼び出され、周囲の領域が次のサイトとして選択される可能性が低くなります。これにより、イベントが効果的に分離され、より短いIPDがないことが説明されます。このゾーンは、選択したポイントから離れるほど強度が徐々に低下します。これは、特定のIPD距離を超えると独立に戻ることを示しています。 質問:ランダムなデータセットと実際のデータセットのみからこのゾーンの形状を導出できる数学的な方法はありますか?たとえば、その効果が見えなくなるまで、各ポイントでその強さ(ランダム性から逸脱する能力)を計算することによって? 上の図の三角形の形状とスケールは、私が得ようとしている主なものです(必ずしも三角形ではありません)。 この仮説をシミュレートする2番目のモデルがあります-有望な結果を提供しますが、抑圧ゾーンの形状、スケールなどについてのガイダンスが必要です。それ以外の場合は試行錯誤で、複数の異なるウィンドウ+パラメーターが適合する可能性があります。 IPDをヒストグラムにビニングし、ガンマ確率関数をフィッティングし、これをハザード関数に変換することで、以前に同様のことを行ったことがありますが、私は数学者ではないので、これが正しい方法であるかどうか、またどうすればよいかわかりませんそれ。 私は主にMATLABで働いているので、誰かがMATLABの形で何らかの助けを提供できればそれは素晴らしいことですが、どんな助けでも最も高く評価されます。 プロットで使用されるデータ: Real IPDs: 7126.5 11311.5 12582.25 21499 25429.25 28876.5 29178.5 35545.25 37498.75 37881.5 38152 45464 …

3
分布の分析形式が不明な場合の変位値関数の取得方法
問題は、この[0]論文の377〜379ページにあります。 連続分布と固定与えられた場合、以下を考慮してください:FFFz∈Rz∈Rz\in\mathbb{R} Lz(t)=PF(|z−Z|≤t)Lz(t)=PF(|z−Z|≤t)L_z(t)=P_F(|z-Z|\leq t) そして H(z)=L−1z(0.5)=medZ∼F|z−Z|H(z)=Lz−1(0.5)=medZ∼F|z−Z|H(z)=L^{-1}_z(0.5)=\underset{Z\sim F}{\mbox{med}}|z-Z| ここで、は正しい連続逆行列です。したがって、固定zの場合、これはすべてのZ \ sim Fからzまでの距離の中央値です 。次に、関数について考えます。zL−1z(u)=inf{t:Lz(t)>u}Lz−1(u)=inf{t:Lz(t)>u}L^{-1}_z(u)=\inf\{t:L_z(t)>u\}zzzZZ∼FZ∼FZ\sim Fzzz L(t)=PF(H(Z)≤t)L(t)=PF(H(Z)≤t)L(t)=P_F(H(Z)\leq t) 今、私はH(z)の分析式を持っていませんH(z)H(z)H(z)(実際、そのための分析式は不可能だと確信しています)が、CDF Fが与えられればFFF、ルート探索アルゴリズムを使用してH(z)H(z)H(z)任意のzzz。 このアプリケーションでは、興味があります: L−1(0.5)=medZ∼FH(Z)L−1(0.5)=medZ∼FH(Z)L^{-1}(0.5)=\underset{Z\sim F}{\mbox{med}}H(Z) これは、中央値であるH(Z)H(Z)H(Z)のために、再度、Z∼FZ∼FZ\sim F。 を取得するために、グリッド上で多くの値に対応する値をルート検索アルゴリズムを使用して上記で説明したように)計算し、これらの値の重み付き中央値を取ります推定値としての(重み付き。H (z )z H (z )f (z )L − 1(0.5 )L−1(0.5)L−1(0.5)L^{-1}(0.5)H(z)H(z)H(z)zzzH(z)H(z)H(z)f(z)f(z)f(z)L−1(0.5)L−1(0.5)L^{-1}(0.5) 私の質問は: を取得するためのより正確な方法はありますか(この論文の執筆者は、計算方法を述べていません)L − 1(0.5 )L−1(0.5)L−1(0.5)L^{-1}(0.5)L−1(0.5)L−1(0.5)L^{-1}(0.5) の値のグリッドはどのように選択する必要がありますか?zzz [0] OlaHössjer、Peter J. Rousseeuw、Christophe Croux。ロバストなスプレッド汎関数の推定量の漸近。Statistica Sinica 6(1996)、375-388。

1
エラー用語とイノベーション
私たちは時々エラー用語を「イノベーション」と呼ぶことに気づきました。これが特別な状況にあるかどうか、またはこれらの用語を別の用語に使用できるかどうかはわかりません。次に、「なぜエラー用語を「イノベーション」と呼ぶのですか?」

2
カイ二乗から正規分布への変換
標準正規分布とカイ2乗分布の関係はよく知られています。でも、 から標準正規分布に戻る変換はあるのでしょうか。χ2(1)χ2(1)\chi^2 (1) その範囲は正の数値のみであるため、平方根変換が機能しないことが簡単にわかります。結果の分布は、折りたたまれた正規分布と呼ばれていると思います。ここで機能する巧妙なトリックはありますか?

1
二項式のパラメーターの推定
まず第一に、私はこの主題の専門家ではないことを明確にしたいと思います。 と 2 項の2つの確率変数とがあるとすると、は同じであること注意してください。ことを知っていXXXYYYX∼B(n1,p)X∼B(n1,p)X\sim B(n_1,p)Y∼B(n2,p),Y∼B(n2,p),Y\sim B(n_2,p),pppZ=X+Y∼B(n1+n2,p).Z=X+Y∼B(n1+n2,p).Z=X+Y \sim B(n_1+n_2,p). ましょう 用試料でとのサンプルである、推定するための標準的な方法がある及び?{x1,…,xk}{x1,…,xk}\{x_1,\ldots,x_k\}XXX{y1,…,yk}{y1,…,yk}\{y_1,\ldots,y_k\}YYYn=n1+n2n=n1+n2n=n_1+n_2ppp これが私たちが行ったことです: によって与えられるの「新しいサンプル」を、ZZZ{x1+y1,…,xk+yk}{x1+y1,…,xk+yk}\{x_1+y_1,\ldots, x_k+y_k\} 尤度推定器を使用して、と推定値を取得します。nnnppp フィッシャー情報を使用して、および誤差を理解しようとします。nnnppp この方法は機能しているように見えますが、まだいくつかの疑問があります。してみましょうかけ順列のグループを要素。すべてのについて、によって与えられる「サンプル」を考慮することができ「新しいサンプル」のそれぞれに尤度推定量を適用すると(異なる合計があります、とについて異なる推定られます。SkSkS_kkkkσ∈Skσ∈Sk\sigma\in S_k{x1+yσ(1),…,xk+yσ(k)}.{x1+yσ(1),…,xk+yσ(k)}.\{x_1+y_{\sigma(1)},\dots, x_k+y_{\sigma(k)}\}.k!k!k!(nσ,pσ)(nσ,pσ)(n_\sigma,p_\sigma)nnnppp これの意味は何ですか?新しい値はどのように関連付けられますか?の誤差の計算に使用できますか?nσ,pσnσ,pσn_\sigma, p_\sigmannn 一部のコメント: 質問は以前ここに投稿されていましたが、ユーザーからタット/クロスバリデーションされたSEを使用するように勧められました。 私が念頭に置いている例では、は特定の地域の鳥の数であり、は可視性の確率です。同様の持つ領域を集約する必要があります。そうしないと、データが小さすぎます。特に、可能であれば、推定のみが必要です。ここで、のアプリオリは不明です。p p n pnnnppppppnnnppp 例 明確にするために、kjetil b halvorsenの回答を考慮して、ここで実際的な例を示します。固定された等しい確率で2つのゾーンに分割された領域が1つだけあり、データが次のとおりであるとします。ppp Zone 1 Zone 2 a1 b1 a2 b2 a3 b3 a4 b4 a5 b5 a6 b6 次に、これを検討できます。 Zone 1+2 c1=a1+b1 …

1
との意味は何ですか?
「クロスヘア」記号を使用している本の表記法を完全に理解するのに苦労しています。最初はようには行列で、2番目は。とはどちらも行列です。⨁i=1nZj⨁i=1nZj\bigoplus\limits_{i=1}^n{} Z_j ZjZjZ_jIn⊗ΦIn⊗ΦI_n \otimes \PhiInInI_nΦΦ\Phi 本は多変量統計についてであり、セクションはランダム係数モデルについてです。参照する表記/用語の付録はありません。ユーザーがコンテキストを確認できるように、ページのデジタル写真を投稿しました(これはセクションの冒頭にあります)。 これはここのトピックですか、それともmath.seに投稿する必要がありますか? 更新:最初にこれをmeta.seに投稿しましたが、ここに移行されました。本の関連ページから写真を添付し​​ています。

2
AngristとImbensのLATE定理の証明1994
内因性変数が結果及ぼす影響を推定するために使用できるバイナリー機器があると仮定します。楽器に有意な第1ステージがあり、ランダムに割り当てられ、除外制限を満たし、Angrist and Imbens(1994)で概説されているように単調性を満たしているとします。 http://www.jstor.org/discover/10.2307/2951620?uid=3738032&uid=2&uid=4&sid=21104754800073ZiZiZ_iDiDiD_iYiYiY_i 彼らは、コンパイラである確率()は およびコンパイラーの部分潜在的な結果の差は CiCiC_iPr(Ci)=Pr(Di=1|Zi=1)−Pr(Di=1−Zi=0)Pr(Ci)=Pr(Di=1|Zi=1)−Pr(Di=1−Zi=0)\text{Pr}(C_i) = \text{Pr}(D_i = 1|Z_i = 1) - \text{Pr}(D_i = 1 - Z_i = 0)E(Yi1−Yi0|Ci)=E(Yi|Zi=1)−E(Yi|Zi=0)E(Di|Zi=1)−E(Di|Zi=0)E(Yi1−Yi0|Ci)=E(Yi|Zi=1)−E(Yi|Zi=0)E(Di|Zi=1)−E(Di|Zi=0)E(Y_{i1} - Y_{i0}|C_i) = \frac{E(Y_i|Z_i=1)-E(Y_i|Z_i=0)}{E(D_i|Z_i=1)-E(D_i|Z_i=0)} 誰かがこれらの2つの表現をどのように取得するか、さらに重要なことにそれらをどのように組み合わせるかについて、誰かがいくつかの光を当てることができますか?私は彼らのジャーナル記事からこれを理解しようとしますが、私はそれを理解することができません。これについて何か助けていただければ幸いです。

1
カンテッリの不等式証明
私は次の不平等を証明しようとしています: 編集:私がこの質問を投稿した直後に、私は証明するように求められている不平等がカンテリの不平等と呼ばれていることを発見しました。これを書いたとき、この特定の不平等に名前があることに気づきませんでした。私はGoogleを介して複数の証明を見つけたので、厳密に言えば、もうソリューションは必要ありません。ただし、元々あったように、であるという事実を呼び出す証拠が見つからないため、この質問を続けています。意図されました。t=E(t−X)≤E[(t−X)IX&lt;t]t=E(t−X)≤E[(t−X)IX&lt;t]t=E(t-X)\leq E[(t-X)\mathbb{I}_{Xt)またはむしろ。以来、、我々は交換することができると後者の左側を。 E(X)=0XX−E(X)P(X&gt;t)≤V(X)t2P(X&gt;t)≤V(X)t2P(X>t)\leq \frac{V(X)}{t^2}E(X)=0E(X)=0E(X)=0XXXX−E(X)X−E(X)X-E(X) ここが先に進むのに苦労しているところです。という事実を使用する方法がわかりません。再度、以降、我々は、で置換することができる のための。これはと同等です。次に、不等式の右辺の分母のをに書き換えます。これは、中間の項が欠落するため、簡略化され。しかし、私はここからどこへ行くことができるかもわかりません。これをとしてさらに書き換えることができますが、少なくとも項が正しい場所にあります。E (X )= 0 T - E (X )T E (T - X )T 2 [ E (T - X )] 2 t 2 − [ E (X )] 2t=E(t−X)≤E[(t−x)IX&lt;t]t=E(t−X)≤E[(t−x)IX&lt;t]t=E(t-X)\leq E[(t-x)\mathbb{I}_{X<t}]E(X)=0E(X)=0E(X)=0t−E(X)t−E(X)t-E(X)tttE(t−X)E(t−X)E(t-X)t2t2t^2[E(t−X)]2[E(t−X)]2[E(t-X)]^2t2−[E(X)]2t2−[E(X)]2t^2-[E(X)]^2V (X )+ t 2t2+V(X)−E(X2)t2+V(X)−E(X2)t^2+V(X)-E(X^2)V(X)+t2V(X)+t2V(X)+t^2 明らかに、ここにに関連する何かが欠けていますが、率直に言って、この用語の処理方法がまったくわかりません。私はこの用語が私に言っていることを概念的に理解しています。直感的には、が未満に制限されている場合、の期待値は同じ量よりも小さくなります。つまり、前者は否定的である可能性が高く、後者は肯定的である必要があります。しかし、私はこの事実を証明にどのように使用できるかわかりません。T - X X TE(t−X)≤E[(t−X)IX&lt;t]E(t−X)≤E[(t−X)IX&lt;t]E(t-X) \leq E[(t-X)\mathbb{I}_{X<t}]t−Xt−Xt-XXXXttt 簡単にするために内側を「配布」してみましたが...... E[(t−X)IX&lt;t]=E[tIX&lt;t−XIX&lt;t]=tP(X&lt;t)−?E[(t−X)IX&lt;t]=E[tIX&lt;t−XIX&lt;t]=tP(X&lt;t)−?E[(t-X)\mathbb{I}_{X<t}]=E[t\mathbb{I}_{X<t} …

1
多変量ガウスのコンターのハイパーボリューム
から抽出されたサイズサンプルで、原点までのユークリッド距離が最小の観測値の%の(行列式の対数)の共分散の()値の値を 探しています、二変量標準ガウス。α Nn→∞n→∞n\rightarrow \inftyαα\alphannn -楕円のハイパーボリュームは、その共分散行列の行列式に比例するため、タイトルに比例します- 標準変量ガウス--By、Iは平均長さ2の0のベクトルであり、ランク2単位行列であるが.--- 0 2 IN2(02,II2)N2(02,II2)\mathcal{N}_2(0_2,\pmb I_2)02020_2II2II2\pmb I_2 、数値が前後の 場合よりも、シミュレーションで簡単に確認でき。α=52/70α=52/70\alpha=52/70≈−1.28≈−1.28\approx -1.28 library(MASS) n&lt;-10000 p&lt;-2 x&lt;-mvrnorm(n,rep(0,p),diag(2)) h&lt;-ceiling(0.714286*n) p&lt;-ncol(x) w&lt;-mahalanobis(x,rep(0,p),diag(p),inverted=TRUE) #These are eucledian distances, because the covariance used is the identity matrix s&lt;-(1:n)[order(w)][1:h] log(det(cov(x[s,]))) しかし、これについて正確な式を取得する方法(または失敗した場合、より良い近似)を思い出しません。



3
特異な共分散行列を持つ多変量分布は密度関数を持つことができますか?
上の多変量分布に特異共分散行列があるとします。密度関数がないと結論付けることはできますか?RnRn\mathbb R^n たとえば、多変量正規分布の場合ですが、他のすべての多変量分布に当てはまるかどうかはわかりません。 これは、ルベーグ測度に対するラドン・ニコディム微分の存在の問題だと思いますが、素確率論にも答えがあるかもしれません。RnRn\mathbb R^n

3
連続確率変数のため、なぜ
私の教科書はこれを「メモ」という見出しの付いたサイドボックスに入れ、その理由を説明していません。この声明がなぜ当てはまるのか教えてください。 P(a&lt;Z&lt;b)=P(a≤Z&lt;b)=P(a&lt;Z≤b)=P(a≤Z≤b)P(a&lt;Z&lt;b)=P(a≤Z&lt;b)=P(a&lt;Z≤b)=P(a≤Z≤b)P(a < Z < b) = P(a \leq Z < b) = P(a < Z \leq b) = P(a \leq Z \leq b)

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.