タグ付けされた質問 「notation」

統計で使用される統計表記と数学表記についての質問。


1
分散、歪度、尖度を超える高次キュムラントとモーメントの名前
x (t )x(t)x(t) デリバティブのスナップ、クラックル、ポップを7次まで提案している人もい ます。 機械物理学と弾性理論から発想を得たモーメントは統計学においても重要です。確率分布の「モーメント」について、「モーメント」とは何ですか。K.ピアソンの作品の初期の言及。 000 5次または6次のキュムラント/モーメント、およびそれ以降(「高次のモーメント」を除く)に一般に受け入れられている名前や採用されている名前はありますか? Numerical Recipes 3rd Edition:Art of Scientific Computing、p。723: 歪度(または3番目のモーメント)および尖度(または4番目のモーメント)は注意して使用する必要があります。 これは、ポートフォリオのリスク分析における7次または8次までのモーメントの明らかな使用によって確認されているようです。 その他の注意事項: SE.maths:超歪度の解釈はありますか? スキューを引き起こす際のテールとセンター(モード、ショルダー)の相対的な重要性

2
正確に何を
何がのような表記法(ドット以上チルダ)の平均、コンテキストのx ˙ 〜 N(0 、1 )?∼˙∼˙\dot\simx∼˙N(0,1)x∼˙N(0,1)x \mathrel{\dot\sim} \mathcal N(0,1) 正しくタイプセットする方法を見つける方が簡単であることがわかります:tex.SEは、実際に何を意味するのかを見つけるよりも、\mathrel{\dot\sim}単に\dot\simスペーシングの問題を修正するのではなく、タイプする必要があると説明しています。これまで、CVで4回しか使用されていません。それは標準ですか?

1
統計モデル表記の「標準」はありますか?
たとえば、Bugsのマニュアルや、LeeとWagenmakersによる近刊の本(pdf)やその他の多くの場所では、ほとんどの統計モデルを簡潔に説明するのに使用できるという点で、私には非常に柔軟な表記法が使用されています。この表記の例は次のとおりです。 y私〜二項(p私、n私)ログ(p私1 − p私)= b私b私〜通常(μp、σp)yi∼Binomial(pi,ni)log⁡(pi1−pi)=bibi∼Normal(μp,σp) y_i \sim \text{Binomial}(p_i,n_i) \\ \log(\frac{p_i}{1 - p_i}) = b_i \\ b_i \sim \text{Normal}(\mu_p,\sigma_p) これは、予測子はないがグループの階層ロジスティックモデルを表します。モデルを説明するこの方法は、あなただけで事前確率を追加する必要があります。このモデル記述完全ベイズを作るために、例えば、frequentistとベイズモデルを記述するためにも同様にうまく動作するように思えるμ Pとσ のp。i = 1 … ni=1…ni = 1\dots n μpμp\mu_pσpσp\sigma_p このタイプのモデル表記/形式は、いくつかの記事または本で詳細に説明されていますか? この表記法を使用してモデルを記述したい場合は、さまざまな方法があり、他の人をフォローしたり参照したりするための包括的なガイドがあると非常に便利です。人々がこのタイプの表記法をどのように使用するかで私が見つけたいくつかの違い: ディストリビューションとは何ですか?たとえば、などを見たことがあります。N、N 、Norm 、NormalN,N,Norm,Normal\mathcal{N},\text{N},\text{Norm},\text{Normal} インデックスをどのように扱いますか?例えば、私は、y i [ j ]、y jを見た| 私などy私はjyijy_{ij}y私[ j ]yi[j]y_{i[j]}yj|iyj|iy_{j|i} μμ\mu 追加質問:この表記には名前がありますか?(より良い名前がないため、私が書い たブログ投稿では、確率分布中心の慣習と呼んでいました...)

6
という表記はどのように読み取られますか?
という表記はどのように読み取られますか?それである以下の正規分布を?またはは正規分布ですか?または、はほぼ正常です。X∼N(μ,σ2)X∼N(μ,σ2)X\sim N(\mu,\sigma^2)XXX XXX XXX 同じ分布に従う(または単語が何であれ)いくつかの変数がある場合はどうなりますか?どのように書かれていますか?

2
混合モデルのパラメトリック、セミパラメトリック、ノンパラメトリックブートストラップ
以下の移植片は、この記事から引用したものです。私はブートストラップの初心者であり、R bootパッケージを使用した線形混合モデルのパラメトリック、セミパラメトリック、ノンパラメトリックのブートストラップブートストラップを実装しようとしています。 Rコード これが私のRコードです: library(SASmixed) library(lme4) library(boot) fm1Cult <- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=Cultivation) fixef(fm1Cult) boot.fn <- function(data, indices){ data <- data[indices, ] mod <- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=data) fixef(mod) } set.seed(12345) Out <- boot(data=Cultivation, statistic=boot.fn, R=99) Out ご質問 …
9 r  mixed-model  bootstrap  central-limit-theorem  stable-distribution  time-series  hypothesis-testing  markov-process  r  correlation  categorical-data  association-measure  meta-analysis  r  anova  confidence-interval  lm  r  bayesian  multilevel-analysis  logit  regression  logistic  least-squares  eda  regression  notation  distributions  random-variable  expected-value  distributions  markov-process  hidden-markov-model  r  variance  group-differences  microarray  r  descriptive-statistics  machine-learning  references  r  regression  r  categorical-data  random-forest  data-transformation  data-visualization  interactive-visualization  binomial  beta-distribution  time-series  forecasting  logistic  arima  beta-regression  r  time-series  seasonality  large-data  unevenly-spaced-time-series  correlation  statistical-significance  normalization  population  group-differences  demography 

1
統計に記号の従来の意味はありますか?
ベイジアンカーブフィッティングに関する論文を読んでいて(Dimatteo et。al。フリーノットスプラインによるベイジアンカーブフィッティング、2001)、記号≏≏\bumpeq。論文全体で数回使用されていますが、明示的に定義されているわけではありません。いくつかのgoogleおよびstackexchange検索の後、シンボルは広く使用されておらず、従来の方法でも定義されていないように見えます。 以下に、引用した論文のコンテキストを使用した例を示します。他の記号を定義していないことをお詫びしますが、これを行うと、リンク先の論文からテキストの大部分をコピーすることになり、質問にはほとんど役に立ちません。 p1059(式8)から: ちなみに、これは式(6)の正規モデルの尤度比近似でも確認できます。 p(y|kc,ξc)p(y|k,ξ)≏1n−−√((y−Bk,ξβ^)T(y−Bk,ξβ^)(y−Bk,ξcβc^)T(y−Bk,ξcβc^))n/2=exp(−BIC/2)p(y|kc,ξc)p(y|k,ξ)≏1n((y−Bk,ξβ^)T(y−Bk,ξβ^)(y−Bk,ξcβc^)T(y−Bk,ξcβc^))n/2=exp(−BIC/2)\frac{p(y|k^c,\xi^c)}{p(y|k,\xi)}\bumpeq\frac{1}{\sqrt{n}}\left(\frac{(y-B_{k,\xi}\hat{\beta})^T(y-B_{k,\xi}\hat{\beta})}{(y-B_{k,\xi^c}\hat{\beta^c})^T(y-B_{k,\xi^c}\hat{\beta^c})}\right)^{n/2}=exp(-\text{BIC}/2) 文脈から、≏≏\bumpeqは近似を表すようです。これが当てはまる場合、それは≈≈\approxまたは\ simのような近似のためのより一般的なシンボルと同義∼∼\simですか?または、それは≈≈\approxまたは∼∼\simが不十分または誤解を招く特定の種類の近似を表すために使用されていますか?

1
上付き文字での意味は何である
尤度ベースの推論のコンテキストで、私は少し混乱しているので、関心のあるパラメーターに関するいくつかの表記を見てきました。 例えば、表記などとE θ [ S (θ )]。pθ(x)pθ(x)p_{\theta}(x)Eθ[S(θ)]Eθ[S(θ)]{\mathbb E}_{\theta}\left[S(\theta)\right] 上記の添え字表記におけるパラメーター()の意味は何ですか?言い換えれば、それをどのように読むべきでしょうか?θθ\theta 私の最初の仮定は、それが単に「パラメーター使って」を意味するということでした。例えば、用のp θ(X )、それは次のようになります。θθ\thetapθ(x)pθ(x)p_{\theta}(x) 「パラメーターθを持つの確率密度。」xxxθθ\theta しかし、これはおそらく正しくないと、一般的には、L (θが)でない分布は(すなわち、それは団結に統合されません)。したがって、それは密度ではあり得ないでしょうか?pθ(x)=L(θ)pθ(x)=L(θ)p_{\theta}(x) = L(\theta)L(θ)L(θ)L(\theta) また、の場合には、私はそれがに対する変更内容はよく分からないE [ (S (θ )](つまり添字付きθ省略します)。Eθ[S(θ)]Eθ[S(θ)]{\mathbb E}_{\theta}\left[S(\theta)\right]E[(S(θ)]E[(S(θ)]{\mathbb E}\left[(S(\theta)\right]θθ\theta 上記のとL (θ )は、それぞれスコア関数と尤度関数を表します。S(θ)S(θ)S(\theta)L(θ)L(θ)L(\theta)


1
との意味は何ですか?
「クロスヘア」記号を使用している本の表記法を完全に理解するのに苦労しています。最初はようには行列で、2番目は。とはどちらも行列です。⨁i=1nZj⨁i=1nZj\bigoplus\limits_{i=1}^n{} Z_j ZjZjZ_jIn⊗ΦIn⊗ΦI_n \otimes \PhiInInI_nΦΦ\Phi 本は多変量統計についてであり、セクションはランダム係数モデルについてです。参照する表記/用語の付録はありません。ユーザーがコンテキストを確認できるように、ページのデジタル写真を投稿しました(これはセクションの冒頭にあります)。 これはここのトピックですか、それともmath.seに投稿する必要がありますか? 更新:最初にこれをmeta.seに投稿しましたが、ここに移行されました。本の関連ページから写真を添付し​​ています。


1
Rのglmコマンドを数学表記に変換する
次の一般化線形モデルがあります。オブジェクトglmDVは、試行全体に対する成功の割合としてモデル化されます。オブジェクトx_iは連続変数です。 これは数学表記ではどのように見えますか? winp.glm = glm(glmDV ~ x1 + x2 + x3 + x4 + x5 + x6 + x7, data=myData, family=binomial("logit"))

2
Rの2因子反復測定ANOVA後の事後検定?
Rで2因子(両方とも被験者内)のANOVAを繰り返し測定した後、事後テスト(Tukey HSD)を実行する方法に関する解決策を見つけるのに問題があります。ANOVAには、aov -functionを使用しました。 summary(aov(dv ~ x1 * x2 + Error(subject/(x1*x2)), data=df1)) 他の質問への回答を読んだ後、他の機能(lmeなど)を使用してANOVAを再実行する必要があることを知りました。これが私が思いついたものです。 Lme.mod <- lme(dv ~ x1*x2, random=list(subject=pdBlocked(list(~1, pdIdent(~x1-1), pdIdent(~x2-1)))), data=df1) anova(Lme.mod) 主な効果はどちらも有意でしたが、相互作用の効果はありませんでした。次に、これらの関数を事後比較に使用しました。 summary(glht(Lme.mod, linfct=mcp(x1="Tukey"))) summary(glht(Lme.mod, linfct=mcp(x2="Tukey"))) しかし、いくつかの問題がありました: まず、Rヘルプファイルには、「双方向ANOVAまたはANCOVAモデル(...)multcompバージョン1.0-0以降で対象のパラメーターを定義する場合、mcp関数は注意して使用する必要があります。主な効果の比較が生成されます。のみ、共変量と交互作用を無視します(古いバージョンは交互作用項で自動的に平均化されました)警告が表示されます。そして確かに、私は次の警告メッセージを受け取りました: Warning message: In mcp2matrix(model, linfct = linfct) : covariate interactions found -- default contrast might be inappropriate もう1つの不可解な点は、両方の主要な効果は有意でしたが、要因の1つ(x1)の事後比較に有意差はなかったということです。これに出会ったことはありません。スクリプト/分析は正しい/適切ですか、それとも欠けているものはありますか?どんな助けでも大歓迎です!

3
OLS回帰でのベータ係数の行列からスカラー表記への変換
私の計量経済学試験で、スカラー表記を忘れた場合、行列表記を覚えて逆に作業することで自分自身を救うことができることがわかりました。しかし、以下は私を混乱させました。 単純な見積もりを考えると yi^=β0^+β1^xi1yi^=β0^+β1^xi1\hat{y_i} = \hat{\beta_0} + \hat{\beta_1}x_{i1} どのようにして β^=(X′X)−1X′yβ^=(X′X)−1X′y\boldsymbol{\hat{\beta}} = \boldsymbol{(X'X)}^{-1}\boldsymbol{X'y} に β^1=∑ni=1(xi−x¯)(yi−y¯)∑ni=1(xi−x¯)2β^1=∑i=1n(xi−x¯)(yi−y¯)∑i=1n(xi−x¯)2\hat{\beta}_1 = \frac{\sum_{i=1}^n(x_i-\bar{x})(y_i-\bar{y})}{\sum_{i=1}^n(x_i-\bar{x})^2} 動けなくなる β^1=∑ni=1xiyi∑ni=1x2iβ^1=∑i=1nxiyi∑i=1nxi2\hat{\beta}_1 = \frac{\sum_{i=1}^nx_iy_i}{\sum_{i=1}^nx_i^2}

2
一部の統計記号に「平方」があるのはなぜですか(例:分散)
統計で、「2乗」されたシンボルに遭遇することがあります。他の領域では、たとえば力学のように、通常の文字に関心のある数量を指定してから、式を定義して、関心のある数量が通常の文字として左側に並ぶまで並べ替えることができます。式。例は、時間と速度移動した後の位置です。xxxtttvvv x=vtx=vtx = vt ただし、統計では、2乗された数量が左側に表示されることがあります。これは、結果をさらに解釈するために使用されるためです。 期待値がE [X] = µの確率変数の分散:σ2XσX2\sigma^2_XXXXE[X]=µE[X]=µE[X]=µ σ2X=E[(X−µ)2]σX2=E[(X−µ)2]\sigma^2_X = E[(X-µ)^2] ここでは、四角形のエンティティが数式の左側に立っています。 統計学者によって常に「R 2乗」と呼ばれることさえある決定係数R2R2R^2。頻繁に使われるのに、なぜ「普通の」手紙を送らないのですか? 遺伝率は、遺伝学に起因する変動量と環境に起因する変動量との比をとる場合に、遺伝学に採用される尺度です。量的形質PPP(たとえば、成長の高さ)は、遺伝子型効果GGGおよび環境効果EEE(すべての確率変数)に応じて、次のようにモデル化されます。 P=G+EP=G+EP = G + E 広義の遺伝率H2H2H^2が定義されていますH2=Var(G)/Var(P)H2=Var⁡(G)/Var⁡(P)H^2 = \operatorname{Var}(G)/\operatorname{Var}(P) [ソース] 誰もHHHに興味がなく、H ^ 2だけH2H2H^2です。 この慣習の意味は何ですか?それは統計学者に何を伝えますか?または、いくつかの無関係な原因がありますか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.