タグ付けされた質問 「notation」

統計で使用される統計表記と数学表記についての質問。

1
期待の添字表記
測定理論の枠組みにおける条件付き期待値の添字表記の正確な意味は何ですか?これらの添え字は、条件付き期待値の定義には表示されませんが、たとえばwikipediaのこのページに表示される場合があります。(数ヶ月前の同じページではないことに注意してください)。EX[f(X)]EX[f(X)]\mathbb{E}_X[f(X)] 例えばの意味は何をする必要がありますでX 〜N(0 、1 )とY = X + 1?EX[X+Y]EX[X+Y]\mathbb{E}_X[X+Y]X∼N(0,1)X∼N(0,1)X\sim\mathcal{N}(0,1)Y=X+1Y=X+1Y=X+1

4
確率表記の意味および
多くの本や論文で一般的に使用されている表記と意味の違いは何ですか?P (z | d 、w )P(z; d、w )P(z;d,w)P(z;d,w)P(z| d、w )P(z|d,w)P(z|d,w)

2
なぜ2つの異なるロジスティック損失定式化/表記法があるのですか?
2種類のロジスティック損失の公式を見てきました。それらが同一であることを簡単に示すことができます。唯一の違いは、ラベル定義です。yyy 定式化/表記法1、:y∈{0,+1}y∈{0,+1}y \in \{0, +1\} L(y,βTx)=−ylog(p)−(1−y)log(1−p)L(y,βTx)=−ylog⁡(p)−(1−y)log⁡(1−p) L(y,\beta^Tx)=-y\log(p)-(1-y)\log(1-p) ここで、、ここでロジスティック関数は実数を0,1間隔にマッピングします。p=11+exp(−βTx)p=11+exp⁡(−βTx)p=\frac 1 {1+\exp(-\beta^Tx)}βTxβTx\beta^T x 定式化/表記法2、:y∈{−1,+1}y∈{−1,+1}y \in \{-1, +1\} L(y,βTx)=log(1+exp(−y⋅βTx))L(y,βTx)=log⁡(1+exp⁡(−y⋅βTx)) L(y,\beta^Tx)=\log(1+\exp{(-y\cdot \beta^Tx})) 表記法を選択することは、言語を選択するようなものであり、どちらを使用するかには賛否両論があります。これら2つの表記法の長所と短所は何ですか? この質問に答えようとする私の試みは、統計コミュニティが最初の表記を好み、コンピュータサイエンスコミュニティが2番目の表記を好むように見えることです。 ロジスティック関数は実数を0.1間隔に変換するため、最初の表記は「確率」という用語で説明できます。βTxβTx\beta^Tx 2番目の表記はより簡潔で、ヒンジ損失または0-1損失と比較するのがより簡単です。 私は正しいですか?他の洞察はありますか?

3
機械学習で、下付き文字の代わりに上付き文字が使用されるのはなぜですか?
私はCourseraを通じてAndrew Ngの機械学習に関するコースを受講しています。方程式では、下付き文字の代わりに上付き文字が使用されます。例えば、以下の式でx(i)x(i)x^{(i)}の代わりに使用されるxixix_i: J(θ0,θ1)=12m∑i=1m(hθ(x(i))−y(i))2J(θ0,θ1)=12m∑i=1m(hθ(x(i))−y(i))2J(\theta_0, \theta_1) = \frac{1}{2m} \sum\limits_{i=1}^{m}{(h_\theta(x^{(i)}) - y^{(i)})^2} どうやら、これは一般的な慣行です。私の質問は、なぜ下付き文字ではなく上付き文字を使用するのですか?上付き文字はすでに累乗に使用されています。かっこが存在するかどうかに注意を払うことで、上付き文字とべき乗のユースケースを明確にすることができるように思えますが、それでも混乱しているようです。


2
規範の文脈でのスーパースクリプト2サブスクリプト2の意味は何ですか?
最適化は初めてです。ノルムの右側に上付き文字2と下付き文字2がある方程式を見続けています。たとえば、ここに最小二乗方程式があります 分| | Ax−b | |22||Aバツ−b||22 ||Ax-b||^2_2 上付き文字2を理解していると思います:それは標準の値を二乗することを意味します。しかし、下付き文字2とは何ですか?これらの方程式はどのように読むべきですか?

4
統計では、がまたは自然対数
私は統計を勉強していて、logそれを含む式に出くわすことがよくあり、それを標準の意味log、つまり10進数として解釈する必要がある場合、または統計で記号log が一般に自然対数であると想定される場合、常に混乱しますln。 特に、私はグッドチューリング周波数推定を例として研究していますが、私の質問はより一般的なものです。


1
Rの混合モデル式でのランダム効果の(1 | id)などのウィルキンソンスタイル表記の起源
次のようなRのモデル式 y ~ x + a*b + c:d は、いわゆるウィルキンソン表記法に基づいています:Wilkinson and Rogers 1973、Symbolic Description of Factorial Models for Variance Analysis。 このホワイトペーパーでは、混合モデル(当時は存在しなかった可能性がある)の表記については説明しませんでした。それでlme4、Rで使用される混合モデルの式とRの関連パッケージはどこでしたか y ~ x + a*b + c:d + (1|school) + (a*b||town) から来る?初めて紹介したのはいつですか?彼らのために「ウィルキンソン記法」などの合意された用語はありますか?具体的には次のような用語を参照しています (model formula | grouping variable) (model formula || grouping variable)

2
どの表記と理由:
これらは単なるイタリック体かイタリック体か、またはこれらの表記の意味に実質的な違いがありますか? この質問で考慮すべき「確率」を意味する他の表記法はありますか?

1
推定量の表記(チルダと帽子)
1.統計の帽子とチルダ記号に関する命名規則はありますか?私が見つかりました。βがための推定記述されたβ(ウィキペディア)しかし、私はまた見つけ〜βがための推定記述されたβ(ヴォルフラムを)。意味に違いはありますか? ウェブ上でちょっとした違いを見つけましたが、Stats Symbolsのリファレンスの意味についてはわかりません。そこでは、「パラメータの推定値」と「変数の推定値」が区別されます。チルドと帽子を使用するケースを説明してくれる人がいますか? β^β^\hat{\beta}ββ\betaβ~β~\tilde{\beta}ββ\beta 2.期待演算子に関して、違いはありますかE [ X ] E { X }にE(X)E(X)E(X)に関して、括弧に関するとおよびますか?中括弧を使用するようにアドバイスを受けました。しかし、その意味についてはわかりません。かっこは、何らかの意味を指すのではなく、読み取り/視覚化にのみ使用していました。それについて何かアドバイスはありますか?E[X]E[X]E[X]E{X}E{X}E\{X\}
15 notation 

2
ロジスティック回帰の行列表記
線形回帰(二乗損失)では、行列を使用して、目的を非常に簡潔に表記します 最小限∥ X - Bを∥ 2最小化する ‖Aバツ−b‖2\text{minimize}~~ \|Ax-b\|^2 ここで、AAAはデータ行列、バツバツxは係数、bbbは応答です。 ロジスティック回帰の目的に同様の行列表記はありますか?私が見たすべての表記法は、すべてのデータポイント(\ sum _ {\ text data} \ text {L} _ \ text {logistic}(y、\ beta ^ Tx)のようなもの)の合計を取り除くことはできません∑d a t aLロジスティック(y、βTx )∑dataLロジスティック(y、βTバツ)\sum_{\text data} \text{L}_\text{logistic}(y,\beta^Tx)。 編集:joceratopsとAdamOの素晴らしい答えに感謝します。彼らの答えは、線形回帰がより簡潔な表記法を持っている別の理由が、正方形と和またはe ^ \ top eをカプセル化するノルムの定義にあることを理解するのに役立ちましたe⊤ee⊤ee^\top e。しかし、ロジスティック損失では、そのような定義はなく、表記法が少し複雑になります。

4
統計的コンテキストを消化するには?
まず、この興味深いサイトのすべてのアクティブなメンバーが統計学者であるとは限りません。それ以外の場合、次のように尋ねられる質問は意味をなしません!もちろんそれらは尊重しますが、概念的な説明よりも少し実用的な説明が必要です。 定義するウィキペディアの例から始めますpoint process。 Sをボレルσ代数B(S)を備えた局所的にコンパクトな2番目の可算ハウスドルフ空間とする。書き込み Sと上のローカル有限カウント対策のセットのためのNの最小σ代数のためのNのすべてのポイント数をレンダリングする...測定可能。NN\mathfrak{N}NN\mathcal{N}NN\mathfrak{N} 私にはこれは意味がありません。エンジニアリングのコンテキストでの説明は、私にとってより理解しやすいものです。 コメント:ほとんどの場合、ウィキペディアの説明は、(少なくとも私にとっては)同様の複雑なテキストのために役に立たないと感じました。私の経験から、統計に関する参考書は2種類のみです。a )非常に単純化されたb)非常に複雑な 両方を読むことは、私にはまったく利益がありません! 質問: この問題の解決策はありますか?または同様の経験? この投稿が有用であると感じた人には、チェックするメリットもあります:異なる観点から関連トピックを議論するクライアントに統計を相談するためのリファレンス。

4
回帰残差分布の仮定
誤差に分布の仮定を置く必要があるのはなぜですか、すなわち yi=Xβ+ϵiyi=Xβ+ϵiy_i = X\beta + \epsilon_{i}と、ϵi∼N(0,σ2)ϵi∼N(0,σ2)\epsilon_{i} \sim \mathcal{N}(0,\sigma^{2})。 書いてみませんか yi=Xβ+ϵiyi=Xβ+ϵiy_i = X\beta + \epsilon_{i}とyi∼N(Xβ^,σ2)yi∼N(Xβ^,σ2)y_i \sim \mathcal{N}(X\hat{\beta},\sigma^{2})、 ここで、いずれの場合にϵi=yi−y^ϵi=yi−y^\epsilon_i = y_i - \hat{y}。 分布に関する仮定は、データではなくエラーに置かれていることを強調していますが、説明はありません。 私はこれら2つの処方の違いを本当に理解していません。私は、データに分布の仮定が置かれている場所をいくつか見ています(ベイジアンのように見えますが、ほとんどそうです)が、ほとんどの場合、仮定はエラーに置かれています。 モデル化するとき、なぜどちらか一方の仮定から始めることを選択するのはなぜですか?

3
統計ソフトウェアの使用から数式の理解への移行?
環境: 私は心理学博士課程の学生です。多くの心理学博士課程の学生と同様に、PCA、分類木、クラスター分析などの手法まで、統計ソフトウェアを使用してさまざまな統計分析を実行する方法を知っています。しかし、分析を行った理由と指標の意味を説明することはできますが、この手法がどのように機能するかを説明することはできないため、それは本当に満足のいくものではありません。 本当の問題は、統計ソフトウェアの習得は簡単ですが、制限されていることです。記事で新しいテクニックを学ぶには、数式の読み方を理解する必要があります。現在、固有値またはK平均を計算できませんでした。方程式は私にとって外国語のようなものです。 質問: 雑誌記事の方程式を理解するのに役立つ包括的なガイドはありますか? 編集: この質問はもっと自明なものだと思った。特定の複雑さを超えると、統計表記は意味が分からなくなる。テクニックを理解するためにRまたはC ++で独自の関数をコーディングしたいが、障壁があるとしましょう。方程式をプログラムに変換できません。そして本当に:私は米国の博士課程の状況を知りませんが、私の(フランス)で、私が従うことができる唯一のコースは16世紀のごく少数の運動です...

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.