タグ付けされた質問 「variance」

確率変数の平均からの予想される二乗偏差。または、それらの平均についてのデータの平均二乗偏差。

2
バートレットのテストによって診断された球形度は、PCAが不適切であることを意味するのはなぜですか?
バートレットの検定は、サンプルが等分散の母集団からのものであるかどうかを判断することに関することを理解しています。 サンプルが等分散の母集団からのものである場合、検定の帰無仮説を棄却できないため、主成分分析は不適切です。 この状況(ホモスケダスティクスデータセットを持つ)の問題がどこにあるのかわかりません。すべてのデータの基礎となる分布が同じであるデータセットを持つことの問題は何ですか?この条件が存在する場合、私は大したことはありません。これによりPCAが不適切になるのはなぜですか? 私はオンラインのどこにも良い情報を見つけることができないようです。このテストがPCAに関連する理由を解釈した経験はありますか?

3
画像が空間的に接続された別々の領域で構成されているかどうかの統計的尺度
次の2つのグレースケール画像を検討してください。 最初の画像は、蛇行する川のパターンを示しています。2番目の画像はランダムノイズを示しています。 画像が川のパターンを示している可能性があるかどうかを判断するために使用できる統計的尺度を探しています。 川の画像には2つの領域があります:川=高い値とそれ以外の場所=低い値。 その結果、ヒストグラムはバイモーダルになります。 そのため、川のパターンのある画像には高い分散が必要です。 ただし、上記のランダム画像も同様です。 River_var = 0.0269, Random_var = 0.0310 一方、ランダム画像の空間的連続性は低いのに対し、河川画像の空間的連続性は高く、実験バリオグラムに明確に示されています。 分散が1つの数値のヒストグラムを「要約」するのと同じように、実験バリオグラムを「要約」する空間的連続性の尺度を探しています。 この方法では、大きなラグよりも小さなラグで大きな半分散を「罰する」ようにしたいので、次のように思いつきました。 s v a r = ∑nh = 1γ(h )/ h2 svar=∑h=1nγ(h)/h2\ svar = \sum_{h=1}^n \gamma(h)/h^2 lag = 1から15までしか加算しない場合、次のようになります。 River_svar = 0.0228, Random_svar = 0.0488 川の画像の分散は大きくなければならないが、空間分散は低くする必要があるため、分散比を導入します。 r a ti o = v a r / …

2
CNNザビエル重みの初期化
一部のチュートリアルで、「Xavier」の重みの初期化(論文:ディープフィードフォワードニューラルネットワークのトレーニングの難しさを理解する)がニューラルネットワークの重みを初期化する効率的な方法であると述べたことがわかりました。 完全に接続されたレイヤーの場合、これらのチュートリアルには経験則がありました。 Var(W)=2nin+nout,simpler alternative:Var(W)=1ninVar(W)=2nin+nout,simpler alternative:Var(W)=1ninVar(W) = \frac{2}{n_{in} + n_{out}}, \quad \text{simpler alternative:} \quad Var(W) = \frac{1}{n_{in}} ここで、は、正規分布で初期化されたレイヤーの重みの分散で、、は、親と現在のレイヤーのニューロンの量です。Var(W)Var(W)Var(W)ninninn_{in}noutnoutn_{out} 畳み込み層にも同様の経験則がありますか? 畳み込み層の重みを初期化するのに最適な方法を見つけるのに苦労しています。たとえば、重みの形状がであり(5, 5, 3, 8)、カーネルサイズがであるレイヤーでは5x5、3つの入力チャネル(RGB入力)をフィルタリングし、8特徴マップを作成します... 3入力ニューロンの量と見なされますか?またはむしろ75 = 5*5*3、入力は5x5各カラーチャネルのパッチなので、 問題を明確にする具体的な回答か、重みの適切な初期化を見つけ、できればソースをリンクする一般的なプロセスを説明する、より一般的な回答の両方を受け入れます。

2
ロジスティック回帰の過剰分散
私はロジスティック回帰における過剰分散の概念を理解しようとしています。過剰分散とは、応答変数の観測された分散が二項分布から予想されるよりも大きい場合のことです。 しかし、二項変数が2つの値(1/0)しか持てない場合、どのようにして平均と分散を持つことができますか? x回のベルヌーイ試行から成功の平均と分散を計算することに問題はありません。しかし、2つの値しか持てない変数の平均と分散の概念に頭を抱えることはできません。 誰でも直感的な概要を提供できますか? 2つの値しか持てない変数の平均と分散の概念 2つの値しか持てない変数での過剰分散の概念

2
二項分布の分散がわかりません
私はそのような基本的な質問をすることさえ本当に馬鹿だと感じますが、ここに行きます: 私は、ランダムな変数がある場合は値取ることができますとして、と私が描くならば、それからサンプルを、私が買ってあげます二項分布。XXX000111P(X=1)=pP(X=1)=pP(X=1) = pP(X=0)=1−pP(X=0)=1−pP(X=0) = 1-pnnn 分布の平均は μ=np=E(X)μ=np=E(X)\mu = np = E(X) 分布の分散は σ2=np(1−p)σ2=np(1−p)\sigma^2 = np(1-p) ここから私のトラブルが始まります: 分散はで定義されます。2つの可能な結果の2乗は何も変化しないため(および)、これはを意味するため、σ2=E(X2)−E(X)2σ2=E(X2)−E(X)2\sigma^2 = E(X^2) - E(X)^2XXX02=002=00^2 = 012=112=11^2 = 1E(X2)=E(X)E(X2)=E(X)E(X^2) = E(X) σ2=E(X2)−E(X)2=E(X)−E(X)2=np−n2p2=np(1−np)≠np(1−p)σ2=E(X2)−E(X)2=E(X)−E(X)2=np−n2p2=np(1−np)≠np(1−p)\sigma^2 = E(X^2) - E(X)^2 = E(X) - E(X)^2 = np - n^2p^2 = np(1-np) \neq np(1-p) 余分なはどこに行くのですか?おそらく私は統計があまり得意ではないので、複雑な用語は使用しないでください。nnn

1
バイアス分散分解
Bishopのパターン認識と機械学習のセクション3.2で、彼はバイアス分散分解について説明し、損失関数の2乗について、期待損失を2乗バイアス項に分解できることを述べています(これは、平均予測が真からどれだけ離れているかを説明しています)モデル)、分散項(平均の周りの予測の広がりを表す)、およびノイズ項(データの固有のノイズを与える)。 バイアス分散分解は、2乗損失以外の損失関数で実行できますか? 特定のモデルデータセットについて、予想損失がすべてのモデルで最小となるモデルが複数ありますか?その場合、同じ最小予想損失をもたらすバイアスと分散の異なる組み合わせが存在する可能性があるということですか? モデルに正則化が含まれる場合、バイアス、分散、正則化係数間に数学的な関係がありますか?λλ\lambda 真のモデルがわからない場合、どのようにバイアスを計算できますか? 予想される損失(バイアスと分散の2乗の合計)よりも、バイアスまたは分散を最小化する方が理にかなっている状況はありますか?

1
長期分散とは何ですか?
時系列分析の分野での長期分散はどのように定義されますか? データに相関構造がある場合に利用されることを理解しています。したがって、確率過程はX1,X2…X1,X2…X_1, X_2 \dots iidのランダム変数のファミリーではなく、同じようにのみ分布していますか? 概念の概観とその推定に伴う困難について、標準的な参考資料を入手できますか?

3
「天井効果」が発生していると結論付けるには、どのような基準を満たす必要がありますか?
社会科学研究方法のSAGE百科事典によると… [a]メジャーに潜在的な応答の明確な上限があり、この制限で、またはその近くで参加者の集中度が高い場合、天井効果が発生します。スケール減衰は、この方法で分散が制限されるたびに発生する方法論的な問題です。…たとえば、天井効果は、高いスコアが好ましい態度を示し、最高の反応が可能な限り最も肯定的な評価を得ることができない態度の尺度で発生する場合があります。…天井効果の問題に対する最適なソリューションはパイロットテストであり、これにより問題を早期に特定することができます。天井効果が見つかった場合[および]結果の尺度がタスクのパフォーマンスである場合、潜在的な応答の範囲を拡大するためにタスクをより困難にすることができます。1 [強調を追加] あるように思わたくさんのアドバイスや質問(ここおよび上記の引用で説明したものと同様の天井効果を示すデータを分析することを扱います)。 私の質問は単純なものでも素朴なものでもかまいませんが、データに天井効果が存在することを実際にどのように検出しますか?具体的には、心理測定テストが作成され、天井効果(視覚検査のみ)につながる疑いがある場合、テストを修正してより広い範囲の値を生成するとします。改訂されたテストにより、生成されたデータから天井効果が除去されたことをどのように示すことができますか?データセット内の天井効果があることを示しているテストがありますが、データセットの中にいない天井効果bが? 私の素朴なアプローチは、分布のゆがみを調べることです。もしそれがゆがんでいなければ、天井効果はないと結論付けます。それは過度に単純化されていますか? 編集 より具体的な例を追加するために、年齢とともに増加するが最終的には横ばいになり、高齢になると減少し始める潜在的な特性xを測定する機器を開発するとします。範囲が1〜14の最初のバージョンを作成し、パイロット操作を行って、天井効果(最大値である14付近で多数の応答が発生する可能性があることを発見しました。しかし、なぜですか?その主張をサポートする厳密な方法はありますか? 次に、1〜20の範囲になるようにメジャーを修正し、より多くのデータを収集します。この傾向は私の予想とより密接に一致していることがわかりますが、測定範囲が十分に大きいことをどのようにして知ることができますか。再度修正する必要がありますか?視覚的には問題ないようですが、疑念を確認するためにテストする方法はありますか? 単に見ているだけでなく、データ内でこの天井効果を検出する方法を知りたいです。グラフは理論的なものではなく、実際のデータを表しています。機器の範囲を拡大すると、データの広がりが改善されましたが、それで十分ですか?どうすればテストできますか? 1 Hessling、R.、Traxel、N.、&Schmidt、T.(2004)。天井効果。Michael S. Lewis-Beck、A。Bryman、およびTim Futing Liao(編)、The SAGE Encyclopedia of Social Science Research Methodsで。(p。107)。カリフォルニア州サウザンドオークス:Sage Publications、Inc. doi:10.4135 / 9781412950589.n102

3
Rを使用して重回帰の各予測子によって説明される分散を計算します
モデル全体が重要であり、分散の約13%を説明する重回帰を実行しました。ただし、重要な各予測子によって説明される分散の量を見つける必要があります。Rを使用してこれを行うにはどうすればよいですか? サンプルデータとコードは次のとおりです。 D = data.frame( dv = c( 0.75, 1.00, 1.00, 0.75, 0.50, 0.75, 1.00, 1.00, 0.75, 0.50 ), iv1 = c( 0.75, 1.00, 1.00, 0.75, 0.75, 1.00, 0.50, 0.50, 0.75, 0.25 ), iv2 = c( 0.882, 0.867, 0.900, 0.333, 0.875, 0.500, 0.882, 0.875, 0.778, 0.867 ), iv3 = c( …
13 r  regression  variance 


1
期待値とトレース関数の分散
ランダム変数の、および半正定値行列A:期待値の簡略化式があり、E [ T R (X T A X )]と分散、V R [ T R (X T A X )]?Aは確率変数ではないことに注意してください。バツ∈ Rhバツ∈RhX \in \mathbb{R}^hAAAE[ Tr (XTA X)]E⁡[Tr(バツTAバツ)]\mathop {\mathbb E}[Tr(X^TAX)]Va r [ Tr (XTA X)]Var[Tr(バツTAバツ)]Var[Tr(X^TAX)]AAA

2
サンプルの最大値の分散とは何ですか?
一連のランダム変数の最大値の分散の境界を探しています。言い換えれば、 ここでX = \ {X_1、\ ldots、X_M \}は固定であるような 閉じた形式の式を探しています。有限平均\ mu_1、\ ldots、\ mu_Mおよび分散\ sigma_1 ^ 2、\ ldots、\ sigma_M ^ 2のM個の確率変数のセット。BBBVar(maxiXi)≤B,Var(maxiXi)≤B, \mbox{Var}(\max_i X_i) \leq B \enspace, X={X1,…,XM}X={X1,…,XM}X = \{ X_1, \ldots, X_M \}MMMμ1,…,μMμ1,…,μM\mu_1, \ldots, \mu_Mσ21,…,σ2Mσ12,…,σM2\sigma_1^2, \ldots, \sigma_M^2 私はと推論できる Var(maxiXi)≤∑iσ2i,Var(maxiXi)≤∑iσi2, \mbox{Var}(\max_i X_i) \leq \sum_i \sigma_i^2 \enspace, これバウンドが非常に緩いようだが。数値テストでは、B=maxiσ2iB=maxiσi2B = \max_i \sigma_i^2が可能性があることを示しているようですが、これを証明できませんでした。どんな助けも大歓迎です。

4
分散の実際の応用は何ですか?
私は自分自身に確率論を教えていますが、標準偏差とは対照的に、分散の使用を理解しているかどうかはわかりません。私が見ている実際の状況では、分散は範囲よりも大きいため、直感的には有用ではないようです。
13 variance 

3
無限分散の正規分布の値がその平均よりも大きい確率はどのくらいですか?
今日のインタビューでこれに似たものを尋ねられました。 インタビュアーは、ボラティリティが無限になりやすい場合に、アットザマネーオプションがインザマネーになる可能性を知りたいと考えました。 ブラックショールズモデルとランダムウォーク仮説の基礎となる正規分布には無限の分散があるため、0%と言いました。そして、すべての値の確率はゼロになると考えました。 私のインタビュアーは、正規分布はまだ対称でほぼ均一なので、正しい答えは50%であると言いました。したがって、平均値から+∞まで積分すると、50%になります。 私はまだ彼の推論に納得していない。 誰が正しい?

2
回帰モデルの分散の説明
これは簡単な説明かもしれません(とにかく期待しています)。 回帰ツールボックスを使用して、Matlabで回帰分析を行いました。しかし、私はこれを述べる研究に出くわしました: 「回帰分析を使用すると、分散の60%を説明する4つの音響特性のみを使用して予測モデルを設定することができました。」 必要に応じて、記事へのリンクはこちらです: 記事 私はこれが何を意味するのか100%はわかりませんが、そのシンプルなものを望んでいます。また、60%は良いことですか?私はこれを検索しようとしましたが、「分散」という単語の前には常にパーセンテージがあるため、答えを見つけるのは難しいです。
12 variance 

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.