タグ付けされた質問 「random-variable」

確率変数または確率変数は、偶然の変動(すなわち、数学的な意味でのランダム性)の影響を受ける値です。

1
対数正規確率変数の相関
とX 2の正規確率変数に相関係数ρが与えられている場合、次の対数正規乱数変数Y 1とY 2の間の相関関係を見つけるにはどうすればよいですか?X1X1X_1X2X2X_2ρρ\rhoY1Y1Y_1Y2Y2Y_2 Y1=a1exp(μ1T+T−−√X1)Y1=a1exp⁡(μ1T+TX1)Y_1 = a_1 \exp(\mu_1 T + \sqrt{T}X_1) Y2=a2exp(μ2T+T−−√X2)Y2=a2exp⁡(μ2T+TX2)Y_2 = a_2 \exp(\mu_2 T + \sqrt{T}X_2) さて、あればおよびX 2 = σ 1 Z 2、Z 1およびZ 2は、線形変換特性から、標準の法線は、我々が得ます:X1=σ1Z1X1=σ1Z1X_1 = \sigma_1 Z_1X2=σ1Z2X2=σ1Z2X_2 = \sigma_1 Z_2Z1Z1Z_1Z2Z2Z_2 Y1=a1exp(μ1T+T−−√σ1Z1)Y1=a1exp⁡(μ1T+Tσ1Z1)Y_1 = a_1 \exp(\mu_1 T + \sqrt{T}\sigma_1 Z_1) Y2=a2exp(μ2T+T−−√σ2(ρZ1+1−ρ2−−−−−√Z2)Y2=a2exp⁡(μ2T+Tσ2(ρZ1+1−ρ2Z2)Y_2 = a_2 \exp(\mu_2 T + \sqrt{T}\sigma_2 (\rho Z_1 …


1
帰無仮説の下で交換可能なサンプルの背後にある直感は何ですか?
順列テスト(ランダム化テスト、再ランダム化テスト、または正確なテストとも呼ばれます)は非常に便利で、たとえば、必要な正規分布の仮定がt-test満たされていない場合や、ランク付けによる値の変換時に役立ちますノンパラメトリックテストのようにMann-Whitney-U-test、より多くの情報が失われます。ただし、この種の検定を使用する場合、帰無仮説の下でのサンプルの交換可能性の仮定は1つだけの仮定を見落とすべきではありません。coinRパッケージで実装されているようなサンプルが3つ以上ある場合にも、この種のアプローチを適用できることも注目に値します。 この仮定を説明するために、平易な英語で比fig的な言葉や概念的な直観を使ってください。これは、私のような非統計学者の間で見過ごされているこの問題を明確にするのに非常に役立つでしょう。 注: 置換テストの適用が同じ仮定の下で保持または無効にならない場合に言及することは非常に役立ちます。 更新: 私の地区の地元の診療所から無作為に50人の被験者を収集したとします。彼らは、1:1の比率で薬またはプラセボを無作為に割り当てられました。それらはすべてPar1、V1(ベースライン)、V2(3か月後)、およびV3(1年後)のパラメーター1について測定されました。50個の被験者はすべて、機能Aに基づいて2つのグループにサブグループ化できます。Aポジティブ= 20およびAネガティブ=30。これらは、機能Bに基づいて別の2つのグループにサブグループ化することもできます。Bポジティブ= 15およびBネガティブ=35 。今、私はPar1すべての訪問ですべての被験者からの値を持っています。交換可能性の仮定の下で、次のPar1場合に順列検定を使用するレベルを比較でき ますか?-薬物と被験者をV2でプラセボを投与した被験者と比較する ますか?-機能Aの対象とV2の機能Bの対象を比較しますか? -V2で機能Aを持つ対象とV3で機能Aを持つ対象を比較しますか? -この比較はどのような状況で無効であり、交換可能性の仮定に違反しますか?
15 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 



4
ランダムカテゴリカルデータを生成する方法は?
A、B、C、およびDの値を取ることができるカテゴリ変数があるとします。どのようにして10000個のランダムなデータポイントを生成し、それぞれの頻度を制御できますか?例えば: A = 10%B = 20%C = 65%D = 5% どうすればこれを行うことができますか?

1
キャレットglmnetとcv.glmnet
glmnetwithin caretを使用して最適なラムダを検索cv.glmnetし、同じタスクを実行するために使用することの比較には、多くの混乱があるようです。 次のような多くの質問が提起されました。 分類モデルtrain.glmnet対cv.glmnet? キャレットでglmnetを使用する適切な方法は何ですか? 「キャレット」を使用して「glmnet」を相互検証する しかし、答えはありません。これは、質問の再現性による可能性があります。最初の質問に続いて、非常に似た例を挙げますが、同じ質問があります:推定されるラムダはなぜそんなに違うのですか? library(caret) library(glmnet) set.seed(849) training <- twoClassSim(50, linearVars = 2) set.seed(849) testing <- twoClassSim(500, linearVars = 2) trainX <- training[, -ncol(training)] testX <- testing[, -ncol(testing)] trainY <- training$Class # Using glmnet to directly perform CV set.seed(849) cvob1=cv.glmnet(x=as.matrix(trainX),y=trainY,family="binomial",alpha=1, type.measure="auc", nfolds = 3,lambda = seq(0.001,0.1,by = …

3
なぜが、?
このAP中央ページで、ランダム変数と代数変数の著者であるPeter Flanagan-Hydeは、代数変数とランダム変数の区別を描いています。 部分的に彼は言います x+x=2xx+x=2xx + x = 2x、ただし X+X≠2XX+X≠2XX + X \neq 2X -実際、それは記事のサブタイトルです。 代数変数とランダム変数の基本的な違いは何ですか?


1
合計の中央値または平均が加数の合計よりも大きい場合はどういう意味ですか?
ネットワーク遅延の分布を分析しています。アップロード時間の中央値(U)は0.5秒です。ダウンロード(D)時間の中央値は2秒です。ただし、合計時間の中央値(各データポイントのT = U + D)は4秒です。 合計の中央値が加数の中央値の合計よりもはるかに大きいことを知って、どのような結論を導き出すことができますか? 統計に対する好奇心から、この質問が中央値を平均に置き換えたらどうなるでしょうか?

1
パラメーターと潜在変数
私はこれについて以前に尋ねましたが、何がモデルパラメータを作り、何が潜在変数を作るのかを特定することに本当に苦労してきました。このサイトのこのトピックに関するさまざまなスレッドを見ると、主な違いは次のように思われます。 潜在変数は観察されませんが、変数であり、パラメータも観察されず、それらに関連する分布がないため、関連する確率分布があります。これらは定数であり、固定しようとしている未知の値を持っていると理解しています見つける。また、パラメーターに関連付けられた真の値が1つだけであるか、少なくともそれが想定されている場合でも、これらのパラメーターに関する不確実性を表すためにパラメーターに事前分布を置くことができます。私はこれまでのところ正しいと思いますか? 今、私はジャーナル論文からベイジアン加重線形回帰のこの例を見ており、パラメーターと変数とは何かを理解するのに本当に苦労しています: y私= βTバツ私+ ϵy私y私=βTバツ私+ϵy私 y_i = \beta^T x_i + \epsilon_{y_i} ここでは、とyが観察されますが、yのみが変数として扱われます。つまり、それに関連付けられた分布があります。バツバツxyyyyyy 現在、モデリングの前提は次のとおりです。 y〜N(βTバツ私、σ2/ w私)y〜N(βTバツ私、σ2/w私) y \sim N(\beta^Tx_i, \sigma^2/w_i) したがって、の分散は重み付けされます。yyy また、およびwには事前分布があり、それぞれ正規分布とガンマ分布です。 ββ\betawww したがって、完全な対数尤度は次のように与えられます。 ログp (y、w 、β| X)=ΣログP(y私| w、β、x私)+ ログP(β)+ Σ ログP(w私)ログ⁡p(y、w、β|バツ)=Σログ⁡P(y私|w、β、バツ私)+ログ⁡P(β)+Σログ⁡P(w私) \log p(y, w, \beta |x) = \Sigma \log P(y_i|w, \beta, x_i) + \log P(\beta) + \Sigma \log P(w_i) …


4
2つのランダム変数のうち小さい方の不偏推定量
仮定X∼N(μx,σ2x)X∼N(μx,σx2)X \sim \mathcal{N}(\mu_x, \sigma^2_x)とY∼N(μy,σ2y)Y∼N(μy,σy2)Y \sim \mathcal{N}(\mu_y, \sigma^2_y) z=min(μx,μy)z=min(μx,μy)z = \min(\mu_x, \mu_y)zzz 単純な推定量とサンプル手段である及び(一貫性のあるが)、例えば、付勢されています。をアンダーシュートする傾向があります。min(x¯,y¯)min(x¯,y¯)\min(\bar{x}, \bar{y})x¯x¯\bar{x}y¯y¯\bar{y}XXXYYYzzz 不偏推定量を考えることはできません。存在しますか?zzz 助けてくれてありがとう。

1
LARSと投げ縄の座標降下
L1正規化線形回帰のあてはめにLARS [1]を使用する場合と座標降下を使用する場合の長所と短所は何ですか? 私は主にパフォーマンスの側面に興味があります(私の問題はN数十万とp20未満にある傾向があります)。しかし、他の洞察も歓迎されます。 編集:私は質問を投稿したので、chlは親切にフリードマンらによる論文[2]を指摘しました。そこでは、座標降下は他の方法よりもかなり速いことが示されています。その場合、実務家として座標降下を支持するLARSを単に忘れるべきですか? [1]エフロン、ブラッドリー。ヘイスティー、トレバー; ジョンストーン、イアンおよびティブシラーニ、ロバート(2004)。「最小角度回帰」。統計32(2):pp。407–499。 [2] Jerome H. Friedman、Trevor Hastie、Rob Tibshirani、「座標降下による一般化線形モデルの正規化パス」、Journal of Statistics Software、Vol。33、1号、2010年2月。

2
指数確率変数の条件付き期待
ランダム変数(E [ X ] = 1X∼Exp(λ)X∼Exp(λ)X\sim \text{Exp}(\lambda))E[X| X>x]はx+E[X]と等しくなければなりません。これは、メモリーレスプロパティによってX| X>Xは、のと同様であるXが、右にシフトし、X。E[X]=1λE[X]=1λ\mathbb{E}[X] = \frac{1}{\lambda}E[X|X> x ]E[X|バツ>バツ]\mathbb{E}[X|X > x]x + E [ X]バツ+E[バツ]x + \mathbb{E}[X]バツ| バツ> xバツ|バツ>バツX|X > xバツバツXバツバツx ただし、具体的な証拠を提供するためにメモリレスプロパティを使用するのに苦労しています。どんな助けも大歓迎です。 ありがとう。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.