タグ付けされた質問 「mathematical-statistics」

形式的な定義と一般的な結果に関係する統計の数学的理論。

4
サンプル平均が与えられたサンプル中央値の期待値
ましょう中央値を表すとletサイズのランダムサンプルの平均を表しである分布から。を計算するにはどうすればよいですか?ˉ X N = 2 のk + 1 N (μ 、σ 2)E (Y | ˉ X = ˉ X)YYYX¯X¯\bar{X}n=2k+1n=2k+1n=2k+1N(μ,σ2)N(μ,σ2)N(\mu,\sigma^2)E(Y|X¯=x¯)E(Y|X¯=x¯)E(Y|\bar{X}=\bar{x}) 直観的には、正規性の仮定のため、と主張するのは理にかなっています。しかし、それを厳密に示すことはできますか?E(Y|X¯=x¯)=x¯E(Y|X¯=x¯)=x¯E(Y|\bar{X}=\bar{x})=\bar{x} 私の最初の考えは、一般に既知の結果である条件付き正規分布を使用してこの問題にアプローチすることでした。問題は、期待値と中央値の分散がわからないため、次統計量を使用してそれらを計算する必要があるということです。しかし、それは非常に複雑で、絶対に必要な場合を除き、私はそこに行きたくありません。 k+1k+1k+1

4
リソース集中コンピューティングにマルチコア、SNOW、またはCUDAパッケージでRを使用するのは誰ですか?
このフォーラムの誰がマルチコア、snowパッケージ、またはCUDAで"> Rを使用しているので、ワークステーションCPUよりも多くの電力を必要とする高度な計算のために、これらのスクリプトを計算するのはどのハードウェアですか?データセンターへのアクセスはどこですか? これらの質問の背景は次のとおりです。現在、私は修士号を書いています。Rとハイパフォーマンスコンピューティングに関する論文であり、実際にRを使用しているユーザーについての強力な知識が必要です。2008年にはRのユーザー数は100万人でしたが、このトピックで見つけられるユーザー統計は多かれ少なかれです。答えます! 心からハインリッヒ

3
ベータ分布とロジスティック回帰モデルの関係は何ですか?
私の質問は次のとおりです。ベータ分布とロジスティック回帰モデルの係数の数学的な関係は何ですか? 例として、ロジスティック(シグモイド)関数は f(x)=11+exp(−x)f(x)=11+exp⁡(−x)f(x) = \frac{1}{1+\exp(-x)} また、ロジスティック回帰モデルで確率をモデル化するために使用されます。ましょAAA二分である(0,1)(0,1)(0,1)採点結果とXXXデザインマトリックス。ロジスティック回帰モデルは次で与えられます P(A=1|X)=f(Xβ).P(A=1|X)=f(Xβ).P(A=1|X) = f(X \beta). 注XXX一定の最初の列有する111(切片)及びββ\beta回帰係数の列ベクトルです。例えば、我々は1(標準正常)回帰を有する場合xxx選択しますβ0=1β0=1\beta_0=1(切片)およびβ1=1β1=1\beta_1=1、我々は、得られる「確率分布」をシミュレートすることができます。 このプロットは、ベータ分布を思い出させます(他の選択のプロットと同様ββ\beta)。その密度は g(y;p,q)=Γ(p)Γ(q)Γ(p+q)y(p−1)(1−y)(q−1).g(y;p,q)=Γ(p)Γ(q)Γ(p+q)y(p−1)(1−y)(q−1).g(y;p,q) = \frac{\Gamma(p)\Gamma(q)}{\Gamma(p+q)} y^{(p-1)} (1-y)^{(q-1)}. 最尤法またはモーメント法を使用して、P (A = 1 | X )の分布からpppおよびを推定することができます。したがって、私の質問は次のようになります:βとpとqの選択の関係は何ですか?これは、そもそも上記の2変量の場合を扱います。qqqP(A=1|X)P(A=1|X)P(A=1|X)ββ\betapppqqq

2
ブラウン橋の最高点にコルモゴロフ–スミルノフ分布があるのはなぜですか?
コルモゴロフ–スミルノフ分布は、コルモゴロフ–スミルノフ検定から知られています。しかし、それはブラウン橋の最高点の分布でもあります。 これは(私には)明らかではないので、この偶然の直観的な説明をお願いしたいと思います。参照も歓迎します。


1
帰無仮説の下で交換可能なサンプルの背後にある直感は何ですか?
順列テスト(ランダム化テスト、再ランダム化テスト、または正確なテストとも呼ばれます)は非常に便利で、たとえば、必要な正規分布の仮定がt-test満たされていない場合や、ランク付けによる値の変換時に役立ちますノンパラメトリックテストのようにMann-Whitney-U-test、より多くの情報が失われます。ただし、この種の検定を使用する場合、帰無仮説の下でのサンプルの交換可能性の仮定は1つだけの仮定を見落とすべきではありません。coinRパッケージで実装されているようなサンプルが3つ以上ある場合にも、この種のアプローチを適用できることも注目に値します。 この仮定を説明するために、平易な英語で比fig的な言葉や概念的な直観を使ってください。これは、私のような非統計学者の間で見過ごされているこの問題を明確にするのに非常に役立つでしょう。 注: 置換テストの適用が同じ仮定の下で保持または無効にならない場合に言及することは非常に役立ちます。 更新: 私の地区の地元の診療所から無作為に50人の被験者を収集したとします。彼らは、1:1の比率で薬またはプラセボを無作為に割り当てられました。それらはすべてPar1、V1(ベースライン)、V2(3か月後)、およびV3(1年後)のパラメーター1について測定されました。50個の被験者はすべて、機能Aに基づいて2つのグループにサブグループ化できます。Aポジティブ= 20およびAネガティブ=30。これらは、機能Bに基づいて別の2つのグループにサブグループ化することもできます。Bポジティブ= 15およびBネガティブ=35 。今、私はPar1すべての訪問ですべての被験者からの値を持っています。交換可能性の仮定の下で、次のPar1場合に順列検定を使用するレベルを比較でき ますか?-薬物と被験者をV2でプラセボを投与した被験者と比較する ますか?-機能Aの対象とV2の機能Bの対象を比較しますか? -V2で機能Aを持つ対象とV3で機能Aを持つ対象を比較しますか? -この比較はどのような状況で無効であり、交換可能性の仮定に違反しますか?
15 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

3
Neyman-Pearsonの補題は、単純なヌルと代替が同じ分布ファミリーに属さない場合に適用できますか?
Neyman-Pearson補題は、単純なヌルと単純な代替が同じ分布ファミリーに属さない場合に適用できますか?その証拠から、なぜできないのかわかりません。 たとえば、単純なヌルが正規分布であり、単純な代替が指数分布である場合。 尤度比テストは、両方が異なる分布のファミリーに属している場合、複合代替に対して複合ヌルをテストする良い方法ですか? よろしくお願いします!

1
2つの独立したランダム変数の積
約1000個の値のサンプルがあります。これらのデータは、2つの独立したランダム変数の積から取得されます。最初のランダム変数は、一様分布持っています。2番目の確率変数の分布は不明です。2番目の()確率変数の分布を推定するにはどうすればよいですか?ξ 〜U (0 、1 )ψξ∗ψξ∗ψ\xi \ast \psi ξ∼U(0,1)ξ∼U(0,1)\xi \sim U(0,1)ψψ \psi

1
なぜ分散を安定させるのですか?
Kaggle Essay Evalメソッドを読んでいるときに、分散を安定させる分散に遭遇しました。分散安定化変換を使用して、平均値をとる前にカッパ値を変換してから、元に戻します。分散を安定させる変換に関するwikiを読んだ後でも理解できませんが、なぜ実際に分散を安定させるのですか?これによりどのような利益が得られますか?

3
統計的ランダム性に関するいくつかの質問
ウィキペディアの統計randoness: グローバルなランダム性とローカルなランダム性は異なります。特定のサブシーケンスがランダムに見えなくても、「長期的には」シーケンスは本当にランダムに見えるという考えに基づいているため、ランダム性の哲学的概念の大部分はグローバルです。たとえば、十分な長さの「真の」ランダムシーケンスでは、ゼロ以外の長いシーケンスが存在する可能性がありますが、シーケンス全体はランダムである可能性があります。局所的ランダム性とは、ランダムな分布が近似される最小のシーケンス長が存在する可能性があるという考え方を指します。同じ数字の長いストレッチは、「真の」ランダムプロセスによって生成されたものであっても、サンプルの「ローカルランダム性」を低下させます(10,000桁のシーケンスではローカルランダムである可能性があります。たとえば、すべて)。 パターンを示すシーケンスは、統計的にランダムではないことが証明されています。ラムジー理論の原理によれば、十分に大きいオブジェクトには、必ず特定のサブ構造が含まれている必要があります(「完全な無秩序は不可能」)。 太字の2つの文の意味がよくわかりません。 最初の文は、何かがより短い長さでローカルランダムではなく、より長い長さでシーケンスをローカルランダムにすることを意味しますか? 括弧内の例はどのように機能しますか? 2番目の文は、パターンを示すシーケンスが統計的にランダムでないことを証明できないことを意味しますか?どうして? ありがとう

1
「ターゲットの最尤期待値」とは何ですか?
Mark van der Laanの論文を理解しようとしています。彼は、バークレーの理論統計学者であり、機械学習と大きく重複する問題に取り組んでいます。私にとっての問題の1つは(深い数学に加えて)、完全に異なる用語を使用して使い慣れた機械学習アプローチを説明することが多いことです。彼の主な概念の1つは、「ターゲットを絞った最尤予測」です。 TMLEは、交絡因子が存在する場合でも効果を推定できるように、非制御実験からの打ち切り観測データを分析するために使用されます。同じ概念の多くが他のフィールドの他の名前の下に存在することを強く疑いますが、私はまだそれを何かに直接一致させるほど十分に理解していません。 「計算データ分析」とのギャップを埋める試みはこちらです: データサイエンスの時代への突入:対象を絞った学習と、統計と計算データ分析の統合 そして、統計学者の紹介はこちらです: ターゲット最尤ベースの因果推論:パートI 2番目から: この記事では、複数の時点での介入の因果効果の特定のターゲット最尤推定量を開発します。これには、損失ベースのスーパー学習を使用して、G計算式の未知の因子の初期推定値を取得し、その後、各推定因子にターゲットパラメーター固有の最適変動関数(最も好ましいパラメトリックサブモデル)を適用することが含まれます。最尤推定で変動パラメーターを推定し、初期因子のこの更新ステップを収束まで繰り返します。この反復ターゲット最尤更新ステップにより、結果の推定結果の因果効果は、初期推定量が一貫していれば一貫しているという意味で二重ロバストになり、または、最適な変動関数の推定量は一貫しています。介入する因果グラフのノードの条件付き分布が正しく指定されている場合、最適な変動関数が正しく指定されます。 彼の用語では、「スーパー学習」とは、理論的に健全な非負の重み付けスキームを使用したアンサンブル学習です。しかし、「各推定因子にターゲットパラメーター固有の最適変動関数(最も好ましくないパラメトリックサブモデル)を適用する」とはどういう意味ですか。 または、3つの明確な質問に分けて、TMLEには機械学習の類似点がありますか、「最も好ましいパラメトリックサブモデル」とは何か、他の分野の「変動関数」とは何ですか。

2
Wolfram Mathworldは、確率密度関数で離散確率分布を記述する間違いを犯しますか?
通常、離散変数にわたる確率分布は、確率質量関数(PMF)を使用して記述されます。 連続確率変数を使用する場合、確率質量関数ではなく確率密度関数(PDF)を使用して確率分布を記述します。 - ディープラーニンググッドフェロー、Bengio、およびCourvilleによって しかし、Wolfram MathworldはPDFを使用して、離散変数の確率分布を記述しています。 これは間違いですか?またはそれは大した問題ではありませんか?

2
サンプルの分布に依存しない統計量の例?
これは、ウィキペディアの統計の定義です より正式には、統計理論は統計をサンプルの関数として定義します。関数自体はサンプルの分布に依存しません。つまり、データを実現する前に関数を指定できます。統計という用語は、特定のサンプルの関数と関数の値の両方に使用されます。 私はこの定義の大部分を理解していると思いますが、一部- 関数がサンプルの分布とは無関係である場合、私は整理できませんでした。 これまでの統計の理解 試料は分布Fと独立した、同一(IID)分散ランダム変数(20両面フェアダイスのロール10点の実現、6面体フェアダイスの5つのロール100点の実現、いくつかの数の実現の集合であります人口から100人を無作為に抽出します)。 ドメインがそのセットであり、範囲が実数である関数(または、ベクトルや他の数学オブジェクトのような他のものを生成できる可能性がある...)は、統計と見なされます。 例について考えると、平均、中央値、分散はすべてこの文脈で意味をなします。これらは、一連の実現(ランダムサンプルからの血圧測定)の関数です。私はまた、線形回帰モデルは、統計考えることができるかを確認することができyi=α+β⋅xiyi=α+β⋅x私y_{i} = \alpha + \beta \cdot x_{i} -実現のセットでこの機能だけではなく、ありますか? 混乱しているところ 上からの私の理解が正しいと仮定すると、関数がサンプルの分布に依存しない場所を理解できませんでした。私はそれを理解するための例を考えようとしてきましたが、運はありません。どんな洞察も大歓迎です!


3
もし IIDであり、その後、計算、ここで、
質問 場合 IID、次いで計算され、ここで、。X 1、⋯ 、X N〜N(μ 、1 )X1,⋯,Xn∼N(μ,1)X_1,\cdots,X_n \sim \mathcal{N}(\mu, 1)E (X 1 | T )E(X1∣T)\mathbb{E}\left( X_1 \mid T \right) T = Σ I X IT=∑iXiT = \sum_i X_i 試行:以下が正しいかどうかを確認してください。 たとえば、 これは、X_1、\ ldots、X_nがIIDである、各ことを意味します。Σ I E(X I |T) =E(Σ I X I |T) =T。∑iE(Xi∣T)=E(∑iXi∣T)=T.\begin{align} \sum_i \mathbb{E}\left( X_i \mid T \right) = …

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.