タグ付けされた質問 「self-study」

クラスまたは自習用に使用される教科書、コース、またはテストからの定期的な練習。このコミュニティのポリシーは、完全な回答ではなく、そのような質問に「役立つヒントを提供する」ことです。

3
ネイマン・ピアソンの補題
Mood、Graybill、Boes の著書「Introduction to the Theory of Statistics」から ネイマン・ピアソンの補題を読みました。しかし、私は補題を理解していません。 誰でも私に補題をわかりやすい言葉で説明してもらえますか?それは何を述べていますか? ネイマン・ピアソンの補題:レッツからのランダムサンプルである、二つの既知の値のいずれかであると、およびlet固定します。X1,…,XnX1,…,XnX_1,\ldots,X_nf(x;θ)f(x;θ)f(x;\theta)θθ\thetaθ0θ0\theta_0θ1θ1\theta_10&lt;α&lt;10&lt;α&lt;10<\alpha<1 ましょう 正の定数とすることのサブセットでれる満たすクリティカル領域C ^ *に対応する テスト\ gamma ^ *は、サイズ\ alphaの\ mathscr H_0:\ theta = \ theta_0対\ mathscr H_1:\ theta = \ theta_1の最も強力なテストです。k∗k∗k^*λ = L (θ 0、X 1、··· 、XのN)C∗C∗C^*XX\mathscr XPθ0[(X1,…,Xn)∈C∗]=α(1)(1)Pθ0[(X1,…,Xn)∈C∗]=α \tag 1 P_{\theta_0}[(X_1,\ldots,X_n)\in C^*] = \alpha λ = L (θ0; バツ1、… 、xn)L …

4
分布がマルチモーダルかどうかをテストするにはどうすればよいですか?
データのヒストグラムをプロットすると、2つのピークがあります。 それは潜在的なマルチモーダル分布を意味しますか?dip.testR(library(diptest))を実行しましたが、出力は次のとおりです。 D = 0.0275, p-value = 0.7913 私のデータにはマルチモーダル分布があると結論付けることができますか? データ 10346 13698 13894 19854 28066 26620 27066 16658 9221 13578 11483 10390 11126 13487 15851 16116 24102 30892 25081 14067 10433 15591 8639 10345 10639 15796 14507 21289 25444 26149 23612 19671 12447 13535 10667 11255 8442 11546 15958 21058 …

1
隠れマルコフモデルと粒子フィルター(およびカルマンフィルター)の違い
ここに私の古い質問があります 隠れマルコフモデル(HMM)とパーティクルフィルター(PF)の違い(違いがある場合)を誰かが知っているかどうか、そして結果としてカルマンフィルター、またはどの状況でどのアルゴリズムを使用するかを尋ねたいと思います。私は学生で、プロジェクトをしなければなりませんが、最初にいくつかのことを理解する必要があります。 そのため、参考文献によれば、両方とも状態空間モデルであり、隠された(または潜在的または観察されていない)状態を含みます。ウィキペディア(Hidden_​​Markov_model)によると、「HMMでは、隠れ変数の状態空間は離散的ですが、観測自体は離散的(通常はカテゴリ分布から生成)または連続的(通常はガウス分布から)のいずれかです。隠れマルコフモデルは、連続状態空間を可能にするために一般化することもできます。そのようなモデルの例は、隠れ変数に対するマルコフ過程が線形動的システムであり、関連する変数間に線形関係があり、すべての隠れ変数と観測変数がガウス分布に従うモデルです。前述の線形動的システムなどの単純な場合、正確な推論は扱いやすい(この場合は、カルマンフィルターを使用)。ただし、一般に、連続的な潜在変数を持つHMMでの正確な推論は実行不可能であり、近似方法を使用する必要があります。」 しかし、私にとってこれは少しわかりにくいです...簡単な言葉で言えば、これは次のことを意味します(私が行ったより多くの研究にも基づいています): HMMでは、状態空間は離散または連続のいずれかです。また、観測自体は離散または連続のいずれかです。また、HMMは線形およびガウスまたは非ガウスの動的システムです。 PFでは、状態空間は離散または連続のいずれかです。また、観測自体は離散または連続のいずれかです。しかし、PFは非線形(および非ガウス?)動的システムです(その違いは違いますか?)。 カルマンフィルター(HMMと同じように見えます)は、線形およびガウスの動的システムがある場合に使用されます。 また、どのアルゴリズムを選択するかを知るには、これらはすべて同じように見えるので...また、PFは線形データ(たとえば、センサーKinectからの生データ)を持つことができると言う論文(英語ではない)を見つけました動きを認識する)、動的システムは非線形である場合があります。これは起こりますか?これは正しいです?どうやって? ジェスチャ認識では、研究者はHMMまたはPFのいずれかを使用できますが、各アルゴリズムを選択する理由を説明していません。これらのアルゴリズムを区別し、違いを理解し、最適なアルゴリズムを選択する方法を誰かが知っていますか? 私の質問が大きすぎる場合、または一部の部分が素朴な場合は申し訳ありませんが、説得力のある科学的な答えはどこにも見つかりませんでした。ご清聴ありがとうございました! ここに私の新しい質問があります(@conjugatepriorの助けによると) したがって、さらに読みながら、以前のコメントの一部を更新し、何が起こっているのかをもう少し理解したいと思います。 簡単に言えば、傘は動的ベイジアンネットワークであり、その下にHMMおよび状態空間のモデル(サブクラス)が含まれます(http://mlg.eng.cam.ac.uk/zoubin/papers/ijprai.pdf)。 さらに、2つのモデルの最初の違いは、HMMでは隠れた状態変数が離散的であり、観測値は離散的または連続的であるということです。PFでは、隠れ状態変数は連続的であり(実数値の隠れ状態ベクトル)、観測値はガウス分布を持ちます。 また、@ conjugatepriorによれば、各モデルには次の3つのタスクがあります:フィルタリング、平滑化、予測。フィルタリングでは、モデルHMMは離散隠れ状態変数にフォワードアルゴリズム法を使用し、状態空間は連続変数に使用し、線形動的システムはカルマンフィルターなどを使用します。 ただし、HMMを一般化して、連続状態空間を許可することもできます。 これらのHMMの拡張により、2つのモデルは概念的に同一であるように見えます(隠れマルコフモデルとマルコフ遷移モデルと状態空間モデルで述べられているように...?)。 私はもう少し正確な用語を使用していると思いますが、それでもすべてがぼやけています。誰でもHMMと状態空間モデルの違いは何ですか? 本当に自分のニーズに合った答えが見つからないからです。 もう一度ありがとう!

3
nls()で「初期パラメーター推定での特異勾配行列」エラーが発生するのはなぜですか?
排出削減と車あたりのコストに関するいくつかの基本的なデータがあります。 q24 &lt;- read.table(text = "reductions cost.per.car 50 45 55 55 60 62 65 70 70 80 75 90 80 100 85 200 90 375 95 600 ",header = TRUE, sep = "") これは指数関数であることを知っているので、以下に適合するモデルを見つけることができると期待しています。 model &lt;- nls(cost.per.car ~ a * exp(b * reductions) + c, data = q24, start = …

4
新しいベクターをPCA空間に投影する方法は?
主成分分析(PCA)を実行した後、新しいベクトルをPCA空間に投影します(つまり、PCA座標系で座標を見つけます)。 を使用してR言語でPCAを計算しましたprcomp。これで、ベクトルにPCA回転行列を掛けることができるはずです。このマトリックスの主成分を行または列に配置する必要がありますか?
21 r  pca  r  variance  heteroscedasticity  misspecification  distributions  time-series  data-visualization  modeling  histogram  kolmogorov-smirnov  negative-binomial  likelihood-ratio  econometrics  panel-data  categorical-data  scales  survey  distributions  pdf  histogram  correlation  algorithms  r  gpu  parallel-computing  approximation  mean  median  references  sample-size  normality-assumption  central-limit-theorem  rule-of-thumb  confidence-interval  estimation  mixed-model  psychometrics  random-effects-model  hypothesis-testing  sample-size  dataset  large-data  regression  standard-deviation  variance  approximation  hypothesis-testing  variance  central-limit-theorem  kernel-trick  kernel-smoothing  error  sampling  hypothesis-testing  normality-assumption  philosophical  confidence-interval  modeling  model-selection  experiment-design  hypothesis-testing  statistical-significance  power  asymptotics  information-retrieval  anova  multiple-comparisons  ancova  classification  clustering  factor-analysis  psychometrics  r  sampling  expectation-maximization  markov-process  r  data-visualization  correlation  regression  statistical-significance  degrees-of-freedom  experiment-design  r  regression  curve-fitting  change-point  loess  machine-learning  classification  self-study  monte-carlo  markov-process  references  mathematical-statistics  data-visualization  python  cart  boosting  regression  classification  robust  cart  survey  binomial  psychometrics  likert  psychology  asymptotics  multinomial 

4
「ランダム変数の合計」の概念を誰でも明確にできますか
私の確率クラスでは、「ランダム変数の合計」という用語が常に使用されています。しかし、私はそれが正確に何を意味しているのでしょうか? ランダム変数からの多くの実現の合計について話していますか?もしそうなら、それは単一の数字になりませんか?ランダム変数実現の合計はどのようにして分布、またはあらゆる種類のcdf / pdf /関数につながるのでしょうか?そして、ランダム変数の実現ではない場合、正確に何が追加されていますか?

2
指数ファミリーの利点:なぜそれを研究して使用する必要があるのですか?
だからここで推論を勉強しています。誰かが指数関数ファミリーの利点を列挙できるようにしたいと思います。指数族とは、f (x | θ )= h (x )exp { η (θ )T (x )− B (θ )}として与えられる分布を意味します 。f(x | θ )= h (x )exp{ η(θ )T(x )− B (θ )}f(x|θ)=h(x)exp⁡{η(θ)T(x)−B(θ)}\begin{align*} f(x|\theta) = h(x)\exp\left\{\eta(\theta)T(x) - B(\theta)\right\} \end{align*} そのサポートはパラメータθθ\theta依存しません。私が見つけたいくつかの利点は次のとおりです。 (a)多種多様なディストリビューションが組み込まれています。 (b)ネイマン・フィッシャーの定理に従って、自然な十分な統計T(x )T(x)T(x)提供します。 (c)T(x )T(x)T(x)モーメント生成関数の素晴らしい式を提供することができます。 (d)応答と予測子の関係を、応答の条件付き分布から(リンク関数を介して)簡単に分離できます。 誰でも他の利点を提供できますか?

2
因子/変数をどのように「制御」しますか?
私の理解では、「コントロール」には統計上で2つの意味があります。 対照群:実験では、対照群のメンバーに治療は施されていません。例:プラセボと薬物:あるグループに薬物を投与し、他のグループ(対照)には投与しません。これは「制御実験」とも呼ばれます。 変数の制御:特定の独立変数の効果を分離する手法。この技術に与えられた他の名前のいくつかは、「会計」、「保持定数」、「制御」、いくつかの変数です。例:サッカー視聴調査(好きか嫌いか)では、性別がバイアスを引き起こすと考えられるため、性別の影響を取り除くことができます。つまり、男性は女性よりもそれを好む可能性があります。 したがって、私の質問はポイント(2)に対するものです。2つの質問: 一般的に、どのようにして変数を「制御」/「アカウント」しますか。どのようなテクニックが使用されていますか?(回帰の観点から、ANOVAフレームワーク)。 上記の例では、男性と女性をランダムに選択することがコントロールを構成していますか?つまり、「ランダム」は他の効果を制御するためのテクニックの1つですか?

2
と仮定し。表示
次の文が正しいことを確認する最も簡単な方法は何ですか? と仮定し。表示。Y1,…,Yn∼iidExp(1)Y1,…,Yn∼iidExp(1)Y_1, \dots, Y_n \overset{\text{iid}}{\sim} \text{Exp}(1)∑ni=1(Yi−Y(1))∼Gamma(n−1,1)∑i=1n(Yi−Y(1))∼Gamma(n−1,1)\sum_{i=1}^{n}(Y_i - Y_{(1)}) \sim \text{Gamma}(n-1, 1) ことに注意してください。Y(1)=min1≤i≤nYiY(1)=min1≤i≤nYiY_{(1)} = \min\limits_{1 \leq i \leq n}Y_i X∼Exp(β)X∼Exp(β)X \sim \text{Exp}(\beta)、この手段そのfX(x)=1βe−x/β⋅1{x&gt;0}fX(x)=1βe−x/β⋅1{x&gt;0}f_{X}(x) = \dfrac{1}{\beta}e^{-x/\beta} \cdot \mathbf{1}_{\{x > 0\}}。 Y _ {(1)} \ sim \ text {Exponential}(1 / n)であることが簡単にわかりますY(1)∼Exponential(1/n)Y(1)∼Exponential(1/n)Y_{(1)} \sim \text{Exponential}(1/n)。さらに、パラメータ化f_ {Y}(y)= \ dfrac {の下に \ sum_ {i = 1} ^ {n} …

1
二次モーメント法、ブラウン運動?
してみましょう標準ブラウン運動すること。LET示すイベントがおよびします。1はインジケーター関数を示します。\ mathbb {P} \ {K_n \ ge \ rho2 ^ {n} \} \ ge \ rho for all nのような\ rho&gt; 0が存在しますか?答えはイエスだと思う。二次モーメント法をいじってみましたが、あまり役に立ちません。これは、セカンドモーメント法で表示できますか?または、私は何か他のものを試してみるべきですか?E j 、n { B t = 0 いくつかの j − 1BtBtB_tEj,nEj,nE_{j, n}K、N=22NΣJ=2N+11のEjを、nは、1ρ&gt;0P{KN≥ρ2N}≥ρnは{Bt=0 for some j−12n≤t≤j2n},{Bt=0 for some j−12n≤t≤j2n},\left\{B_t = 0 \text{ for some }{{j-1}\over{2^n}} \le t \le {j\over{2^n}}\right\},Kn=∑j=2n+122n1Ej,n,Kn=∑j=2n+122n1Ej,n,K_n = …

1
LOOCV式の証明
統計学習の入門ジェームスら。、リーブワンアウトクロスバリデーション(LOOCV)推定値はによって定義されるCV(n)=1n∑i=1nMSEiCV(n)=1n∑i=1nMSEi\text{CV}_{(n)} = \dfrac{1}{n}\sum\limits_{i=1}^{n}\text{MSE}_i ここMSEi=(yi−y^i)2MSEi=(yi−y^i)2\text{MSE}_i = (y_i-\hat{y}_i)^2。 証明がなければ、方程式(5.2)には、最小二乗回帰または多項式回帰(これが1つの変数のみの回帰に当てはまるかどうかは不明)、 "ここで、Yiがされている私は、元の最小二乗から番目のフィット値(適合しないこの手段が、方法によって何全く考え、それが使用を意味し、すべてのデータセット内のポイントを)および?Hiがにより定義されるてこ」でHiは=1CV(n)=1n∑i=1n(yi−y^i1−hi)2CV(n)=1n∑i=1n(yi−y^i1−hi)2\text{CV}_{(n)} = \dfrac{1}{n}\sum\limits_{i=1}^{n}\left(\dfrac{y_i - \hat{y}_i}{1-h_i}\right)^2y^iy^i\hat{y}_iiiihihih_ihi=1n+(xi−x¯)2∑j=1n(xj−x¯)2.hi=1n+(xi−x¯)2∑j=1n(xj−x¯)2.h_i = \dfrac{1}{n}+\dfrac{(x_i - \bar{x})^2}{\sum\limits_{j=1}^{n}(x_j - \bar{x})^2}\text{.} これをどのように証明しますか? 私の試み:一つは、その注目して開始することができ、Y I = β 0 + k個のΣ iは= 1 β K X K + 程度の一部多項式の項 ≥ 2 が、これとは別に(私は思い出す場合、ための、式hはiが唯一であると単純な線形回帰の場合...)、ここから先に進む方法がわかりません。y^i=β0+∑i=1kβkXk+some polynomial terms of degree ≥2y^i=β0+∑i=1kβkXk+some polynomial terms of degree ≥2\hat{y}_i = \beta_0 + …

2
隠れマルコフモデルとマルコフ遷移モデルと状態空間モデル…?
修士論文では、血清学的状態によって定義される異なる状態間の遷移の統計モデルの開発に取り組んでいます。私の質問はより一般的/理論的であるため、今のところ、このコンテキストにあまり多くの詳細を説明しません。とにかく、私の直感では、隠れマルコフモデル(HMM)を使用する必要があります。モデルを作成するために必要な文献やその他の背景研究を経て遭遇する問題は、用語と、さまざまなタイプの隠れたプロセスモデル間の正確な違いに関する混乱です。私はそれらを区別するもの(今後の例)を非常に漠然としか認識していません。さらに、少なくとも私が文献で見たものから、このタイプのモデリングの周りに構築された非常に非標準的な語彙があるように思えます。 だから、私は人々が私のためにこれらの用語のいくつかを明確にするのを手伝ってくれることを望んでいた。いくつか質問がありますが、1つまたは2つの回答が満足のいくものになると、残りは結果として解き明かされると思います。これが長すぎないことを願っています。モデレーターがこれを複数の投稿に分割することを望んでいる場合、私はそうします。いずれにせよ、質問を太字で示し、続いて文献検索中に明らかにした質問の詳細を記載しました。 したがって、順不同で: 1)「非表示プロセスモデル」とは正確には何ですか? 私は、「隠されたプロセスモデル」はいくつかの異なるタイプの統計モデルを記述するために使用できる一種の包括的な用語であり、すべてが「オーバーラップのシステムによって生成された時系列データ潜在的に隠された線形加算プロセス」([1])。実際、[2]は「隠れたプロセスモデル」を「状態空間モデルまたは隠れマルコフモデルのいずれかを指す一般用語」として定義しています。[1]は、隠れマルコフモデルが、バイナリ状態の推論に特化した隠れプロセスモデルのサブタイプであると推測しているようです。基本的な意味は、隠れたプロセスモデルは隠れたマルコフモデルの一般化であると思われます。「隠れたプロセスモデル」と「 私のこの直感は正しいですか?そうでない場合、これらの方法をより明確に説明するリファレンスがありますか? 2)隠れマルコフモデルと状態空間モデルの違いは何ですか? 再び[2]に戻ります(紙自体が特に信頼できるように見えるためではなく、紙に明確な用語集が付いている場合だけです;それは一文の定義の便利な情報源にすぎません)、違いはそうです隠れマルコフモデルは、状態がマルコフである特定のタイプの状態空間モデルです(マルコフプロセスの順序に明確な制限はないようです。つまり、1次、...、k次)。ここで、状態空間モデルは、「2つの時系列を並行して実行するモデルであり、1つは真の状態(潜在)のダイナミクスをキャプチャし、もう1つはこれらの基礎となる可能性のある未知の状態から行われる観測で構成される」と定義されます。それらの状態がマルコフ特性も示す場合、それは隠れマルコフモデルです。 ただし、[3]は、状態空間モデルと隠れマルコフモデルの違いを、潜在状態の特性に関連するものとして定義しています。ここで、隠れマルコフモデルは離散状態を扱い、状態空間モデルは連続状態を扱います。それ以外の場合、概念的には同じです。 これらは非常に異なる2つの定義のように思えます。一方では、隠れマルコフモデルは状態空間モデルのサブタイプであり、他方では、両方とも、より広範なクラスの隠れプロセスモデルの異なるインスタンス化です。これらのうち正しいものはどれですか?私の直感では、[2]とは対照的に[3]に従うように指摘していますが、これをサポートする信頼できる情報源は見つかりません。 3)「マルコフ遷移モデル」とは何ですか? 多くのソースで出てきた別の用語は、「Markov遷移モデル」です。私はどの教科書にもこのフレーズを見つけることができませんでしたが、ジャーナルの記事には多く見られます(単に確認のためにGoogleに接続するだけです)。私はこの用語の厳密な定義を見つけることができませんでした(私が見つけたすべての論文は別の論文を引用し、他の論文を引用するなど、どこにも正気をもたらさないPubMedウサギの穴を送ります)。コンテキストからの私の印象は、推論の対象がマルコフ過程に従う状態間の遷移であるモデルを指す非常に一般的な用語であり、隠れマルコフモデルはマルコフ遷移モデルの特定のタイプと見なされる可能性があるということです。[4]しかし、遷移モデル、隠れマルコフモデル、およびいくつかの同様の用語を互換的に使用しているようです。 一方、[5]はマルコフ遷移モデルと隠れマルコフモデルについて少し異なった話をしています。著者は、「遷移モデルは、より複雑な隠れマルコフモデルからの結果を解釈するのに役立つ回答者のダイナミクスを要約する方法を提供します」と述べています。私はこのフレーズが何を意味するのか完全には理解しておらず、論文の他の場所でそれを正当化するものを見つけることができません。しかし、彼らはマルコフ遷移モデルは時間を連続変数として使用し、隠れマルコフモデルは時間を離散変数として使用することを暗示しているようです(彼らはこれを直接言わず、彼らはマルコフ遷移に適合するためにRパッケージ 'msm'を使用すると言います)モデル、および「msm」は、HMMのRパッケージとは対照的に、継続的に時間を処理するものとして説明されています)。 4)他の概念、たとえば動的ベイジアンネットワークはどこに収まりますか? ウィキペディアによると、動的ベイジアンネットワークは「隠れマルコフモデルとカルマンフィルターの一般化」です。他の場所では、「世界の全状態が単一の隠れ状態変数によって表される」動的ベイジアンネットワークの特別なケースとして定義された隠れマルコフモデルを見ました(動的ベイジアンシステムの定義とHMMとの関係?) 。私は一般にこの関係を理解し​​ており、[6]で十分に説明されています。 しかし、私はこの関係が物事のより広い視野にどのように適合するかを理解するのに苦労しています。つまり、HMMとDBNの間のこの関係を考えると、状態空間モデルと隠れたプロセスモデルはどのように2つに関連していますか?隠れマルコフモデルの複数の「一般化」があるように思われる場合、これらの異なるタイプの方法はすべてどのように相互に関係しますか? 参照: [1]トム・M・ミッチェル、レベッカ・ハッチンソン、インドラヤナ・ルスタンディ。「非表示プロセスモデル」。2006. CMU-CALD-05-116。カーネギーメロン大学。 [2]オリバー・ギミネス、ジャン・ドミニク・レブルトン、ジャン・ミシェル・ガイヤール、レミ・ショケ、ロジャー・プラデル。「隠れたプロセスの動的モデルを使用した人口統計パラメーターの推定」。理論人口生物学。2012. 82(4):307-316。 [3]バーバラエンゲルハルト。「隠れマルコフモデルと状態空間モデル」。STA561:確率的機械学習。デューク大学。http://www.genome.duke.edu/labs/engelhardt/courses/scribe/lec_09_25_2013.pdf [4] Jeroen K. Vermunt。「歩行気分評価データの分析への応用による連続時間でのマルチレベル潜在マルコフモデリング」。社会統計ワークショップ。2012.ティルブルフ大学。http://www.lse.ac.uk/statistics/events/SpecialEventsandConferences/LSE2013-Vermunt.pdf [5]ケン・リチャードソン、デビッド・ハート、クリスティー・カーター。「健康と労働力の移行を理解する:マルコフモデルをSoFIE縦断データに適用する」。公式統計調査シリーズ。2012年。 [6]ゾウビン・ガラマーニ。「隠れマルコフモデルとベイジアンネットワークの紹介」。Journal of Pattern Recognition and Artificial Intelligence。2001. 15(1):9-42。

4
と、の独立性の背後にある直観は何ですか?
ランダム変数と( 標準正規分布を持つ)が統計的に独立している理由を説明する議論を誰かが提案できることを期待 していました。その事実の証明はMGFテクニックから簡単に得られますが、それでも非常に直感に反していると思います。Y1=X2−X1Y1=X2−X1Y_1=X_2-X_1Y2=X1+X2Y2=X1+X2Y_2=X_1+X_2XiXiX_i したがって、もしあれば、ここでの直感に感謝します。 前もって感謝します。 編集:下付き文字は、順序統計ではなく、標準の通常分布からのIID観測を示します。

9
参照リクエスト:一般化線形モデル
Generalized Linear Modelsに関する中級レベルの入門書を探しています。理想的には、モデルの背後にある理論に加えて、アプリケーションやサンプルをRまたは他のプログラミング言語に含めたいと思います-SASも人気のある選択肢だと聞きます。私は自分でそれを勉強するつもりですので、それがそれ自身の演習への答えを提供するならば、それは役立つでしょう。 あなたは、私が微積分学と確率論の伝統的な一年のコースを取ったと仮定することができます。また、回帰分析の基本にも精通しています。


弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.