タグ付けされた質問 「inference」

サンプルデータから母集団パラメーターに関する結論を導き出す。https://en.wikipedia.org/wiki/Inferenceおよびhttps://en.wikipedia.org/wiki/Statistical_inferenceを参照してください

3
iid実数値確率変数の合計に対するベイズ推定
ましょう、、...、 IID RVの範囲となるが、未知の分布。(必要に応じて、配信が継続的であると仮定しても構いません。)X1X1X_1X2X2X_2XnXnX_n[0,1][0,1][0,1] 定義します。Sn=X1+⋯+XnSn=X1+⋯+XnS_n = X_1 + \cdots + X_n 私はS_kを与えられSkSkS_k、尋ねます:S_nについてベイジアンの方法で何を推測でき SnSnS_nますか? つまり、RVのサイズkkkのサンプルの合計が与えられ、ベイジアンアプローチを使用して、すべてのRVの合計の分布について何を推測できるかを知りたいのです(そして、分布)。 サポートが[0,1]ではなく\ {0,1 \}である場合、この問題は十分に研究されており、(事前分布が均一であれば)S_nの推定分布のベータ二項複合分布が得られます。しかし、[0,1]を範囲としてどのようにアプローチするのかわかりません...{0,1}{0,1}\{0,1\}[0,1][0,1][0,1]SnSnS_n[0,1][0,1][0,1] 完全な開示:私はすでにこれをMathOverflowに投稿しましたが、ここに投稿した方がいいと言われたので、これは再投稿です。

2
確率的推論とは何ですか?
クリスビショップのパターン認識と機械学習の教科書を読んでいます。確率的推論という用語に何度か出くわしました。いくつか質問があります。 確率論的推論はグラフィカルモデリングのコンテキストでのみ適用できますか? 従来の統計的推論(p値、信頼区間、ベイズ係数など)と確率論的推論の違いは何ですか? これはCSコミュニティに固有の用語ですか、それとも統計コミュニティでも広く使用されていますか?

2
事後は必然的に以前のものと同じ条件付き依存構造に従いますか?
モデルの仮定の1つは、同時事前分布の確率変数間の条件依存です。次のモデル、考えます。 p(a,b|X)∝p(X|a,b)p(a,b)p(a,b|X)∝p(X|a,b)p(a,b)p(a,b|X) \propto p(X|a,b)p(a,b) 次に、以前の独立性の仮定を想定します。p(a,b)=p(a)p(b)p(a,b)=p(a)p(b)p(a,b) = p(a)p(b) この仮定は、事後が次の条件付き依存性も持っていることを意味しますか? p(a|X)p(b|X)∝p(X|a,b)p(a)p(b)p(a|X)p(b|X)∝p(X|a,b)p(a)p(b)p(a|X)p(b|X) \propto p(X|a,b)p(a)p(b)

1
従属変数または独立変数、あるいはその両方のログを取得すると、モデルのエラーに影響があり、したがって推論の妥当性に影響しますか?
私はよく人々(統計家や実務家)が再考せずに変数を変換しているのを見ます。エラーの分布が変更されて無効な推論につながる可能性があるので、私は常に変換を怖がっていますが、何かを誤解しなければならないのはよくあることです。 アイデアを修正するために、モデルがあるとします Y=β0expXβ1+ϵ, ϵ∼N(0,σ2)Y=β0exp⁡Xβ1+ϵ, ϵ∼N(0,σ2)Y=\beta_0\exp X^{\beta_1}+\epsilon,\ \epsilon\sim\mathcal{N}(0,\sigma^2) これは原則としてNLSに適合します。しかし、ほとんどの場合、私は人々が丸太を取り、フィッティング logY=logβ0+β1logX+???⇒Z=α0+β1W+???log⁡Y=log⁡β0+β1log⁡X+???⇒Z=α0+β1W+???\log{Y}=\log\beta_0+\beta_1\log{X}+???\Rightarrow Z=\alpha_0+\beta_1W+??? これはOLSで適合できることはわかっていますが、パラメーターの信頼区間を計算する方法がわかりません。今のところ、予測区間や許容区間はもちろんです。 そして、それは非常に単純なケースでした:かなり複雑な(私にとって)ケースを考えてください。 YYY そして XXX アプリオリですが、GAMなどを使用してデータから推測しようとします。次のデータについて考えてみましょう。 library(readr) library(dplyr) library(ggplot2) # data device <- structure(list(Amplification = c(1.00644, 1.00861, 1.00936, 1.00944, 1.01111, 1.01291, 1.01369, 1.01552, 1.01963, 1.02396, 1.03016, 1.03911, 1.04861, 1.0753, 1.11572, 1.1728, 1.2512, 1.35919, 1.50447, 1.69446, 1.94737, 2.26728, 2.66248, 3.14672, 3.74638, …

2
推定量が不偏であることを証明した場合、それはパラメーター推定量が不偏であることを証明しますか?
LETのPDF有するIIDランダム変数である、、及び。バツ私バツ私X_if(x | θ )f(バツ|θ)f(\mathbf{x}|\theta)E(バツ私)= 6θ2E(バツ私)=6θ2E(X_i) = 6\theta^2θ > 0θ>0\theta > 0 Iパラメータ(のための推定計算したの)あることを。これが不偏推定量であることを証明するには、であることを証明する必要があります。ただし、であるため、θθ\thetaf(x | θ )f(バツ|θ)f(\mathbf{x}|\theta)θ^=バツ¯/ 6−−−√θ^=バツ¯/6\hat{\theta} = \sqrt{\bar{x}/6}E(θ^)=E(x¯/6−−−√)E(θ^)=E(x¯/6)E(\hat{\theta}) = E\left(\sqrt{\bar{x}/6}\right)θ^2=x¯/6θ^2=x¯/6\hat{\theta}^2 = \bar{x}/6E(θ^2)=E(バツ¯/6)=16E(∑Xin)=16n∑E(Xi)=16nn6θ2=θ2.E(θ^2)=E(x¯/6)=16E(∑Xin)=16n∑E(Xi)=16nn6θ2=θ2.\begin{align} E(\hat{\theta}^2) &= E(\bar{x}/6) \\ &=\frac{1}{6}E\left(\frac{\sum X_i}{n}\right)\\ &=\frac{1}{6n}\sum E(X_i) \\ &=\frac{1}{6n}n6\theta^2 \\&= \theta^2.\end{align} 一般的に、証明証明と同じではないため、またあり得る。ただし、この場合はです。x2=4x2=4x^2 =4x=2x=2x=2xxx−2−2-2θ>0θ>0\theta>0 私はが不偏であることを示しましたが、これはが不偏であることを示すのに十分ですか?θ^2θ^2\hat{\theta}^2θ^θ^\hat{\theta}

1
完全(グローバル)回帰モデルに基づく推論は適切ですか?
完全なモデルに基づく推論は適切であり、適切な場合はどのような状況ですか? 応答変数といくつかの候補予測子変数の間の潜在的な関係に関心があり、何らかの形の回帰(たとえば、一般化線形モデル)を使用してそれに答えるとします。どの予測因子が「重要」であるか、または応答と明らかに真の関係にあるかを推測する1つのアプローチは、情報理論的基準(たとえばAIC)に基づくモデル比較です。最終モデルで保持されない変数は応答とある程度の関係があるかもしれませんが、モデルに保持されている他の予測子を考えると、それらは本質的に追加の実質的な情報を提供しません。 完全な(グローバル)モデル(すべての候補予測子を含む)を単純に当てはめて、そこで停止し、t統計(または他の統計)とp値のみに基づいて個々の予測子に基づいて推論する方が適切な場合はありますかこの完全なモデルでは、さらにモデルを選択する必要はありませんか? 私は、潜在的な欠点はあるものの、これを行うのが賢明なことかもしれないという提案に遭遇しました(例:Whittingham et al。「なぜなぜ生態学と行動に段階的モデリングを使用するのですか?」(2006)。偏りはありませんが、モデルの他の(「重要でない」)変数がそれらに影響を与える可能性があるため、他のソースはこれらの推定値とp値は信頼できないと述べています。 潜在的な生物学的関係を理解することを目的とする場合、どの方法がより適切でしょうか?

3
統計的推論における特徴エンジニアリングの役割は何ですか?
これは馬鹿げた質問かもしれません。私は最近の大学卒業生で、予測モデリングの分野で働いており、機能エンジニアリングの実行に重点が置かれていることに気づきました。ただし、統計学に関する私の学術的トレーニングのほとんどでは、推論モデルを構築するための特徴エンジニアリングなど(離散化/ビニング予測子に対する議論以外)についてほとんど言及されていませんでした。統計的推論用のモデルを開発するのではなく、予測モデリングを行うときに機能エンジニアリングがより大きな役割を果たすのはなぜかと思いました。それで...統計的推論における特徴エンジニアリングの役割は何ですか?(予測モデリングにおける機能エンジニアリングの役割とは対照的に) 最近のコメントに基づいて: 統計的推論とは、予測子と応答変数の間の関係を評価することを主な目的とする分析を意味します。 予測モデリングとは、主な目標がYの推定または将来の値の予測であるすべての分析を意味します。(すべてのMLテクニックを含む)

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.