タグ付けされた質問 「risk」

9
「80人に1人が自動車事故によって引き起こされた」を「80人に1人が自動車事故の結果として死亡した」と言い換えることは間違っていますか?
ステートメント1(S1):「80人に1人の死亡は自動車事故によるものです。」 ステートメント2(S2):「80人に1人が自動車事故の結果死亡しました。」 今、私は個人的に、これらの2つのステートメントの間に大きな違いは見ていません。書くとき、私はそれらを一般の聴衆と交換可能であると考えます。しかし、私はこれについて2人の人に挑戦されており、いくつかの追加の視点を探しています。 S2のデフォルトの解釈は、「人間の人口から一様にランダムに引き出された80人のうち、そのうちの1人が自動車事故の結果として死亡することを期待します」です。 私の質問は次のとおりです。 Q1)デフォルトの解釈は、実際にはステートメント1と同等ですか? Q2)これが私のデフォルトの解釈であるのは珍しいですか、無謀ですか? Q3)S1とS2が異なると思う場合、1つ目が誤解を招く/間違っているという意味で2つ目を述べる場合、同等のS2の完全修飾リビジョンを提供してください。 S1が人間の死を具体的に言及していないという明白なめ事を脇に置き、それが文脈で理解されていると仮定しましょう。また、クレーム自体の真実性についての議論はさておき、説明のためのものです。 私の知る限り、これまでに聞いた意見の不一致は、最初と2番目のステートメントの異なる解釈に対するデフォルトを中心としているようです。 最初は、私の挑戦者は1/80 * num_deaths =自動車事故による死者数と解釈しますが、何らかの理由で、「もしあなたが何かセットを持っているなら、 80人の、そのうちの一つがします(明らかに同等の請求ではありません)車の事故」で死亡します。S1の解釈を考えると、S2のデフォルトは(1/80 * num_dead_people =自動車事故で亡くなった人の数==自動車事故による死者の数)と解釈されると思います。なぜ解釈に矛盾があるのか​​(S2のデフォルトがはるかに強い仮定である)、またはそれらに私が実際には欠けているという生来の統計的意味があるかどうかはわかりません。

5
機械学習で階層/ネストされたデータを処理する方法
例で問題を説明します。いくつかの属性(年齢、性別、国、地域、都市)を与えられた個人の収入を予測するとします。あなたはそのようなトレーニングデータセットを持っています train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", "M","F","M","F", "F","F","F","M")), Income=c(31,42,71,65, 50,51,101,38, 47,50,55,23)) train CountryID RegionID CityID Age Gender Income 1 1 1 1 23 M 31 2 1 1 1 48 F 42 3 1 1 2 62 M 71 4 …
29 regression  machine-learning  multilevel-analysis  correlation  dataset  spatial  paired-comparisons  cross-correlation  clustering  aic  bic  dependent-variable  k-means  mean  standard-error  measurement-error  errors-in-variables  regression  multiple-regression  pca  linear-model  dimensionality-reduction  machine-learning  neural-networks  deep-learning  conv-neural-network  computer-vision  clustering  spss  r  weighted-data  wilcoxon-signed-rank  bayesian  hierarchical-bayesian  bugs  stan  distributions  categorical-data  variance  ecology  r  survival  regression  r-squared  descriptive-statistics  cross-section  maximum-likelihood  factor-analysis  likert  r  multiple-imputation  propensity-scores  distributions  t-test  logit  probit  z-test  confidence-interval  poisson-distribution  deep-learning  conv-neural-network  residual-networks  r  survey  wilcoxon-mann-whitney  ranking  kruskal-wallis  bias  loss-functions  frequentist  decision-theory  risk  machine-learning  distributions  normal-distribution  multivariate-analysis  inference  dataset  factor-analysis  survey  multilevel-analysis  clinical-trials 

1
厳密なフォンノイマン不等式の例
ましょうr(π,δ)r(π,δ)r(\pi, \delta)推定器の示すベイズリスクδδ\delta前に対してππ\piせ、ΠΠ\Piパラメータ空間上のすべての事前確率のセット表すΘΘ\Theta、およびlet ΔΔ\Delta(おそらくはランダム化)全ての集合を示す決定ルール。 ジョン・フォン・ノイマンのミニマックス不等式の統計的解釈は、 supπ∈Πinfδ∈Δr(π,δ)≤infδ∈Δsupπ∈Πr(π,δ),supπ∈Πinfδ∈Δr(π,δ)≤infδ∈Δsupπ∈Πr(π,δ), \sup_{\pi\in\Pi} \inf_{\delta\in\Delta} r(\pi, \delta) \leq \inf_{\delta\in\Delta}\sup_{\pi\in\Pi} r(\pi, \delta), と両方が有限である場合、一部のとに対して厳密な等価性が保証されます。δ′δ′\delta'π′π′\pi'ΘΘ\ThetaΔΔ\Delta 不平等が厳格な具体的な例を誰かが提供できますか?

1
二乗バイアスと分散の加重和を最小化する推定量は、どのようにして決定理論に適合しますか?
わかりました-私の元のメッセージは応答を引き出すことができませんでした。では、別の質問をさせてください。まず、意思決定理論の観点から、私の推定の理解について説明します。私は正式なトレーニングを受けていませんし、私の考えに何らかの欠陥があるとしても、私は驚かないでしょう。 損失関数ます。予想される損失は、(頻繁な)リスクです。L(θ,θ^(x))L(θ,θ^(x))L(\theta,\hat\theta(x)) R(θ,θ^(x))=∫L(θ,θ^(x))L(θ,θ^(x))dx,R(θ,θ^(x))=∫L(θ,θ^(x))L(θ,θ^(x))dx,R(\theta,\hat\theta(x))=\int L(\theta,\hat\theta(x))\mathcal{L}(\theta,\hat\theta(x))dx, ここで、は尤度です。ベイズのリスクは予想される頻出主義のリスクです:L(θ,θ^(x))L(θ,θ^(x))\mathcal{L}(\theta,\hat\theta(x)) r(θ,θ^(x))=∫∫R(θ,θ^(x))π(θ)dxdθ,r(θ,θ^(x))=∫∫R(θ,θ^(x))π(θ)dxdθ,r(\theta,\hat\theta(x))=\int\int R(\theta,\hat\theta(x))\pi (\theta)dxd\theta, ここで、は以前のものです。π(θ)π(θ)\pi (\theta) 一般的に、を最小化するが見つかり、これはすべてうまくいきます。さらに、Fubiniの定理が適用され、を最小化する任意のが他のすべてから独立するように、統合の順序を逆にすることができます。このようにして、尤度の原則に違反することなく、ベイジアンであることなどについて気分を良くすることができます。θ^(x)θ^(x)\hat\theta(x)rrrθ^(x)θ^(x)\hat\theta(x)rrr たとえば、おなじみの二乗誤差損失、頻度リスクは平均二乗誤差または合計です二乗バイアスと分散およびベイズのリスクは、事前に与えられた二乗バイアスと分散の予想合計です。つまり、事後予測損失です。L(θ,θ^(x))=(θ−θ^(x))2,L(θ,θ^(x))=(θ−θ^(x))2,L(\theta,\hat\theta(x))=(\theta- \hat\theta(x))^2, これは今のところ私には理にかなっているようです(かなり間違っている可能性もあります)。しかし、いずれにせよ、他のいくつかの目的については、物事は私にはあまり意味がありません。たとえば、均等に重み付けされた二乗バイアスと分散の合計を最小化する代わりに、等しく重み付けされていない合計を最小化したいとします。つまり、以下を最小化するです。θ^(x)θ^(x)\hat\theta(x) (E[θ^(x)]−θ)2+kE[(θ^(x)−E[θ^(x)])2],(E[θ^(x)]−θ)2+kE[(θ^(x)−E[θ^(x)])2],(\mathbb{E}[\hat\theta(x)]-\theta)^2+k\mathbb{E}[(\hat\theta(x)-\mathbb{E}[\hat\theta(x)])^2], ここで、は正の実定数(1以外)です。kkk 私は通常、このような合計を「目的関数」と呼びますが、その用語を誤って使用している可能性もあります。私の質問は、解決策を見つける方法についてではありません- この目的関数を最小化するを見つけることは数値的に実行可能です-むしろ、私の質問は2つあります:θ^(x)θ^(x)\hat\theta(x) そのような目的関数は、決定理論のパラダイムに適合しますか?そうでない場合、それが適合する別のフレームワークはありますか?はいの場合、どのようにですか?の関数であろう関連する損失関数のように思える、、およびので期待の- -である(これ私は思う)適切ではない。θθ\thetaθ^(x)θ^(x)\hat\theta(x)E[θ^(x)]E[θ^(x)]\mathbb{E}[\hat\theta(x)] このような目的関数は、任意の推定が他のすべての推定に依存するため(仮説であっても、尤度原理に違反します。それにもかかわらず、バイアスの減少とエラー分散の増加のトレードオフが望ましい場合があります。そのような目標が与えられた場合、可能性の原則に準拠するように問題を概念化する方法はありますか?θ^(xj)θ^(xj)\hat\theta(x_{j})θ^(xi≠j)θ^(xi≠j)\hat\theta(x_{i\neq j}) 私は、意思決定理論/推定/最適化に関するいくつかの基本的な概念を理解できなかったと想定しています。答えをお寄せいただき、ありがとうございます。この分野や数学のトレーニングは一般的に受けていないため、何も知らないと想定してください。さらに、(初心者の読者のために)提案された参考文献を歓迎します。
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.