タグ付けされた質問 「references」

特定の主題に関する外部参照(本、論文など)を求める質問。さらに、常により具体的なタグを使用してください。

2
データのROC曲線を計算する
そのため、ハミング距離を使用して生体認証特性から個人を認証しようとしている16のトライアルがあります。しきい値は3.5に設定されています。私のデータは以下であり、トライアル1のみが真陽性です。 Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 7 0.47 8 0.32 9 0.39 10 0.45 11 0.42 12 0.37 13 0.66 14 0.39 15 0.44 16 0.39 私の混乱のポイントは、このデータからROC曲線(FPR対TPR OR FAR対FRR)を作成する方法が本当にわからないということです。どちらでもかまいませんが、どうやって計算するのか混乱しています。任意の助けいただければ幸いです。
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 


1
生存分析(Cox回帰)の異なるタイプの残差の違いは何ですか?
私はサバイバル分析はかなり新しいです。比例ハザードの仮定が満たされているかどうかを確認するために、モデル診断の一部としてシェーンフェルト残差を調べて学習するようにアドバイスされました。これを調べている間、私は以下を含む多くの異なるタイプの残差への参照を見てきました: コックススネル 逸脱 マルチンゲール スコア シェーンフェルト これらの残差の違いは何ですか?また、いつ使用することが推奨されますか?(私が読んで行くために単に論文へのリンクである答えに満足しています。)

3
確率的グラフィカルモデルの教科書
Kollerの「確率的グラフィカルモデル」は教科書として適していますか?あるいは、修士課程の教科書としてもっとお勧めの本はありますか? 免責事項:quora.comからクロス投稿しましたが、回答がありませんでした。

3
モデリングに関する一般的なアドバイス
問題の数学モデルを定式化することは、統計の最も主観的な側面の1つですが、最も重要な側面の1つでもあります。この重要だが見過ごされがちなトピックに対処するための最良のリファレンスは何ですか?そして、どの有名な統計学者が「データがモデルを導くのか」という線に沿って何か言った。

4
モデルを検証するためにデータをサブセット化することは必須ですか?
モデルの検証に関して、上司と同じページを表示するのに苦労しています。私は残差を分析し(近似値に対して観察された)、これを引数として使用してモデルによって得られた結果を議論しましたが、上司は、モデルを検証する唯一の方法はデータのランダムなサブセットを作成することであると主張し、 70%のモデルを生成し、残りの30%にモデルを適用します。 実は、私の応答変数はゼロに膨らんでいて(その85%、より正確にするため)、結果に収束するのはすでに非常に難しいので、サブセットを作成しない方がいいです。 だから、私の質問は:モデルを検証するための可能な(そして科学的に受け入れられる)方法は何ですか?データのサブセット化は唯一の方法ですか?可能であれば、質問を記事や本で参照してください。そうすれば、選択肢を提示するときに、それを引数として使用できます。

2
漸近推論(大標本理論)における最近の研究と研究範囲は何ですか?
漸近推論/大標本理論の分野で行われている現在の重要な理論的研究は何ですか?現在、この分野の研究範囲はどのようなものですか?理論が最近発展している未解決の問題または特定の領域はありますか?それとも、さらなる発展の余地のない死んだ主題なのでしょうか? だれかが私の質問に答えたり、検索できるソース/リファレンスを提供したりできるとありがたいです。

3
ベイジアンの頻出統計の紹介[終了]
休業。この質問には、より焦点を当てる必要があります。現在、回答を受け付けていません。 この質問を改善してみませんか?質問を更新して、この投稿を編集するだけで1つの問題に焦点を当てます。 2年前休業。 私はベイズの居心地の良い世界で快適に感じる単純な心のベイズ人です。 しかし、私の手に負えない悪意のある力のために、今度はエキゾチックで奇妙な頻出統計の世界について、入門的な大学院コースを行わなければなりません。これらの概念のいくつかは私には非常に奇妙に思えます、そして私の教師はベイズに精通していないので、私は両方を理解している人からインターネットでいくつかの助けを得ると思いました。 頻度主義が奇妙で不快であると思うベイジアンに、頻度主義統計のさまざまな概念をどのように説明しますか? たとえば、私がすでに理解しているいくつかのこと: 最尤推定量、最大事後推定に等しい、場合はフラットです。ARGMAX θargmaxθp(D|θ)argmaxθp(D|θ)\text{argmax}_\theta \;p(D|\theta)p (θ )argmaxθp(θ|D)argmaxθp(θ|D)\text{argmax}_\theta \;p(\theta |D)p(θ)p(θ)p(\theta) (これについては完全にはわかりません)。特定の推定量がパラメーターに対して十分な統計量であり、がフラットな場合、、つまり、サンプリング分布は尤度関数に等しいため、フラットな事前分布を与えられたパラメーターの事後に等しくなります。 θP(θ)P( θ |θ)=C1⋅P(D|θ)=C1⋅C2⋅P(θ|D)θ^θ^\hat \thetaθθ\thetap(θ)p(θ)p(\theta)p(θ^|θ)=c1⋅p(D|θ)=c1⋅c2⋅p(θ|D)p(θ^|θ)=c1⋅p(D|θ)=c1⋅c2⋅p(θ|D)p(\hat \theta|\theta)=c_1\cdot p(D|\theta)=c_1\cdot c_2\cdot p(\theta|D) これらは、ベイジアンの概念を理解している人に頻出主義の概念を説明する例です。 ベイジアンが理解できる用語で、頻度論統計の他の中心的な概念を同様にどのように説明しますか? 具体的には、次の質問に興味があります。 平均二乗誤差の役割は何ですか?ベイジアン損失関数とどのように関連していますか? 「偏りがない」という基準は、ベイズの基準とどのように関連していますか?私は、ベイジアンがその推定量が公平であることを要求しないであろうことを知っているが、同時に、ベイズはおそらく、公平なことを同意するだろうfrequentist推定器は、一般的に偏っよりも望ましいfrequentist彼は両方が劣るためであると考えるでしょうにもかかわらず、(1ベイジアン推定量)。では、ベイジアンはどのようにして公平さを理解するのでしょうか? フラットな事前分布がある場合、頻度主義の信頼区間はベイズの信頼区間と何らかの形で一致しますか? テストのような仕様テストでラプラスの名の下に何が起こっていますか?これは、モデル空間の分布に関するベイジアン更新のいくつかの退化した特別なケースですか?FFF より一般的には: ベイジアンに頻出を説明するリソースはありますか?ほとんどの本は逆に走っています:彼らはベイジアン主義を頻出統計学で経験された人々に説明しています。 ps。私は見てきましたが、ベイジアンとフリークエンシーの違いについてはすでに多くの質問がありますが、ベイジアンの観点からフリークエンシーを明確に説明しているものはありません。 この質問は関連していますが、ベイジアンに頻度論の概念を説明することについては特にではありません(頻度論的思考を正当化することについての一般的な説明については)。 また、私の論点は、頻出を非難することではありません。本当によく理解したい

7
学術的統計よりも軽い統計についての本
クリスマスが近づいてきました。統計をテーマにしたギフトを作りたいと思います。受領者はJordan EllenbergのHow Not to Wrongを間違えずに購入し、気に入りました(ところで、私もその本が好きです)。また、数学については少し軽いと感じましたが、シグナルとノイズも気に入りました。したがって、私はこれらの本のようなもの、つまりいくつかの方程式を恐れずに、たとえばGelmanらのBDAなどの大口径の学術書よりも軽い、統計をテーマにしたものを探しています。タイトルをいくつか教えていただけますか? 編集:私は彼がリスクに精通していることを知ったところです:カーネマンの本ではなく、ギゲレンツァーによって良い決定をする方法。そのため、Glen_bによる提案はスポットのようです。

2
統計の確率分布間の関係に関する情報はどこで入手できますか?
ディストリビューション間の関係に興味があります。「指数確率変数の合計は、ガンマ確率変数です。特定の条件付き分布は別の分布などです。」私はウィキペディアとグーグルを検索しましたが、それらの要約があり、具体的に証明または説明されていません。ディストリビューションの関係と詳細な証明または説明について知りたい。Webサイトまたは本のどちらでもかまいません。

1
機械学習へのカーネルヒルベルト空間アプローチの再現に関する教科書?
質問:再生カーネルヒルベルト空間アプローチを介して機械学習を(初めて)紹介するテキストを知っている人はいますか?つまり、機能分析を前提としていますが、機械学習の事前知識を前提としていますか? どんな調査記事も近い秒です。研究論文はありません-理論を実践する前に、まず理論を学びたいです。 背景:私の大学では、今学期に機能分析の方法を使用して機械学習、特にカーネルを再生するヒルベルト空間を導入することを約束するコースがあります。機能分析を知っていて、機械学習を知らず、初めて機械学習を学びたいので、これは私にとって本当に良いことです。 コースの説明(ドイツ語)-文献への言及なし コースのホームページ-再度、他の大学の同様のコースの文学への言及なし -参照はすべて研究論文です ただし、このコースを受講するためのスペースがスケジュールにあるかどうか、またはこの学期を受講する必要があるコースと競合するかどうかはわかりません。ですから、今学期はこの科目を履修できないのであれば、将来自由な時間に自分で勉強できるようになりたいと思っています。

2
共積分データのレベルでのVAR
私は、「最近の作業」がVARモデルを生データI(1)で使用できることを示しているが、共積分が必要であることを表すいくつかの論文を読みました。これは、VARモデリングのデータを差異化する理由がないことを意味します。これに関する紙の参照はありますか?

1
(参考資料)単に記憶するだけでなく、実験計画モデルをどのように導き出すか?
私が取っているMSレベルの統計手法クラスでは、実験計画のためのさまざまな線形モデルについて学びました。たとえば、 ランダム化完全ブロック設計(RCBD)モデルの場合、 ます(はブロックを表し、は処理を表します)、ブロック効果を表す(固定)治療効果、一部分布以下。I J β τ ε I J N(0 、σ 2 ε)Y私はj= μ + β私+ τj+ ε私はj、Yij=μ+βi+τj+εij,Y_{ij} = \mu + \beta_i + \tau_j + \varepsilon_{ij}\,,私iijjjββ\betaττ\tauε私はjεij\varepsilon_{ij}N(0 、σ2ε)N(0,σε2)\mathcal{N}(0, \sigma^2_{\varepsilon}) このモデルのように直感的に理解できるように、方程式を覚えるだけでなく、1レベル深く掘り下げて、このモデルがどのように派生するかを理解したいと思います。 質問: RCBDや他の実験計画モデルのこの方程式を導き出す情報源を誰かに紹介してもらえますか? 回答による編集:これを尋ねる理由は、ChristansenのPlanes Answers to Complex Questions(付録G)で、単純なランダムサンプリング方程式、完全にランダム化された設計方程式およびランダム化された完全なブロック設計方程式、「ランダム化理論に基づいたより適切なモデルへの適切な近似」として。以前、彼は述べています、Y I J = μ I + E I J Y I J = α …

2
ネイトシルバーの選挙予測モデル
ネイトシルバーは、過去の米国の選挙結果を予測することにかなり成功しており、これは彼の著書「シグナルとノイズ」に記載されています。本には、使用されたモデルのいくつかの説明が含まれており、彼のブログ投稿では、2014年の中間選挙で使用されたモデルについて説明しています。これらの説明は、より一般的な人々を対象としたものであり、統計モデルが実際にどのようなものであるか(概念的なものよりも)はそれほど具体的ではありません。 私の質問は次のとおりです。彼が使用したモデルのタイプについて、統計的に指向された説明を誰かが知っていますか?科学論文、ブログ投稿、プレゼンテーション、複製などです。彼の本は非常に興味深く、ここで私たちが話しているモデルのタイプと推定方法について学びたいと思います。 編集:誰かが終了に投票したので、私が求めていることを明確にしましょう。誰かが、概念的な説明ではなく統計的な説明を含む、ネイトシルバーが使用する予測モデルの説明への参照を提供できますか?これは、Silver自身が公開した論文である必要はありませんが、他のユーザーによるブログ投稿(または論文)でもかまいません。

1
粒子フィルターに関する論文のレビュー
Zhe Chenによる "Bayesian Filtering:From Kalman Filters to Particle Filters、and Beyond"というタイトルの優れたレビューペーパーのドラフトをオンラインで見つけました。Google Scholarによると、公開されたバージョンの引用は「Statistics 182(1)、1-69、2003」ですが、私がその名前(ISSN:0233-1888)で見つけたジャーナルには論文がありません。実際、2003年の巻数は182に近いものではありません。正しいジャーナル名、できればこの論文のISSNとDOIを見つける方法、または発行されていないことを確認する方法

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.