タグ付けされた質問 「references」

特定の主題に関する外部参照(本、論文など)を求める質問。さらに、常により具体的なタグを使用してください。

3
データマイナーのための実験計画のコース
私はデータマイニングに携わるコンピューターサイエンティストです。コンピューター科学者が体系的な実験計画と評価を行うのがかなり下手だと言うことは秘密ではありません-p値と信頼度推定の使用は高度であると考えられます:)。 コンピュータサイエンティストに優れた実験計画法を教えるための優れたコースや資料があるかどうか知りたい。これをより具体的にするために、次の情報を追加します。 このコースは、確率については合理的に理解していると考えられるが、統計のバックグラウンドが限られている大学院生を対象とする必要があります。 このコースでは、「制御されていない不自然な設定」での実験計画に焦点を当てる必要があります。つまり、基礎となる物理的なグラウンドトゥルースも、データ収集プロセスを制御する方法もありません(人間の被験者と同様)。もちろん、良いコースはファンダメンタルズに焦点を当てますが、このシナリオをかなりの方法で扱う必要があります。 計算要素はおまけですが、必須ではありません。私たちは多くのデータを扱いますが、必要に応じて自分で計算の問題を理解することができます。

2
分類のためのSVMでのAdaboostの使用
Adaboostが一連の​​弱い分類子の線形結合を使用して強い分類子を生成しようとしていることを知っています。 ただし、特定の状況や状況で AdaboostとSVMが協調して機能することを示唆するいくつかの論文を読んだことがあります(SVMは強力な分類子ですが)。 アーキテクチャとプログラミングの観点から、それらがどのように組み合わさって機能するかを理解することはできません。私は多くの論文(たぶん間違ったもの)を読みましたが、それらがどのように連携するかを明確に説明していませんでした。 誰かが効果的な分類のために組み合わせてどのように機能するかについていくつかの光を投げることができますか?いくつかの論文/記事/ジャーナルへのポインタもいただければ幸いです。

2
査読済みのウィキStatProb.comで公開する価値はありますか?[閉まっている]
休業。この質問は意見に基づいています。現在、回答を受け付けていません。 この質問を改善してみませんか?この投稿を編集して、事実と引用で回答できるように質問を更新してください。 6か月前に閉鎖。 バックグラウンド Andrew GelmanのブログのコメントからStatProb.comについて読みました。 ウェブサイトによると、StatProbは次のとおりです。 StatProb:Statistics and Probability Societiesが主催する百科事典は、従来のwiki(迅速で最新の公開、ユーザー生成の開発、ハイパーリンク、および保存された履歴)の利点と従来の公開(品質保証、レビュー、著者への信用)を組み合わせたものです。 、および構造化された情報の表示)。すべての寄稿は、主要な統計学会によって決定された編集委員会によって承認されています。編集委員会のメンバーはAboutページにリストされています。 私は統計学者ではありませんが、統計情報を使用しています。このサイトは、他の人には役立つ可能性があるが、付録として含めたり、ウェブサイトに投稿したりしない限り、非公開になる可能性のある資料を公開する機会を提供しているようです。審査プロセスは、私が使用する方法に対する私自身の自信を高め、公共の場である程度の信頼性を与えるため、このオプションは魅力的です。 主要な統計と確率社会のサポートにもかかわらず、サイトは離陸していません。確かに、あるブロガーは「RIP StatProb?」そして寄付の頻度は時間とともに減少しています。 質問: StatProb.comを通じて公開するのは、努力する価値がありますか? 更新: 本日(2012-02-01)の時点で、最新の貢献は2011-05-04でした。最新の編集2011-06。そのため、質問が最初に尋ねられたときよりも今日はあまり魅力的ではないように見えます。

1
フラクタル数学に基づく統計
フラクタル数学に基づく統計学に関する本/教科書を探しています。私はそれがあまり知られていない地域であり、良い文学を見つけることがかなり難しいことを知っています。どんな提案も歓迎します(本、教科書、オンライン資料)。

6
ナップザック制約付きの統計ライブラリー
統計本の(非常に)小さなライブラリを構築するために200米ドルの資金があったとしましょう。あなたの選択肢は何ですか?アマゾンからの無料発送を想定していて、インターネットから無料で入手できるテキストは公正なゲームですが、印刷するページごとに5セントの料金を想定しています。 (私はドーバーの本からの郵送に触発されましたが、それらの提供物のほとんどは少し時代遅れのようです)。

4
臨床試験に関する良いテキストは?
私は、臨床試験分析の良い治療法を探している学部の統計学の学生です。テキストは、他のトピックの中でも特に、実験計画、ブロッキング、電力分析、ラテン方格計画、クラスター無作為化計画の基礎をカバーする必要があります。 数学の統計学と実際の分析について学部の知識を持っていますが、もう少し高いレベルの統計学または分析を必要とする素晴らしいテキストがある場合、私はそれに取り組むことができます。

1
R / mgcv:なぜte()とti()テンソル積が異なる表面を生成するのですか?
のmgcvパッケージにRは、テンソル積の相互作用をフィッティングするための2つの関数がte()ありti()ます。私は2つの作業の基本的な分業を理解しています(非線形の相互作用を当てはめるか、この相互作用を主効果と相互作用に分解するか)。私が理解していないのは、なぜte(x1, x2)、そしてti(x1) + ti(x2) + ti(x1, x2)(わずかに)異なる結果を生成するのかということです。 MWE(から適応?ti): require(mgcv) test1 <- function(x,z,sx=0.3,sz=0.4) { x <- x*20 (pi**sx*sz)*(1.2*exp(-(x-0.2)^2/sx^2-(z-0.3)^2/sz^2)+ 0.8*exp(-(x-0.7)^2/sx^2-(z-0.8)^2/sz^2)) } n <- 500 x <- runif(n)/20;z <- runif(n); xs <- seq(0,1,length=30)/20;zs <- seq(0,1,length=30) pr <- data.frame(x=rep(xs,30),z=rep(zs,rep(30,30))) truth <- matrix(test1(pr$x,pr$z),30,30) f <- test1(x,z) y <- f + rnorm(n)*0.2 par(mfrow = c(2,2)) # …
11 r  gam  mgcv  conditional-probability  mixed-model  references  bayesian  estimation  conditional-probability  machine-learning  optimization  gradient-descent  r  hypothesis-testing  wilcoxon-mann-whitney  time-series  bayesian  inference  change-point  time-series  anova  repeated-measures  statistical-significance  bayesian  contingency-tables  regression  prediction  quantiles  classification  auc  k-means  scikit-learn  regression  spatial  circular-statistics  t-test  effect-size  cohens-d  r  cross-validation  feature-selection  caret  machine-learning  modeling  python  optimization  frequentist  correlation  sample-size  normalization  group-differences  heteroscedasticity  independence  generalized-least-squares  lme4-nlme  references  mcmc  metropolis-hastings  optimization  r  logistic  feature-selection  separation  clustering  k-means  normal-distribution  gaussian-mixture  kullback-leibler  java  spark-mllib  data-visualization  categorical-data  barplot  hypothesis-testing  statistical-significance  chi-squared  type-i-and-ii-errors  pca  scikit-learn  conditional-expectation  statistical-significance  meta-analysis  intuition  r  time-series  multivariate-analysis  garch  machine-learning  classification  data-mining  missing-data  cart  regression  cross-validation  matrix-decomposition  categorical-data  repeated-measures  chi-squared  assumptions  contingency-tables  prediction  binary-data  trend  test-for-trend  matrix-inverse  anova  categorical-data  regression-coefficients  standard-error  r  distributions  exponential  interarrival-time  copula  log-likelihood  time-series  forecasting  prediction-interval  mean  standard-error  meta-analysis  meta-regression  network-meta-analysis  systematic-review  normal-distribution  multiple-regression  generalized-linear-model  poisson-distribution  poisson-regression  r  sas  cohens-kappa 

2
OLSを紹介するオンラインリファレンス
私は普通の最小二乗(OLS)推定量を研究し始めましたが、まだ最初の段階です。計量経済学に関する本をすでに購入しましたが、オンラインで何も見つかりませんでした。そのため、最小二乗推定量を説明するウェブサイト、ホームページ、またはその他のオンラインリソースが存在するかどうか疑問に思っていました。一般的な紹介または概要を提供する資料を探しています。これまでのところ、私はインターネット上であまりに衝撃的なものを見つけていません。誰かがいくつかの有用な参照を持っていますか? 理想的なオンラインリファレンスは、適用された目的のために簡単な方法でOLSを説明します。理想的には、推定値の数学的導出、OLSの仮定、または推定量に偏りのない数学的な不明瞭さなど、特定のトピックに関する例と詳細情報も提供します。私は計量経済学の本のpdfを探していません。

5
Metropolis Hastingsアルゴリズム
マルコフ連鎖モンテカルロ法を研究する必要があります。具体的には、メトロポリスヘイスティングスアルゴリズムと、収束基準のようなそれについてすべて研究する必要があります。 簡単な用語を使用してこの議論を説明している本、紙、またはWebサイトを誰が私に処方することができますか?
11 references  mcmc 

4
ノンパラメトリック統計の紹介
私は過去2年間統計を研究しています。私が学んだほとんどすべては、パラメトリック統計についてです。ここで、ノンパラメトリック統計について詳しく知りたいと思います。誰もがこの領域にいくつかの簡潔な(おそらく読みやすい)紹介を提案できますか?

2
ダミーのフィッシャー?
短いバージョン: 統計の背景がほとんどまたはまったくない人を対象とした統計に関するロナルドフィッシャーの著作(論文や本)の紹介はありますか? 私は、非統計学者向けの「注釈付きフィッシャーリーダー」のようなものを考えています。 私はこの質問の動機を以下に詳しく述べますが、それは長い間(私はそれをより簡潔に説明する方法がわかりません)であり、さらに、それはほぼ確実に物議を醸し、恐らく不快で、おそらく苛立たしいことさえあります。あなたがない限り、この記事の残りの部分をスキップしてください本当に(上に示したように)質問があまりにも簡潔でさらに明確化せずに回答すると思います。 多くの人が難しいと考える多くの分野の基本(たとえば、線形代数、抽象代数、実数および複雑な分析、一般トポロジー、測度理論など)を独学で習得しましたが、統計を教えるためのすべての努力は失敗しました。 この理由は、統計的に技術的に困難である(または、自分の道を見つけることができた他の領域よりもはるかに困難である)と思うのではなく、統計が非常に奇妙ではないにしても、他のどの統計よりもずっと異質であることに気づくからです。私が独学した他の分野。 ゆっくりと私は、この奇妙さのルーツはほとんど歴史的であり、この分野を実践者のコミュニティからではなく、本から学んでいる誰かとして疑っていました(統計学で正式に訓練されていた場合のように) )、統計の歴史についてもっと学ぶまで、私はこの疎外感を乗り越えることはありませんでした。 だから私は統計の歴史についての本を何冊か読んだことがあり、これを行うことは実際、私がフィールドの奇妙さとして何を感じているかを説明するのにずさんなやり方をしました。しかし、私はまだこの方向に進むいくつかの方法を持っています。 統計学の歴史の中で私が読んだことから学んだことの1つは、統計学において奇妙であると私が認識しているものの多くの源は一人の男、ロナルドフィッシャーであるということです。 実際、次の引用1(最近発見したもの)は、いくつかの歴史を掘り下げることによってのみ、この分野を理解し始めようとしていたこと、およびフィッシャーを私のように理解することの両方に非常に調和しています基準点: ほとんどの統計的概念と理論は、その歴史的起源とは別に説明できます。これは、「基準確率」の場合、不必要な神秘化なしでは実現不可能です。 確かに、私がここでの私の直感は、(もちろん)主観的ではありますが、完全に根拠がないわけではないと思います。フィッシャーは統計で最も独創的なアイデアのいくつかを提供しただけでなく、以前の研究を無視したこと、および直感に頼ったことで悪名を馳せていました(他の誰も理解できない証拠を提供するか、またはそれらを完全に省略しています)。さらに、彼は20世紀前半の他の多くの重要な統計学者たちとの生涯にわたる確執を持っていました。 これらすべてからの私の結論は、そうです、現代統計へのフィッシャーの貢献は確かに広範囲に及んでいましたが、それらのすべてが肯定的であったわけではありません。 また、統計との疎外感の底に入るには、フィッシャーの作品の少なくとも一部を元の形式で読む必要があると結論付けました。 しかし、私はフィッシャーの執筆が不浸透性という評判に忠実であることを発見しました。私はこの文献へのガイドを見つけようとしましたが、残念なことに、私が見つけたものはすべて統計の訓練を受けた人々を対象としているので、それが解明しようとしていることと同じくらい理解するのは難しいです。 したがって、この投稿の冒頭の質問。 1 Stone、Mervyn(1983)、「基準確率」、統計科学百科事典 3 81-86。ワイリー、ニューヨーク。

2
変数のベクトルはどのように超平面を表すことができますか?
Elements of Statistical Learningを読んでいます。12ページ(セクション2.3)では、線形モデルは次のように表記されています。 Yˆ= XTβˆY^=XTβ^\widehat{Y} = X^{T} \widehat{\beta} ...ここで、は、予測子/独立変数/入力の列ベクトルの転置です。(これは、そうではない、このするであろう「全てのベクトルは列ベクトルであると仮定される」以前の状態X Tは、行ベクトルとβ列ベクトル?)バツTXTX^{T}バツTXTX^{T}βˆβ^\widehat{\beta} は「1」が含まれており、対応する係数と乗算されて(定数)切片が与えられます。バツXX111 それは続けて言う: 次元の入出力空間、(X 、Yは)超平面を表します。定数がXに含まれている場合、超平面は原点を含み、部分空間です。ない場合には、切断アフィン集合であるYは、点でγ軸 (0 、^ β 0)。(p + 1 )(p+1)(p + 1)(X、Y ˆ)(X, Y^)(X,\ \widehat{Y})バツXXYYY(0 、β 0ˆ)(0, β0^)(0,\ \widehat{\beta_0}) 「」、インターセプトの「予測因子の連結によって形成されるベクトル記述1」とYを?そして、なぜ「を含めない1における」X「確かにいることを、原点を通過するように超平面を強制1」を掛けたことがある^ β 0?(X、Y ˆ)(X, Y^)(X,\ \widehat{Y})111YˆY^\widehat{Y}111バツXX111β0ˆβ0^\widehat{\beta_0} その本を理解できていない。リソースへのヘルプ/アドバイス/リンクは非常に高く評価されます。

3
データの前処理と外れ値の検出手法を扱った優れた本
タイトルが進むにつれ、データの前処理全般、特に外れ値の検出手法を扱った最新の優れた本を知っている人はいますか? 本はそれだけに焦点を合わせる必要はありませんが、前述のトピックを徹底的に扱う必要があります-私は出発点であるものに満足せず、論文のリストを引用し、さまざまな手法の説明が本自体。 欠落データを処理するための手法が望ましいが、必須ではない...


3
それらが存在する場合、より多くの要素を抽出する方が常に良いですか?
主成分分析とは異なり、因子分析モデルのソリューションは必ずしもネストされていません。つまり、最初の因子のみが抽出された場合と最初の2つの因子が抽出された場合では、最初の因子の負荷(たとえば)は必ずしも同じではありません。 このことを念頭に置いて、相関性の高い一連のマニフェスト変数があり、その内容の理論的知識によって単一の要素によって駆動される必要がある場合を考えてみます。探索的因子分析(並列分析、スクリープロット、固有値> 1など)が因子があることを強く示唆していると想像してください。マニフェスト変数と因子解を使用して、最初の因子の参加者の値を推定(つまり、因子スコアを取得)することに関心があります。 このシナリオでは、次の方がよいでしょう。222 因子モデルを近似して111因子のみを抽出し、因子スコア(など)を取得する、または 因子モデルを近似して両方の因子を抽出し、因子の因子スコアを取得しますが、2番目の因子のスコアを破棄/無視しますか? どちらがより良い実践であるのか、なぜですか? この問題に関する調査はありますか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.