タグ付けされた質問 「pac-learning」

20
二つの文化:統計と機械学習?
昨年、私は「統計対機械学習、戦い!」というタイトルのブレンダン・オコナーのブログ記事を読みました。2つのフィールドの違いの一部について説明しました。 アンドリュー・ゲルマンはこれに好意的に反応しました: サイモン・ブロンバーグ: Rの福袋から:挑発的に言い換えると、「機械学習は統計からモデルと仮定のチェックを差し引いたものです」。-ブライアンD.リプリー(機械学習と統計の違いについて)useR!2004年、ウィーン(2004年5月):-)季節のご挨拶! アンドリュー・ゲルマン: その場合、モデルと仮定のチェックをより頻繁に取り除く必要があります。そうすれば、機械学習の人々が解決できる問題のいくつかを解決できるかもしれませんが、できません! ありました:「二つの文化の統計モデリング」紙統計学者は、データモデリングに過度に依存し、その機械学習技術が代わりに頼ることで進展していると主張し、2001年にレオ・ブレイマンによって予測精度のモデルは。 これらの批判に応えて、統計分野は過去10年間で変化しましたか?か二つの文化がまだ存在や統計は、ニューラルネットワークやサポートベクターマシンなどの機械学習技術を包含するように成長していますか?

3
「弱い学習者」とはどういう意味ですか?
「弱い学習者」という語句の意味を教えてください。それは弱い仮説であると思われますか?弱い学習者と弱い分類器の関係について混乱しています。両方とも同じですか、それとも何らかの違いがありますか? AdaBoostのアルゴリズムでは、T=10。それはどういう意味ですか?なぜ選択するのT=10ですか?

4
数学者のための機械学習の紹介
ある意味では、これはmath.stackexchangeからの私のクロスポストであり、このサイトは幅広い読者を提供するかもしれないと感じています。 機械学習の数学的な紹介を探しています。特に、見つけることができる多くの文献は比較的不正確であり、多くのページがコンテンツなしで費やされています。 しかし、そのような文献から始めて、パターン認識に関する司教の本であり、最後にスモラの本であるアンドリュー・ンのコースラ・コースを発見しました。残念ながら、Smolaの本はドラフト状態のみです。Smolaの本には証拠もあり、それは私にとって魅力的です。ビショップの本はすでにかなり良いが、ある程度の厳密さが欠けている。 要するに、私はスモーラのような本を探しています。つまり、可能な限り正確で厳密であり、数学的な背景を使用しています(もちろん短い紹介でも大丈夫です)。 推奨事項はありますか?

6
パラメーターを推定するための機械学習の「基本的な」アイデアとは何ですか?
パラメーターを推定するための統計の「基本的な」考え方は、最尤法です。機械学習の対応するアイデアは何だろうと思っています。 Qn 1.パラメーターを推定するための機械学習の「基本的な」アイデアは、「損失関数」であると言ってもいいでしょうか。 [注:機械学習アルゴリズムは損失関数を最適化することが多いため、上記の質問が印象的です。] Qn 2:統計と機械学習のギャップを埋めようとする文献はありますか? [注:おそらく、損失関数を最尤法に関連付けることによって。(たとえば、OLSは正規分布エラーなどの最尤と同等です)]

1
エラーが正規分布していると仮定するのはなぜですか?
エラーをモデル化するときに、なぜガウスの仮定を使用するのでしょうか。でスタンフォード大学のMLコース、教授ンは2つの方法で、基本的にそれを説明します。 数学的に便利です。(最小二乗法に関連しており、疑似逆行列で簡単に解決できます) 中心極限定理により、プロセスに影響を与える多くの潜在的な事実があり、これらの個々の誤差の合計は、平均がゼロの正規分布のように振る舞う傾向があると仮定できます。実際にはそうです。 私は実際に第二部に興味があります。私が知る限り、中央極限定理はiidサンプルに対して機能しますが、基になるサンプルがiidであることを保証することはできません。 誤差のガウス仮定に関する考えはありますか?

2
ニューラルネットワークの複雑さを測定するためのVC次元の代替手段は何ですか?
ニューラルネットワークの複雑さを測定するいくつかの基本的な方法に出会いました。 素朴で非公式:ニューロン、隠れニューロン、層、または隠れ層の数を数える VC次元(Eduardo D. Sontag [1998]「ニューラルネットワークのVC次元」[ pdf ]) との等価性によるTC0dTCd0TC^0_d粗化および漸近計算の複雑さの尺度。 他の選択肢はありますか? 推奨されます: 複雑さのメトリックを使用して、同じスケールで異なるパラダイムからのニューラルネットワークを測定できる場合(バックプロップ、ダイナミクスニューラルネット、カスケード相関など)。たとえば、ネットワーク上のさまざまなタイプ(またはニューラルネットワーク以外のもの)でVC次元を使用できますが、ニューロンの数は、活性化関数、信号(基本和とスパイク)、およびその他の非常に特定のモデル間でのみ役立ちますネットワークのプロパティは同じです。 ネットワークで学習可能な機能の複雑さの標準的な尺度にうまく対応している場合 特定のネットワークでメトリックを簡単に計算できる場合(ただし、最後のネットワークは必須ではありません。) ノート この質問は、CogSci.SEに関するより一般的な質問に基づいています。

2
PAC学習理論とはどういう意味ですか?
私は機械学習が初めてです。私は機械学習(スタンフォード大学)のコースを勉強していますが、この理論が何を意味するのか、そしてその有用性は何なのか理解できませんでした。誰かが私のためにこの理論を詳述できるかどうか疑問に思っています。 この理論はこの方程式に基づいています。


2
データのROC曲線を計算する
そのため、ハミング距離を使用して生体認証特性から個人を認証しようとしている16のトライアルがあります。しきい値は3.5に設定されています。私のデータは以下であり、トライアル1のみが真陽性です。 Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 7 0.47 8 0.32 9 0.39 10 0.45 11 0.42 12 0.37 13 0.66 14 0.39 15 0.44 16 0.39 私の混乱のポイントは、このデータからROC曲線(FPR対TPR OR FAR対FRR)を作成する方法が本当にわからないということです。どちらでもかまいませんが、どうやって計算するのか混乱しています。任意の助けいただければ幸いです。
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.