タグ付けされた質問 「references」

特定の主題に関する外部参照(本、論文など)を求める質問。さらに、常により具体的なタグを使用してください。

2
線形回帰で標準化された説明変数を使用するタイミングと方法
線形回帰について2つの簡単な質問があります。 説明変数を標準化することが推奨されるのはいつですか? 標準化された値で推定が実行されたら、新しい値でどのように予測できますか(新しい値を標準化する方法)。 いくつかの参考文献が役立ちます。

11
オープンソースの統計教科書?
Free統計教科書の質問などの統計教科書についての質問がいくつかありました。しかし、たとえば、Creative Commonsライセンスを持っているオープンソースの教科書を探しています。その理由は、他のドメインの教材では、基本的な統計に関するテキストを含める必要があるためです。この場合、既存の素材を書き換えるのではなく、その素材を再利用することは興味深いでしょう。 したがって、統計(およびおそらく機械学習)に関するオープンソースの教科書は何ですか?

2
確率的勾配降下法を発明したのは誰ですか?
勾配降下法と確率勾配降下法の歴史を理解しようとしています。グラディエントディセントは1847年にコーシーで発明されました。システムエクイテーションシステムの同時解法により作成されました。pp。536–538詳細については、こちらを参照してください。 それ以来、勾配降下法は開発を続け、私はそれらの歴史に精通していません。特に、確率的勾配降下法の発明に興味があります。 学術論文で歓迎される以上に使用できるリファレンス。


14
生存分析の参考文献
生存分析について学ぶための良い本/チュートリアルを探しています。Rで生存分析を行う際の参考資料にも興味があります。
33 r  survival  references 


2
部分最小二乗回帰の背後にある理論
SVDとPCAを理解している人のために、部分最小二乗回帰(オンラインで入手可能)の背後にある理論の説明をお勧めできますか?私は多くのソースをオンラインで見てきましたが、厳密さとアクセシビリティの適切な組み合わせを備えたものは見つかりませんでした。 統計的学習の要素を調べました。これは、相互検証、QLS(部分最小二乗法)回帰とは何か、OLSとはどう違うのかという質問に対するコメントで提案されました。、しかし、私はこの参照がトピックの正義を行うとは思わない(そうするのは簡単すぎて、主題に関する多くの理論を提供しない)。私が読んだから、PLS、予測変数の線形結合を利用その最大化共分散制約を受けるとz_i ^ Tz_j = 0であれば、私\ NEQ j、ここで\ varphi_iz私= Xφ私zi=Xφiz_i=X \varphi_iyTz私yTzi y^Tz_i Z T I Z 、J = 0 、I ≠ jは、φ I∥はφ私∥ = 1‖φi‖=1\|\varphi_i\|=1zT私zj= 0ziTzj=0z_i^Tz_j=0i ≠ ji≠ji \neq jφ私φi\varphi_i共分散を最大化する順序で繰り返し選択されます。しかし、私が読んだ後でも、それが本当かどうか、もしそうなら、メソッドがどのように実行されるかはまだわかりません。

5
モデル選択のAICガイドライン
私の理解では、AICよりもpar約をより重視するということなので、私は通常BICを使用します。ただし、私は今、より包括的なアプローチを使用することを決定し、AICも使用したいと考えています。Raftery(1995)がBICの違いに関する優れたガイドラインを提示したことを知っています:0-2は弱い、2-4は1つのモデルが優れているという肯定的な証拠などです。 私は教科書を調べましたが、AICでは奇妙に見えます(差が大きいほど弱く、AICの差が小さいほど1つのモデルが優れているように見えます)。これは、私が教えられたことを知っていることに反します。私の理解では、AICを低くしたいということです。 RafteryのガイドラインがAICにも適用されるかどうか、またはあるモデルと別のモデルの「証拠の強さ」に関するガイドラインをどこで引用できるかを知っていますか? そして、はい、カットオフは素晴らしいものではありません(私はそれらをいらいらさせます)が、それらは異なる種類の証拠を比較するときに役立ちます。


1
相互検証の誤用(最適なハイパーパラメーター値のパフォーマンスの報告)
最近、特定のデータセットでk-NN分類器を使用することを提案する論文に出会いました。著者は、利用可能なすべてのデータサンプルを使用して、さまざまなk値のk分割交差検証を実行し、最適なハイパーパラメーター構成の交差検証結果を報告しました。 私の知る限り、この結果には偏りがあり、ハイパーパラメーター最適化の実行に使用されないサンプルの精度推定値を取得するために、別のテストセットを保持する必要がありました。 私は正しいですか?この相互検証の誤用について説明した参考文献(できれば研究論文)を提供してください。

8
データマイニングと機械学習の準備として、どのような数学の科目を提案しますか?
私は、データマイニングと機械学習の学習に備えるために、自主的な数学のカリキュラムをまとめようとしています。これは、Andrew Ngの機械学習クラスをCourseraで開始し、先に進む前に数学のスキルを向上させる必要があると感じたことがきっかけです。私は少し前に大学を卒業したので、私の代数と統計(特に政治学/心理学のクラスから)はさびています。 スレッドの回答数学の強力なバックグラウンドはMLの必須条件ですか?機械学習に直接関連する書籍またはクラスのみを提案します。私はすでにそれらのクラスと本のいくつかを調べましたが、どの数学の研究対象かを正確に知りません(たとえば:数学のどの分野が「コスト関数を最小化する」方程式を導き出しますか?)。提案されているもう1つのスレッド(スキルとコースワークはデータアナリストである必要があります)は、データの分析に必要なスキルの幅広いカテゴリのみに言及しています。私はまだ数学の学位を持っていないので、スレッド「数学者のための統計入門」は当てはまりません。同様のスレッド数学者は、同等の知識を質の高い統計学の程度に望んでいます 統計書の信じられないほどのリストを持っていますが、再び、私は代数のさびた思い出から数学を始めて、そこから上に向かっているのを見ています。 それで、機械学習とデータマイニングで働く人にとって、仕事をするために数学のどの分野が不可欠だと思いますか?データマイニングと機械学習の準備として、どのような数学科目を、どのような順序で提案しますか?ここに私がこれまでに持っているリストと順序があります: 代数 事前計算 微積分 線形代数 確率 統計(ここには多くの異なるサブフィールドがありますが、それらをどのように分割するかわかりません) データマイニングと機械学習については、現在の仕事を通じて、ウェブサイト/アプリのアクティビティ、顧客/サブスクリプショントランザクション、および不動産データ(静的および時系列の両方)の記録にアクセスできます。これらのデータセットにデータマイニングと機械学習を適用したいと考えています。 ありがとうございました! 編集: 後世のために、Geoffrey Gordon / Alex Smolaの機械学習入門で役立つ数学の自己評価を共有したかった CMUのクラスでです。

1
ロジスティック回帰からの適合値の標準誤差はどのように計算されますか?
ロジスティック回帰モデルから近似値を予測する場合、標準誤差はどのように計算されますか?つまり、フィッシャーの情報マトリックスを含む係数ではなく、近似値についてです。 私はのみで数を取得する方法を見つけたR(例えば、ここでは R-ヘルプ上、またはここにスタックオーバーフロー上)が、私は式を見つけることができません。 pred <- predict(y.glm, newdata= something, se.fit=TRUE) (できれば大学のウェブサイトで)オンラインソースを提供できれば、それは素晴らしいことです。


11
統計ポッドキャスト
統計分析に関連するポッドキャストとは何ですか?ITunes Uでの大学の講義の録音をいくつか見つけましたが、統計ポッドキャストについては知りません。私が知っている最も近いものは、オペレーションズリサーチポッドキャストThe Science of Betterです。統計的な問題に触れますが、特に統計的なショーではありません。
29 references 


弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.