タグ付けされた質問 「references」

特定の主題に関する外部参照(本、論文など)を求める質問。さらに、常により具体的なタグを使用してください。

17
お気に入りのデータ視覚化ブログは何ですか?
データの視覚化に関する最高のブログは何ですか? この質問は非常に主観的であるため、コミュニティWikiにしています。各回答を1つのリンクに制限してください。 提案された回答については、次の基準に注意してください。 [A]このような質問に対する受け入れられる答え...適切な説明と理由付けを提供する必要があります。単なるハイパーリンクではできません。... [A]将来の返信は... [これら]の基準を満たす必要があります。そうでない場合、コメントなしで削除されます。

7
経験豊富な開発者向けの統計情報をどこから始めるか
2015年の前半に、機械学習のコースコースを受講しました(Andrew Ng、素晴らしいコースによる)。機械学習の基礎を学びました(線形回帰、ロジスティック回帰、SVM、ニューラルネットワーク...) また、私は10年間開発者でしたので、新しいプログラミング言語を習得しても問題はありません。 最近、機械学習アルゴリズムを実装するためにRの学習を開始しました。 しかし、学習を続けたい場合は統計のより正式な知識が必要であり、現在は非公式の知識が必要であることに気付きましたが、たとえば、いくつかの線形モデルのどれを適切に決定することができなかったのかより良いでしょう(通常、私はR平方を使用する傾向がありますが、明らかにそれはあまり良い考えではありません)。 だから私には統計の基礎を学ぶ必要があることはかなり明白です(私は大学でそれを勉強しましたが、ほとんどのことを忘れました)、どこで学ぶべきか、私は本当に完全に包括的なコースを必要としないことに注意してください1か月以内に十分な知識が得られるので、熱心になり、さらに学ぶことができます:)。 これまでに「涙のない統計」について読んだことがありますか?

6
ベイジアン統計チュートリアル
ベイジアン統計で速度を上げようとしています。私は少し統計の背景(STAT 101)を持っていますが、あまり多くはありません-事前、事後、および可能性を理解できると思います:D。 まだベイジアンの教科書を読みたくありません。私はすぐに私を立ち上げるソース(ウェブサイトが望ましい)から読みたいです。このようなものですが、詳細があります。 何かアドバイス?

3
対数変換された予測子および/または応答の解釈
従属変数のみ、従属変数と独立変数の両方、または独立変数のみが対数変換されるかどうかの解釈に違いがあるのか​​と思います。 の場合を考えます log(DV) = Intercept + B1*IV + Error IVはパーセントの増加として解釈できますが、 log(DV) = Intercept + B1*log(IV) + Error または私が持っているとき DV = Intercept + B1*log(IV) + Error ?
46 regression  data-transformation  interpretation  regression-coefficients  logarithm  r  dataset  stata  hypothesis-testing  contingency-tables  hypothesis-testing  statistical-significance  standard-deviation  unbiased-estimator  t-distribution  r  functional-data-analysis  maximum-likelihood  bootstrap  regression  change-point  regression  sas  hypothesis-testing  bayesian  randomness  predictive-models  nonparametric  terminology  parametric  correlation  effect-size  loess  mean  pdf  quantile-function  bioinformatics  regression  terminology  r-squared  pdf  maximum  multivariate-analysis  references  data-visualization  r  pca  r  mixed-model  lme4-nlme  distributions  probability  bayesian  prior  anova  chi-squared  binomial  generalized-linear-model  anova  repeated-measures  t-test  post-hoc  clustering  variance  probability  hypothesis-testing  references  binomial  profile-likelihood  self-study  excel  data-transformation  skewness  distributions  statistical-significance  econometrics  spatial  r  regression  anova  spss  linear-model 

2
サポートベクターマシン用の線形カーネルと非線形カーネル?
サポートベクターマシンを使用する場合、RBFのような線形カーネルと非線形カーネルの選択に関するガイドラインはありますか?特徴の数が多くなると、非線形カーネルはうまく機能しない傾向があると聞いたことがあります。この問題に関する参照はありますか?

4
統計モデルのチートシート
私は、何らかの情報をリストする統計モデル「チートシート」があるかどうか疑問に思っていました。 モデルを使用する場合 モデルを使用しない場合 必須およびオプションの入力 期待される出力 モデルはさまざまな分野(ポリシー、バイオ、エンジニアリング、製造など)でテストされていますか? 実践や研究で受け入れられていますか? 予想される変動/精度/精度 注意事項 拡張性 廃止されたモデル、使用しない、または使用しない など。 以前、さまざまなWebサイトで階層を見てきました。また、さまざまな教科書の単純なモデルのチートシートもいくつか見ました。ただし、さまざまなタイプの分析と理論に基づいたさまざまなタイプのモデルを含む、より大きなモデルがあれば便利です。

7
初心者向けのニューラルネットワークリファレンス(教科書、オンラインコース)
ニューラルネットワークを学びたいです。私は計算言語学者です。統計的な機械学習のアプローチを知っており、Pythonでコーディングできます。 私はその概念から始め、計算言語学の観点から役に立つかもしれない1つまたは2つの人気のあるモデルを知っています。 参考のためにWebをブラウズし、いくつかの本や資料を見つけました。 リプリー、ブライアンD.(1996)パターン認識とニューラルネットワーク、ケンブリッジ Bishop、CM(1995)パターン認識のためのニューラルネットワーク、オックスフォード:オックスフォード大学出版局。 いくつかのリンクなど、この論文、これらのコースノート(トロント大学の心理学科)、これらのコースノート(ウィスコンシンコンピュータサイエンスの大学)と、このスライドショー(Facebookの研究)。 Courseraコースは、だれかが関連する何かを知っている場合、一般的に素晴らしいです。私は明快な言語と豊富な例のある資料を好みます。

9
クラスで例を与えるための小さな(実際の)データセット?
入門レベルのクラスを教えるとき、私が知っている教師は、彼らが教えている方法を例示するために、いくつかの数字と物語を発明する傾向があります。 私が好むのは、実数で実話を語ることです。ただし、これらのストーリーは、手動計算を可能にする非常に小さなデータセットに関連付ける必要があります。 このようなデータセットに関する提案は大歓迎です。 小さなデータセットのサンプルトピック: 相関/回帰(基本) ANOVA(1/2の方法) z / tテスト-1対2の非ペアのサンプル 比率の比較-ツーウェイ/マルチウェイテーブル

20
数学や確率を含む良い映画はありますか?
数学、確率などを含む良い映画をいくつか提案できますか?1つの例は21です。また、アルゴリズム(テキスト復号化など)を含む映画にも興味があります。一般に、有名な科学理論はあるがサイエンスフィクションやドキュメンタリーはない「オタク」映画。前もって感謝します!

4
30を十分な大きさのサンプルサイズとして使用することをサポートするには、どの参考文献を引用する必要がありますか
少なくとも30単位のサンプルサイズが「大きなサンプル」と見なされることを何度も読んだり聞いたりしました(通常、CLTにより平均値の正規性の仮定が成り立つ...)。したがって、私の実験では、通常30ユニットのサンプルを生成します。サンプルサイズ30を使用する際に引用する必要がある参考資料を教えてください。


3
ランダムフォレストと極端にランダム化されたツリーの違い
ランダムフォレストと極端にランダム化されたツリーは、ランダムフォレスト内のツリーの分割が決定論的であるという意味で異なりますが、極端にランダム化されたツリーの場合はランダムです(より正確には、次の分割が最適な分割です現在のツリーの選択された変数のランダムな均一な分割の間で)。しかし、私はさまざまな状況でのこの異なる分割の影響を完全には理解していません。 彼らはバイアス/分散の観点からどのように比較しますか? 無関係な変数が存在する場合、それらはどのように比較されますか? 相関変数の存在下でどのように比較しますか?

11
統計や機械学習に関する人気の高い科学の本はありますか?
本物の科学だけでなく、現在の理論の背後にある歴史と理由を扱った非常に優れた人気の科学書がたくさんありますが、読むことは非常に楽しいままです。たとえば、ジェームズ・グレイクによる「カオス」(カオス、フラクタル、非線形性)、スティーブン・ホーキングによる「時間の短い歴史」(物理学、宇宙の起源、時間、ブラックホール)、リチャード・ドーキンスによる「利己的な遺伝子」 (進化と自然選択)。これらの本の中には、議論を提示するもの(Dawkins)と提示しないもの(Gleick)があります。しかし、それらはすべて、綿密な科学教育を受けていない私たちにとって、そうでなければ難しい概念を理解しやすくするのに役立ちます。 主に統計や機械学習に焦点を当てた本はありますか? 各本がカバーする内容の要約を含めてください。

4
数学の強力なバックグラウンドはMLの必須条件ですか?
私は自分のスキルセットを向上させたいと考え始めており、私は常に機械学習に魅了されてきました。しかし、6年前にこれを追求する代わりに、コンピューターサイエンスとはまったく関係のない学位を取ることにしました。 私は約8〜10年間ソフトウェアとアプリケーションを開発してきたので、私は良いハンドルを持っていますが、機械学習/確率/統計学の数学の側面に侵入することはできないようです。 私は学習教材に目を向けると、最初のページには混乱を招き、すぐに学習に障害を引き起こすものが含まれている可能性があります。 数学の強力なバックグラウンドはMLの必須条件ですか?MLを続行する前に、数学の空白を埋めてみる必要がありますか?自己学習は、ハードコンピュータサイエンスのバックグラウンドがなくても、開発者だけで本当に機能しますか? 関連する質問: 統計学習の要素の前に読むための本?

10
経済学データの最も有用な情報源は何ですか?
経済学で研究を行う場合、実際のデータに関する理論的結論を検証する必要が頻繁にあります。使用および引用する信頼できるデータソースは何ですか?主に、GDP、人口、CPI、PPIなどのさまざまな統計データを提供するソースに興味があります。 編集: このスレッドに表示されるリンクの集合と、私が思い出したいくつかのリンクを次に示します。 汎用: - トムソン・ロイター・データストリーム(非常に包括的な、無料ではない) - 世界銀行のデータ - 国連データ - IMFデータ - ADBデータ - WTOの統計 - Infochimps -大規模な公共および民間(商用)データソースの多種多様のリソース-プラス彼らAPI - Freebaseは(今Googleが所有) -オープンデータリソース - DBpediaの - WikipediaのAPIを使用してのアプローチ - ウィキペディアAPI-または直接アクセスウィキペディア直接行く - CIAワールド・ファクトブック - OECD統計 - ウルフラムアルファ -知識の検索エンジン - Zanran -数値&統計検索エンジン - 政治・社会調査のための大学間コンソーシアム 国家: - 英国政府データプロジェクト - 米国政府データプロジェクト - 米国FRED:連邦準備制度経済データ - 米国労働統計局 - …
37 references 

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.