タグ付けされた質問 「references」

特定の主題に関する外部参照(本、論文など)を求める質問。さらに、常により具体的なタグを使用してください。

4
統計的直観/データセンス
私は2年生の学部生で数学を学んでおり、数学の能力と統計の能力の違いについて、教授の一人とかなり話していました。彼が提起した重要な違いの1つは「データセンス」であり、これは私が非公式に「常識抑制」と呼ぶ一連の範囲内で動作しながら技術的能力の組み合わせとして説明した。多くの理論。これは私が話していた例であり、Gowersのブログに掲載されました。 英国のいくつかの地域で、警察は交通事故が発生した場所に関する統計を収集し、事故のブラックスポットを特定し、そこにスピードカメラを設置し、さらに統計を収集しました。これらのブラックスポットでの事故の数は、スピードカメラが設置された後に減少する明確な傾向がありました。これは、スピードカメラが交通安全を改善することを最終的に示していますか? 交渉ゲームでランダム化された戦略について議論したのと同じ人は、基本的にこの質問に対する答えをすでに知っていました。極端なケースを選択した場合、実験を再度実行すると極端なケースが少なくなると予想されるため、彼はノーと言いました。言うことはこれ以上ないので、私はこの質問からすぐに進むことにしました。しかし、私は自分が持っていた計画について人々に話しました。それは偽のテレパシー実験を行うことでした。私は彼らに20回のコイン投げの結果を推測させ、テレパシーでそれらにビームを当てようとします。それから、私は3人の最高のパフォーマーと3人の最悪のプレイヤーを選択し、コインをもう一度投げます。パフォーマンスが改善されることが期待され、テレパシーとは何の関係もないことを人々は簡単に見ることができました。 私が尋ねているのは、この「データセンス」について、主題に関する出版物が存在する場合、または他のユーザーがこのスキルを開発するのに役立つとわかった場合の詳細を知る方法です。この質問を明確にする必要がある場合は申し訳ありません。もしそうなら、質問を投稿してください!ありがとう。

1
遠隔監視:監視あり、半監視、またはその両方?
「遠隔監視」とは、弱くラベル付けされたトレーニングセットが与えられると分類器が学習される学習スキームです(トレーニングデータはヒューリスティック/ルールに基づいて自動的にラベル付けされます)。ラベル付きデータがヒューリスティック/自動ラベル付けされている場合、教師あり学習と半教師あり学習の両方にこのような「遠隔監視」を含めることができると思います。ただし、このページでは、「遠隔監視」は「半監視学習」と定義されます(つまり、「半監視」に限定されます)。 私の質問は、「遠隔監視」はもっぱら準監視を指しているのでしょうか?私の意見では、教師あり学習と半教師あり学習の両方に適用できます。信頼できる参照があれば提供してください。

1
箱ひげ図の歴史はどのようなもので、「箱ひげ」のデザインはどのように進化しましたか?
多くの情報源は、に古典的な「ボックスプロット」デザインとデートジョン・テューキーデザインはで、それ以来、比較的静的に宿泊しているようだと、1970年の彼の「概略的なプロット」エドワード・タフトのカットダウンボックスプロットのバージョン間、上のキャッチに失敗しますバイオリンプロット -ボックスプロットのより有益なバリエーション-はあまり人気がありません。10パーセンタイルと90パーセンタイルまで伸びるというクリーブランドの提案には、支持者がいます。Cox(2009)を参照してくださいが、これは標準ではありません。 Hadley WickhamとLisa Stryjewskiは、箱ひげ図の歴史に関する未発表の論文を書きましたが、箱ひげ図の歴史的な先駆者をカバーしていないようです。 それでは、現在のユビキタスな「箱とひげ」のプロットはどのようにして生まれたのでしょうか?どのようなデータの視覚化から発展し、それらの初期の設計には大きな利点がありましたか?また、なぜそれらがTukeyのスキームによる使用で非常に包括的に食われているように見えるのですか?図解された答えはボーナスになりますが、ウィッカムやストリエフスキーよりも歴史的に深く掘り下げた参考文献に向けられると便利です。 参照資料 ニュージャージー州コックス(2009)。Speaking Stata:ボックスプロットの作成と変更。Stata Journal、9(3)、478。 Wickham、H.およびStryjewski、L.(2011)。40年の箱ひげ図。http://vita.had.co.nz/papers/boxplots.pdf

4
プラス1標準偏差が最大値を超えることを意味できますか?
最小0と最大94.33のサンプルの平均74.10と標準偏差33.44があります。 私の教授は、平均プラス1つの標準偏差が最大値を超える方法を尋ねます。 私は彼女にこれについて多くの例を示しましたが、彼女は理解していません。私は彼女を示すためにいくつかの参照が必要です。これについては特に統計書のどの章や段落でもかまいません。

1
LDA決定境界の計算とグラフ化
The Statistics Learning of Elementsの決定境界を持つLDA(線形判別分析)プロットを見ました。 データは低次元の部分空間に投影されることを理解しています。ただし、元の次元で決定境界を取得する方法を知りたいので、決定境界を低次元のサブスペースに投影できます(上の画像の黒い線のように)。 元の(より高い)次元の決定境界を計算するために使用できる式はありますか?はいの場合、この式にはどのような入力が必要ですか?

3
モーメント生成関数が確率分布を一意に決定することの証明
Wackerly et alのテキストは、この定理「とそれぞれランダム変数XとYのモーメント生成関数を示している。両方のモーメント生成関数が存在し、 tのすべての値に対して、XとYは同じ確率分布を持ちます。」テキストの範囲を超えているという証拠はありません。Scheaffer Youngにも証明のない同じ定理があります。Casellaのコピーはありませんが、Googleブック検索では定理を見つけることができなかったようです。m y(t )m x(t )= m y(t )mバツ(t )mバツ(t)m_x(t)my(t )my(t)m_y(t)mバツ(t )= my(t )mバツ(t)=my(t)m_x(t) = m_y(t) Gutのテキストは証明の概要を持っているように見えますが、「よく知られている結果」を参照せず、証拠も提供されていない別の結果を知る必要もあります。 誰が最初にこれを証明したか、そしてその証明がどこでもオンラインで利用可能かどうかを知っていますか?それ以外の場合、この証明の詳細をどのように記入しますか? 私が聞かれなかった場合、これは宿題の質問ではありませんが、これはおそらく誰かの宿題であると想像できます。ワッカーリーのテキストに基づいてコースシーケンスを取りましたが、しばらくの間、この証明について疑問に思っていました。それで、私はそれがちょうど尋ねる時間であると思いました。

2
機能エンジニアリングのチュートリアル
すべての人に知られているように、機能工学は機械学習にとって非常に重要ですが、この分野に関連する資料はほとんど見つかりませんでした。Kaggleのいくつかのコンテストに参加しましたが、場合によっては、優れた機能が優れた分類器よりも重要であると考えています。誰かが機能エンジニアリングに関するチュートリアルを知っていますか、それともこの純粋な経験ですか?

3
ベータ分布密度関数に-1があるのはなぜですか?
ベータ分布は2つのパラメーター化(またはここ)で表示されます F (X )α X α(1 - X )βf(x)∝xα(1−x)β(1) f(x) \propto x^{\alpha} (1-x)^{\beta} \tag{1} または、より一般的に使用されると思われるもの F (X )α X α - 1(1 - X )β - 1f(x)∝xα−1(1−x)β−1(2) f(x) \propto x^{\alpha-1} (1-x)^{\beta-1} \tag{2} しかし、なぜ2番目の式に「− 1−1-1」があるのですか? 最初の定式化は直観的に二項分布に直接対応するように思われます g (k )∝ p k(1 − p )n − kg(k)∝pk(1−p)n−k(3) g(k) \propto p^k (1-p)^{n-k} \tag{3} …

5
ベイジアン思考の背後にある哲学についての良い本は何ですか?
ベイジアン哲学、主観主義者と客観主義者の対比、ベイジアン統計の知識の状態としての確率の見解などについての良い本とは何ですか?たぶんサベージの本? 最初は、Berger(1986)はうまくいくと思っていましたが、私が探しているものではありません。そのような本を検索しても、私が探している結果には至りません。

9
参照リクエスト:一般化線形モデル
Generalized Linear Modelsに関する中級レベルの入門書を探しています。理想的には、モデルの背後にある理論に加えて、アプリケーションやサンプルをRまたは他のプログラミング言語に含めたいと思います-SASも人気のある選択肢だと聞きます。私は自分でそれを勉強するつもりですので、それがそれ自身の演習への答えを提供するならば、それは役立つでしょう。 あなたは、私が微積分学と確率論の伝統的な一年のコースを取ったと仮定することができます。また、回帰分析の基本にも精通しています。

6
さまざまな種類のエントロピーの優れた紹介
サンプルエントロピーやシャノンエントロピーなどのさまざまな種類のエントロピーと、それらの長所と短所を説明する本またはオンラインリソースを探しています。誰かが私を正しい方向に向けることができますか?

3
準最尤推定(QMLE)の背後にあるアイデアと直感
質問:準最尤推定(QMLE、擬似最尤推定、PMLEとも呼ばれます)の背後にある考え方と直感は何ですか?実際の誤差分布が想定誤差分布と一致しない場合、推定器が機能する理由は何ですか? QMLE のWikipediaサイトは素晴らしい(簡潔で、直感的、要点)ですが、もっと直感的で詳細な、おそらくはイラストを使用することもできます。他の参考文献は大歓迎です。(私はQMLE上に材料を探してかなりの数の計量経済学の教科書の上に行くのを覚えて、そして私の驚きに、QMLEは、1つまたはそれらの2で覆われていた、例えばWooldridge 「クロスセクションとパネルデータの計量経済分析」第13章(2010)セクション11、ページ502-517。)


3
構造計量経済学の入門テキスト
近年、縮小型計量経済学と比較した計量経済学への構造的アプローチがより一般的になりました。これには、対象のパラメーターを推定するための理論経済モデルと統計の緊密な組み合わせが含まれます。データおよび統計的手法を使用する方法でより理論的な構造を課すことは、ガイダンスを提供することを意味し、場合によっては縮小形式の手法では容易に推定できないパラメーターを明らかにすることさえできます。非計量経済学者にとっても、シミュレーションとサンプリングは構造推定の重要な部分になる可能性があり、この手法は他の社会科学にも十分に適用できるため、これは興味深い可能性があります。 統計学の分野としてのこの計量経済学の分野には、これまでに入門的な教科書はないようです。Choo and Shum(2013)のStructural Econometric ModelsやReiss and Wolakの調査の章のような、より高度な資料のみを見つけました。 誰かが、構造計量経済学の入門書となる一連の講義や、おそらく私がまだ見つけていない本にさえ私を向けることができますか?理想的には、コードや理解を深めるためにこれらの例を複製する方法に関するガイドなど、さまざまなアプローチの例に基づいています。 特に産業組織に関するいくつかの研究論文を知っている 状態依存のモデリング(Rust、1987) 需要予測(Berry、1994; Berry、Levinson、and Pakes、1995) 生産性の推定(Olley and Pakes、1996) 市場力の推定(Nevo、2005; Sovinsky、2008) しかし、それらのほとんどは追跡が困難です。だから誰かがもっと穏やかな紹介を知っているなら、これは大きな助けになるでしょう。

4
統計の数学的基礎に関する優れたリソース(オンラインまたは書籍)
私が質問する前に、私が探しているリソースの種類をよりよく理解できるように、統計について知っていることについて少し背景を説明しましょう。 私は心理学の大学院生なので、ほぼ毎日統計を使用しています。今では、一般的な構造方程式モデリングフレームワークに実装されているため、かなり幅広い技術に精通しています。しかし、私のトレーニングはこれらのテクニックの使用と結果の解釈についてでした-私はこれらのテクニックの正式な数学的基礎についてあまり知識がありません。 しかし、ますます統計から適切な論文を読む必要がありました。これらの論文は、線形代数など、私があまり知らない数学的概念の実用的な知識を前提としていることが多いことがわかりました。したがって、私が教えられてきたツールを盲目的に使用する以上のことをしたい場合、統計の数学的基礎のいくつかを学ぶことは有益だと確信しました。 したがって、2つの関連する質問があります。 統計の数学的基礎を磨くかどうかを知るために、どのような数学的手法が役立つでしょうか?私は線形代数にかなり頻繁に遭遇し、確率理論について学ぶことは役立つと確信していますが、私が学ぶのに役立つ数学の他の分野はありますか? 統計の数学的基礎についてもっと知りたい人として、どのリソース(オンラインまたは書籍形式)をお勧めできますか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.