タグ付けされた質問 「history」

統計の歴史についての質問。

6
どのようにして正規分布を発見できましたか?
あなたがすることができ、正規分布の一次微分は何だったその派生を再現し、またその歴史的文脈の中でそれを説明しますか? 人類が正規分布を忘れた場合、私がそれを再発見する最も可能性の高い方法は何ですか?また、最も可能性の高い派生物は何ですか?最初の派生は、二項分布などの基本的な離散確率分布を計算する高速な方法を見つけようとする副産物として来たに違いないと思います。あれは正しいですか?

1
Rの混合モデル式でのランダム効果の(1 | id)などのウィルキンソンスタイル表記の起源
次のようなRのモデル式 y ~ x + a*b + c:d は、いわゆるウィルキンソン表記法に基づいています:Wilkinson and Rogers 1973、Symbolic Description of Factorial Models for Variance Analysis。 このホワイトペーパーでは、混合モデル(当時は存在しなかった可能性がある)の表記については説明しませんでした。それでlme4、Rで使用される混合モデルの式とRの関連パッケージはどこでしたか y ~ x + a*b + c:d + (1|school) + (a*b||town) から来る?初めて紹介したのはいつですか?彼らのために「ウィルキンソン記法」などの合意された用語はありますか?具体的には次のような用語を参照しています (model formula | grouping variable) (model formula || grouping variable)

1
Egon Pearson以外の誰かがGossetの1904年の論文にアクセスしましたか?
エゴン・ピアソン以外の誰もがウィリアム・シーリー・ゴセットの1904年の報告書「醸造所の仕事への「誤りの法則」の適用」にアクセスしましたか?私はそれがギネスの財産だと思いますが、歴史的な重要性を考えると、誰かがそれを手に入れる方法を知っていたら、それは非常に興味深い読み物だったでしょう。

2
'69年のデータから学ぶ一般的な最先端技術
私は、ニューラルネットワークにとって非常に重要な1969年の有名なミンスキーとペーパーの本「パーセプトロン」の文脈を理解しようとしています。 私が知る限り、パーセプトロンを除いて、他の一般的な教師あり学習アルゴリズムはまだありませんでした。決定木は実際には70年代後半にのみ有用になり始め、ランダムフォレストとSVMは90年代です。ジャックナイフ法はすでに知られているようですが、k-cross validation(70s)やbootstrap(1979?)ではありません。 ウィキペディアによると、ハイブリッド理論を説明する最初の試みはすでに40年代にあったにもかかわらず、ネイマンピアソンとフィッシャーの古典的な統計フレームワークは50年代にはまだ意見の相違がありました。 したがって、私の質問:データから予測する一般的な問題を解決するための最先端の方法は何でしたか?

2
なぜ「標準」偏差と呼ばれるのですか?
私は簡単な、そしておそらく些細な質問を持っています:なぜ標準偏差はそれだけで「標準」と呼ばれるのですか?それは、分散に関してデータセットと結果の比較を標準化するためですか? Stack Exchangeでの検索ではこの質問が見つかりませんし、用語の語源での Google検索でも多くの価値がありません。

4
統計情報に基づいて間違った決定が行われた戦争の物語?
統計は応用科学であると言うのは公平だと思うので、平均と標準偏差を計算するとき、それは誰かがそれらの数値に基づいていくつかの決定をしようとしているからです。 優れた統計学者の一部は、サンプルデータが信頼できる場合、および何らかの統計テストが興味のある真のデータを完全に誤って伝えている場合に、「感知」できることを望みます。ビッグデータセット統計と確率理論を再学習していますが、これまで見てきたすべての本は、舞台に上がってたくさんのことを言う政治家のようなものだというこのしつこい気持ちを揺るがすことはできませんスピーチの最後の次の免責事項: さて、これは良いことでも悪いことでもありませんが、数字は良いと言っているので、とにかく投票してください。 たぶんあなたはそれを得るが、多分そうではないので、ここに質問があります。統計学者による戦争の話はどこで見られますか?いくつかの決定は、後で完全に間違っていることが判明した統計情報に基づいていますか?

1
どの統計的手法は古風で、教科書から省くべきですか?[閉まっている]
現在のところ、この質問はQ&A形式には適していません。回答は、事実、参考文献、または専門知識によってサポートされると予想されますが、この質問は、議論、議論、世論調査、または詳細な議論を求める可能性があります。この質問を改善し、おそらく再開できると思われる場合は、ヘルプセンターをご覧ください。 6年前に閉鎖されました。 二項比率の信頼区間についての質問に答える際に、私は正規近似が古風で信頼できない方法であるという事実を指摘しました。メソッドとして教えるべきではありませんが、何が適切なメソッドを作るのかについてのレッスンの一部として含まれるという議論があるかもしれません。 使用期限を過ぎており、教科書の将来の版から省略されるべきである(それにより有用なアイデアのためのスペースを作る)他の「標準的な」統計的アプローチは何ですか?

1
カールピアソンはどのようにしてカイ2乗統計量を算出しましたか?
ピアソンは、1900年に次のピアソンのカイ2乗統計をどのように思いついたのですか? K=∑(Oij−Eij)2EijK=∑(Oij−Eij)2Eij K = \sum \frac{(O_{ij} -E_{ij})^2}{E_{ij}} その K∼χ2K∼χ2 K \sim \chi^2 彼はカイ二乗を念頭に置いて、メトリック(ボトムアップアプローチ)を考案しましたか、それとも統計を考案し、後でカイ二乗分布に従うことを証明しましたか(トップダウン)?KKK 彼がやなどの他の形式ではなく特定の形式を選択した理由を知りたい 、また、彼が正方形を分母で分割した理由。Σ (O私はj- E私はj)2∑(O私j−E私j)2\sum(O_{ij} -E_{ij})^2∑ | O私はj- E私はj|∑|O私j−E私j|\sum|O_{ij} -E_{ij}|

3
ベータ版の配布元はどこですか?
私は確信しているとして、誰もがここでは、すでにベータ分布のPDFを知っているで与えられますX∼B(a,b)X∼B(a,b)X \sim B(a,b) f(x)=1B(a,b)xa−1(1−x)b−1f(x)=1B(a,b)xa−1(1−x)b−1f(x) = \frac{1}{B(a,b)}x^{a-1}(1-x)^{b-1} この式の起源を説明するために、あちこちで狩りをしてきましたが、見つけることができません。私がベータ版の分布で見つけたすべての記事は、この公式を提供し、その形状のいくつかを説明し、その後、その瞬間とそこから議論にまっすぐ進むようです。 私が導き出して説明できない数式を使うのは好きではありません。他の分布(例:ガンマまたは二項分布)については、学習して使用できる明確な導出があります。しかし、ベータ版ディストリビューションについては、そのようなものは見つかりません。 だから私の質問は次のとおりです。この式の起源は何ですか?最初に開発されたどのようなコンテキストでも、どのように第一原理から派生させることができますか? [明確にするために、ベイジアン統計でベータ分布を使用する方法、または実際にそれが直感的に意味するものについては質問していません(野球の例を読みました)。PDFの導出方法を知りたいだけです。同様のことを尋ねる以前の質問がありましたが、問題に対処しなかった別の質問の重複としてマークされていたので(間違っていると思います)、ここでヘルプを見つけることができませんでした。 EDIT 2017-05-06:質問をありがとうございます。私が望むものについての良い説明は、私のコースインストラクターにこれを尋ねたときに得た答えの1つから来ると思います: 「人々はn個の合計をsqrt(n)で割った限界として通常の密度を導き出すことができると思います。また、一定の速度で発生するイベントの考えからポアソン密度を導き出すことができます。ベータ密度については、密度から独立して、論理的に何がベータ分布になるのかをある程度理解する必要があります。」 したがって、コメント内の「ab initio」のアイデアは、おそらく私が探しているものに最も近いでしょう。私は数学者ではありませんが、導出できる数学を使用するのが最も快適だと感じています。起源が私には扱えないほど進んでいるなら、そうであるが、そうでないなら、私はそれらを理解したいと思う。

2
オートエンコーダニューラルネットワークの起源は何ですか?
Google、Wikipedia、Google scholarなどで検索しましたが、オートエンコーダーの起源を見つけることができませんでした。おそらく、それは非常に徐々に進化した概念の1つであり、明確な出発点をさかのぼることはできませんが、それでも開発の主なステップの何らかの要約を見つけたいと思います。 オートエンコーダについての章イアン・グッドフェロー、ヨシュア・ベンジオとアーロンCourvilleの深い学習帳には言います: オートエンコーダーのアイデアは、数十年にわたりニューラルネットワークの歴史的景観の一部でした(LeCun、1987; Bourlard and Kamp、1988; Hinton and Zemel、1994)。従来、次元の削減または機能の学習にはオートエンコーダーが使用されていました。 パスカルビンセントによるこのプレゼンテーションは次のように述べています。 実際には、古典的なオートエンコーダーを使用したノイズ除去は、ホップフィールドネットワーク(Hopfield、1982)に代わるものとして、はるか以前に導入されました(LeCun、1987; Gallinari et al。、1987)。 これは、その前に「古典的なオートエンコーダー」が存在していたことを暗示しているようです。LeCunとGallinariはそれらを使用しましたが、発明しませんでした。1987年以前の「クラシックオートエンコーダー」の痕跡は見当たりません。 何か案は?

3
ロナルドフィッシャーの主な統計的貢献は何でしたか?
リチャード・ドーキンスは、ロナルド・フィッシャーをフィッシャーのウィキペディアの伝記に引用されている「現代の統計と実験計画の父」と評しています。Anders Hald は、彼の著書A History of Mathematical Statisticsで、彼を「ほとんど独力で現代統計科学の基礎を作った天才」と呼んでいました。 人々が彼にそのような高い評価を与えるために、彼が正確に何をしたのだろうか?



1
ランダムフォレストでは、ツリーレベルではなくノードレベルでフィーチャのランダムサブセットが選択されるのはなぜですか?
私の質問:ランダムフォレストは、ツリーレベルではなく各ツリー内のノードレベルで分割するために、フィーチャのランダムサブセットを考慮するのはなぜですか? 背景:これは歴史の質問です。ティン・カム・ホーが公開され、この論文をランダムにそれぞれ成長させるために使用する機能のサブセットを選択することにより、「意思決定の森」を構築する上で木を 2001年に、後に1998数年で、レオ・ブレイマンは彼の独創性に富んランダムフォレストの公表論文特徴サブセットがランダムであるが、各ツリーではなく、各ツリー内の各ノードで選択されます。ブライマンはHoを引用しましたが、ツリーレベルからノードレベルのランダムな特徴選択への移行については特に説明しませんでした。 この開発の具体的な動機は何だと思います。ツリーレベルでフィーチャサブセットを選択すると、ツリーの目的の非相関化が依然として達成されるようです。 私の理論:これは他の場所で明確に表現されていませんが、ランダムなサブスペース法は、特徴の重要性の推定値を取得するという点では効率が低いようです。変数の重要度の推定値を取得するために、各ツリーについて、特徴が1つずつランダムに並べ替えられ、誤判別の増加またはアウトオブバッグ観測のエラーの増加が記録されます。このランダムな順列から生じる誤分類またはエラーの増加が大きい変数は、最も重要です。 ランダム部分空間法を使用する場合、ツリーごとに、特徴のうちだけを考慮します。すべての予測子を一度でも考慮するには、いくつかの木が必要になる場合があります。我々は異なるサブセット考える一方、の特徴各ノードで、私たちは私たちにフィーチャー重要性のより堅牢な見積もりを与え、少数の木の後に、各機能に多くの時間を考慮します。mmmppppppm私m私m_ippp これまで見てきたこと:これまでのところ、私はブライマンの論文とホーの論文を読み、決定的な答えを見つけることなく方法の比較のために広範なオンライン検索を行いました。同様の質問が以前に聞かれたことに注意してください。この質問は、考えられる解決策に向けた私の推測/作業を含めることで、さらに先へと進みます。答え、関連する引用、または2つのアプローチを比較するシミュレーション研究に興味があります。予定されていない場合は、2つの方法を比較して独自のシミュレーションを実行する予定です。

2
トーマス・ベイズがベイズの定理をそれほど難しいと思ったのはなぜですか?
これは科学の歴史の問題の詳細ですが、ここで話題になっているといいのですが。 トーマスベイズは、以前のユニフォームの特別な場合のベイズの定理しか見つけられなかったと私は読んだことがあり、それでも彼はそれに苦労していたようです。 一般的なベイズの定理が現代の扱いでどれほど些細なことかを考えると、なぜそれが当時ベイズや他の数学者に挑戦をもたらしたのでしょうか?比較のために、アイザックニュートンのフィロソフィアナチュラリスプリンシピアマテマチカは、ベイズの主要な作品の36年前に出版されました。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.