統計理論とアプリケーションを理解する


13

私は最近、工学および数学をバックグラウンドとして医学および生物学のモデリングの修士号を取得しました。私の教育プログラムには、かなり高い成績で管理した数学的統計学のコース(以下のリストを参照)がかなり含まれていましたが、統計学の理論と応用の両方を見つめていました。「純粋な」数学と比較して、統計は本当に意味がありません。特に、ほとんどの統計学者(私の過去の講師を含む)が使用する表記法と言語は煩わしく複雑であり、これまでに見たリソース(ウィキペディアを含む)には、簡単に関連し、与えられた理論に関連付けることができる簡単な例がありませんでした。 ..

これが背景です。また、特にバイオインフォマティクスの分野では、統計をしっかりと把握しなければ、研究者/エンジニアとしてのキャリアを積むことはできないという現実を実感しています。

私はより経験豊富な統計学者/数学者からいくつかのヒントを得られることを望んでいました。上記のこの問題をどのように克服できますか?良いリソースを知っていますか。書籍、電子書籍、オープンコース(iTunesまたはOpenCourseware for exを使用)など。

編集:私が述べたように、私は統計の一般的なタイトルの下で大部分の文学にかなり否定的に偏っています、そして統計のブランチごとに多くの(そして高価な)コースブックを買うことができないので、必要なもの本の点で は、物理学のためのTipler&Moscaと似ていますが、統計のためです。

ティプラーを知らない人のために。それは、高等研究中に遭遇する可能性のある主題の大部分をカバーする大きな教科書であり、それぞれ基本的な紹介からやや深い詳細までそれらを提示します。基本的には完璧な参考書で、Uniで最初の1年間に購入しましたが、それでもときどき使用しています。


統計に関するコース:

  • 大規模な紹介コース、
  • 定常確率過程、
  • マルコフ過程、
  • モンテカルロ法
  • 生存分析

回答:


4

私はあなたの状況を完全に理解できます。私は博士課程の学生ですが、理論と応用を関連付けるのが難しい場合があります。理論を理解することに没頭したいなら、現実世界の問題について考えるとき、それは間違いなくやりがいがあります。しかし、プロセスはイライラするかもしれません。

私が気に入っている多くの参考文献の1つは、階層/マルチレベルモデルを使用した Gelman and Hillのデータ分析です。シミュレーションを使用して基礎となる概念を表現できる理論を回避します。MCMCなどの経験があるので間違いなく有益です。あなたが言うように、あなたはバイオインフォマティクスで働いています。おそらく、ハレルの回帰モデリング戦略も素晴らしいリファレンスです。

これをコミュニティWikiにし、他の人が追加できるようにします。


問題についてご清聴ありがとうございました。物事について混乱しているのは私だけではないのは嬉しいことです。そうは言っても、あなたは私の状況を過大評価していると思います。私はいくつかのコースを受講しており、統計分析のさまざまな方法の存在に精通しています。彼らはコースの後に私と一緒に固執しません。試験の数か月後、私は不思議に思っています。「私はどこかでこれを見たり聞いたりしましたが、実際にどのように機能しましたか?これは私にそれをすべて取り壊し、より強固な基盤でそれを構築し始める必要があることを示唆しています。
posdef

私は、ハレルの(スペルに注意してください)テキストに響く「同意」を追加します。それに付随するRコードの2パッケージの組み合わせと同様に優れています。VenablesとRipleyによる「Modern Applied Statistic with S」も良い買収になると思います。MASSを使用してRを習得する前に、修士レベルのバックグラウンド(物理学の学士号を取得)がありました。そのテキストには豊富な応用知恵があります。
DWIN

ゲルマン回帰本は素晴らしいです、彼はそれをすべて非常によく説明して、材料のあなたの理解をチェックするのに本当に役立つRコードを提供します。
-richiemorrisroe

2

Bayesian Data Analysis(Gelman、Carlin、Stern、Rubin)に精通していますか?たぶんそれはあなたが服用する必要があるものです。


2

統計の問題はすべて、本質的に次の4つのステップに要約されます(別の質問で @whuberの回答から借りました)。

  1. パラメーターを推定します。

  2. その見積もりの​​品質を評価します。

  3. データを調べます。

  4. フィットを評価します。

単語パラメータを単語モデルと交換できます

統計書は通常、さまざまな状況の最初の2つのポイントを示します。実際のアプリケーションごとに異なるアプローチ、したがって異なるモデルが必要であるという問題により、書籍の大部分はこれらの異なるモデルをカタログ化することになります。これは、細部に自分自身を失い、全体像を逃しやすいという望ましくない効果をもたらします。

私が心からお勧めする大きな絵本は漸近統計です。トピックの厳密な取り扱いを提供し、数学的に「純粋」です。そのタイトルは漸近統計に言及していますが、大きな秘伝の秘密は、古典統計手法の大部分が漸近結果に基づいているということです。


2

ここで最も重要なことは、統計およびいくつかの一般的な統計概念に関する直感を開発することだと思います。おそらくこれを行うための最良の方法は、「所有」できるドメインを持つことです。これにより、ドメインについての理解が基礎となる統計についての理解を深めるのに役立つ正のフィードバックループを提供でき、ドメインなどについての理解を深めるのに役立ちます。

私にとって、そのドメインは野球の統計情報でした。私は、ゲームで4対3を打った打者が「本当の」0.750打者ではないことを理解しました。これは、サンプルデータが基礎となる分布と同じではないというより一般的なポイントを理解するのに役立ちます。また、彼はおそらく.750打者よりも平均的なプレーヤーに近いことを知っているので、これは平均への回帰などの概念を理解するのに役立ちます。そこから、以前の確率分布が平均的な野球選手の平均であった本格的なベイジアン推論に到達でき、現在、事後分布を更新する4つの新しいサンプルがあります。

そのドメインがあなたにとって何であるかはわかりませんが、単なる教科書よりも役立つと思います。例は理論の理解に役立ち、例の理解に役立ちます。例のある教科書はいいですが、それらの例を「あなたのもの」にできなければ、私はあなたがそれらから十分を得られるのだろうかと思います。


1

回帰モデリング戦略の代替として、そしてより実用的なアプローチとして、Applied Linear Statistical Modelsは私の観点から非常に優れています。


1

誰もが異なる方法で学習しますが、例、例、例は統計で多くの助けになると言っても安全だと思います。私の提案はRを学ぶことです(基本だけで十分です)、あなたは目が出血するまであらゆる例を試すことができます。並べ替え、フィット、プロット、名前を付けることができます。また、Rは統計を対象としているため、Rを学習すると、統計も学習します。リストしたこれらの本は、「見せて」という観点から攻撃される可能性があります。

Rは無料であり、多くのソース資料が無料であるため、投資する必要があるのは時間だけです。

http://www.mayin.org/ajayshah/KB/R/index.html

http://math.illinoisstate.edu/dhkim/rstuff/rtutor.html

http://www.cyclismo.org/tutorial/R/

http://www.stat.pitt.edu/stoffer/tsa2/R_time_series_quick_fix.htm

http://www.statmethods.net/about/books.html

Rには購入できる優れた本がたくさんあります。私が使ったものは次のとおりです。

http://www.amazon.com/Introductory-Statistics-R-Peter-Dalgaard/dp/0387954759

編集=============

いくつかのリンクを追加するのを忘れました。Windowsを使用している場合、Rをフィードするのに適したエディターはTinn-Rです(MacまたはLinuxのエディター用のリンクを他の誰かが追加できます)。

http://www.sciviews.org/Tinn-R/

http://cran.r-project.org/web/packages/TinnR/


リンクのおかげで、今後数週間でできる限りそれらを試してみます...私は以前にRに一度さらされました。サバイバル分析コースでは、多くの多変量回帰(coxとaelenモデル)と私が本当に思い出すことができない他の多くのもの。Rに対する私の印象は、MATLABに非常に慣れている人としてはかなり否定的でしたが、プールの奥深くまで多かれ少なかれ投げ込まれ、それから学ぶことを期待したという事実と大いに関係していましたそのおそらく変更することはもちろん:)時間で、その後からソフトウェアを嫌う私につながった、私たち自身に泳ぐ
posdef

1

私は個人的に愛され、これを(例のたくさんの)理論と応用の本当に良いミックスを持っていました。それは、より理論志向のアプローチのために、カゼッラとバーガーとの良い一致でした。そして、広範なブラシの概要については、これ


どちらの本もアマゾンで良い評価を受けているようですが、だれでもこれらについて意見を(おそらくもう少し詳細に)追加できますか?ところで カゼッラとバーガーでは、「統計的推論」という意味ですか?
posdef

はい、「統計的推論」。私にとって大きなステップは、確率モデルを理解することから、データを使用してモデルをテストし、モデルのパラメーターを推定する方法を理解することでした。特に、Davisonの本は本当にこの点に焦点を当てています。
常に
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.