理論と数学に同等のストレスがある良い本


10

私は、在学中および大学で統計に関する十分なコースを受講しました。CI、p値、統計的有意性の解釈、複数の検定、相関、単純な線形回帰(最小二乗法)(一般的な線形モデル)、および仮説のすべての検定などの概念を十分に理解しています。初期のほとんどは数学的に紹介されていました。そして最近、私は本の直観的な生物統計学の助けを借りて、実際の概念理論に対して前例のない理解を理解しました。

さて、足りないのはモデルのフィッティング(モデルへのパラメータの推定)などの理解が足りないことです。特に、最尤推定、一般化線形モデル、推論統計へのベイジアンアプローチなどの概念は、常に私には異質に思えます。単純な確率モデルやインターネット上の他の(基本的な)トピックに見られるように、十分な例やチュートリアル、あるいは概念的に適切なものはありません。

私はバイオインフォマティシャンで、遺伝子発現(または遺伝子発現の差異)を見つけるための生の読み取りカウントを扱うRNA-Seqデータに取り組んでいます。私のバックグラウンドから、統計モデルに精通していなくても、ポアソン分布の仮定や負の二項式などの理由を理解することができます。しかし、一部の論文では一般化線形モデルを扱い、MLEなどを推定しています。理解するために必要な背景があると思います。

私が求めているのは、あなたの中の一部の専門家が有用だと思うアプローチと、(a)これらの概念をより直感的な方法で理解するのに役立つ本です(厳密な数学だけでなく、数学に裏打ちされた理論)。私はそれらを主に適用するつもりなので、何が何であるかを理解することに満足しているでしょうし、後で、厳密な数学的証明に戻ることができます...誰かに何か推奨はありますか?私が求めたトピックが確かにばらばらになっていて本でカバーされているなら、私は複数の本を買ってもかまわない。

どうもありがとうございました!


この分野でのRNA-Seqデータと統計的課題について学ぶための良い情報源を教えていただけませんか?
Biostat、2011年

1
biostat、確かに、ウェブサイトseqanswers.comはNGSのための非常に良いリソースです。ここから、さまざまなテクノロジーとそれらの機能から始めることができます:goo.gl/NLuvJこれらは、NGSデータの統計的な問題を説明するいくつかのペーパーです。要するに、それらは(遺伝子発現に関する)技術的および生物学的分散推定です。1)技術的な変化を評価する最初の論文の一つ:ncbi.nlm.nih.gov/pubmed/18550803 2)DESeq:遺伝子発現の検出のためのツール:ncbi.nlm.nih.gov/pubmed?term=DESeq%20simon%20anders
2011年

1
CWに変換されます。これは、一連の良い提案が提供されるようであり、それらの間で「最良」を決定する明確な客観的基準がないためです。これにより、読者が多くの返信に投票しやすくなることを願っています:-)。
whuber

whuber、確かに!理にかなっています。コミュニティーWikiの投稿を作成できますか?またはモデレーター権限が必要ですか?
2011年

回答:


5

あなたはそれについてフランク・ハレルの回帰モデリング戦略について尋ねたすべての非ベイジアンを見つけるでしょう。ベイジアンの推奨事項は、より知識のある人に任せます(ただし、本棚には、Gelman、Carlin、Stern、RubinGilksRichardson、Speigelhalterがいます)。市場にはいくつかのベイジアンバイオスタット本があるはずです。

更新: McCullach and Nelder(1989)は、もちろんGLMに関する古典的な本です。当時としては画期的でしたが、率直に言って、かなり退屈だと思います。さらに、残差診断、ゼロインフレートモデル、マルチレベル/階層拡張など、その後の追加については説明しません。Hardin and Hilbe(2007)は、この新しいもののいくつかをStataの実用的な例で詳しく説明しています(GLMと拡張機能は非常によく実装されています。Hardinは、これらのコマンドの多くを記述し、また、サンドイッチ推定量)。


こんにちはStasK、ありがとうございました!私は回帰モデリングに関するものは私の要件を満たすでしょう。GLMをどの程度カバーしていますか?ベイジアン推論に関するあなたの言及は、私が常に推奨する標準的なものであることもわかります。あなたの意見では、彼らが従うのはどれほど簡単/難しいですか?また、「一般化線形モデル」という本をご覧になりましたか?著者の1人はJA Nelderです。また、統計モデルについてこの本を購入したいと思います。これについて何か考えはありますか?ありがとう!
2011年

私はこのフリードマンの本を見たことがありません。かなり面白そうですが、かなり面白く、満足しているとは思えません。(数学については非常に軽く、行列代数を使わずに回帰について説明しているが、科学の厳密さについては非常に深い本は、AngristとPischkeによる主に無害な計量経済学であり、因果モデルを使用する場合、この本は必須です。)あなたの数学/統計の背景が本当にわからないので、これらの本が難しいかどうかを判断するのは難しいでしょう。ベイジアンの本の中には、彼らはあなたがすでにMLEとGLMを知っていると仮定する傾向があります。
StasK、2011年

1
McCullachとNelderの参照を含めるように返信を更新しました。
StasK、2011年

私はエレクトロニクス工学者です。バイオインフォマティシャンになった。私は統計学(通信理論用)、確率、ランダムプロセスのコースを受講しており、微積分学(少し錆びていますが)と線形代数にも慣れています。もちろん、これらはほとんどが学部レベルです...私の目的は概念的に健全であることです(幾何学的解釈、方法の理解、そして最も重要な目的)など...もちろん、もしそれがこれらのレシピが付属しています。あなたの提案をありがとう!
2011年

3

これらの本は良いものを説明していますが、OPが尋ねたものは説明していません。
StasK、2011年

@StasK、上記の本にないものについて説明していただけますか?
Biostat、2011年

私はHTFから教えました、そしてそれから私が教えたものは、基底関数、有効自由度、モデル選択、投げ縄、交差検証などについてでした。OPが興味を持っていたMLEとGLMは、せいぜい言及されるだけです。統計の学生は、一般的な統計トレーニングの内容に精通していると想定されます。または、CSの学生は、バイナリ結果データへの反応として、ロジスティック回帰ではなくSVMを使用します。ベイジアンのものもまた、ある意味ではベイジアン決定規則が最適である場合にのみ言及されます。MCMCも活用力もありません。
StasK、2011年

「バイオインフォマティクスの統計的手法」という本を読みましたか?
Biostat、2011年

@biostat、いや、私はしていません。私はバイオインフォマティクスで働いていませんが、少し違う世界であることは知っています。だから私は合理的な推奨をすることはできません。私の意見では、GLM、GEE、縦断的モデル、生存モデルなどのモデルを扱う生物統計学の分野は計量経済学と共通しています(つまり、断面データとパネルデータモデルに関するWooldridgeの本は、働いている一部の生物統計学者にとっては良い推薦かもしれません)これらのモデルを使用して)、統計的遺伝学、家族単位の誤り率制御、およびデータマイニングを使用した場合よりも、専門知識の領域のようです。
StasK、2011年
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.