統計的推論のためのプログラミング言語は何ですか?


8

好奇心のためだけに...ここで最も使用される言語は何ですか?R?MATLAB?Python?Java?

プロトタイプまたはプロダクションはどうですか?たとえば、MATLABは主にプロトタイピングに、Pythonは両方のプロトタイプに使用されていると思います。そして生産...


6
ほとんどここに解決:stackoverflow.com/questions/2200460/...
ラデク

2
これは完全に主観的であるため、wikiを作成しました。
シェーン

回答:


7

私はRへの投票にこれ以上同意することができませんでした。Rは統計の世界の「リングアフランカ」です。これは最先端の定義ですが、MATLABとSASのほとんどのパッケージには数か月かかります。SASとは対照的に、言語は非常に理解しやすいものです。また、C / C ++ / Pythonおよびデータベースと接続する機能も提供します。

パフォーマンスをもう少し向上させるには、RのRevolution Analyticsバージョンを検討してください。

http://www.revolutionanalytics.com/products/revolution-r.php


2
SASよりもRの方が学習が簡単であることについて、私は反対しなければなりません。SASとSPSSを最初に学んだからかもしれませんが、SAS、SPSS(現在はPASW)、およびStataはすべて、Rよりも扱いやすい言語だと思います。主観的な議論ですが。
Andy W

Rは、機能の点でユーザーに多くのことを与えるように感じます。SAS / SPSSが実行できることを超えています。
pslice 2010年

3
私はそれに同意しませんが、それは理解を容易にしません。SAS、SPSS、またはStataで使用しているオブジェクトとそれらのオブジェクトの形式/性質はかなり透過的だと思いますが、Rではそれほど透過的ではありません。Rの方が最先端である可能性がありますが、私の日々の仕事で最先端の統計的手法が必要です。
Andy W

クローズドソースシステムが透過的であるとは考えにくいです。古い統計手法のみを使用した場合でも、Rはそれらを使用するためのより効率的なシステムであり、完全に再現可能な調査ツールボックスを形成します。
フランクハレル2016年

8

まあ、MATLABにPAYしてから、(1)本当に必要なものを最初からプログラミングするか、(2)MATLABツールボックスにPAY MOREを送ることができます。そして、MATLABで有用な統計を行うことは、次第に有用性が低下するStatistics Toolboxで処理されたことを発見しました。または... Rを無料でダウンロードして、必要なパッケージを検索(および検索)できます。これは無料でダウンロードすることもできます。

Rで小規模な生産作業をたくさん行うことができます。非常に大きなことをしている場合(米国の国勢調査を考えてみてください)、おそらくSASについて学び、雇用主にそれを支払う必要があります。


7

「人気」はコミュニティと「統計」の定義に依存します。世界的に、「統計的推論」の幅広い見方から、結論を導き出す方法や定量的データに基づいて行動を起こす方法を含め、Excelが R、SAS、Stata、SPSS、Sを含む他のすべてのアプリケーションに勝っているという疑問はほとんどありません。-プラス。(リンクはさまざまな種類の統計を指していますが、控えめに言っても、それらは非常に示唆に富んでいます。)PythonとMATLABは、統計でさえもちらほらしています。これが良いことであるとか、私たちがそれを好きである必要があるとか言っているわけではありません。それがまさにそれであり、それがそれが非常に長い間とどまるだろう方法です。

このフォーラムで「ここ」で人気があると思われるものから推測を引き出すべきではありません。商用ソフトウェアベンダーは独自のフォーラムをサポートしているため、SEのような場所では、あまりサポートされていないソフトウェア、特に無料のオープンソースアカデミックソリューションを使用している人を優先します。


6

Rがこのサイトで最も人気のある言語であることは、最も人気のあるタグ見れば明らかです。それが統計分析で最も人気のある言語になるかどうかは、直接推論することはできませんが、同じくらい推測できるかもしれません。


4

RとSASにはそれぞれ長所と短所があります。より優れた統計ソフトウェアを数多く提供しているという事実を受け入れる必要があるのは、より優れた統計情報を際限なく議論するのではなく、より多くの統計家が必要だと思います。

Rは無料です。SASは非常に高価です。Rは、ほとんど何でもできる機能を提供します。SASはそうでない場合があります。Rには素晴らしいグラフィック機能があります。SASグラフィックスを見ると、1985年のように感じられます。SASは優れた顧客サポートを備えています。Rサポート=メーリングリストアーカイブの検索時間。また、「R」のような名前を付けると、検索エンジンの結果がよくなります。Rは非常に遅く、大きなデータセットを適切に処理しません。SASは、大きなデータセットで問題なく動作します。SASはより堅牢になる傾向があります。私の経験では、混合効果モデリングまたは実験計画法(クロスオーバー計画の分析など)に関連するものに関しては、SASが優れています。

大規模なブルートフォースシミュレーションでは、Fortranを使用します。以前はCを使用していましたが、Fortranの方がはるかに使いやすいことがわかりました。私はMATLABを使用したことがありません。Rの統計力が必要だがFortranの速度が必要な場合は、時間のかかる演算(ループ)をFortranで記述し、Rからサブルーチンを呼び出します。


3
さて、Rサポートはこのような場所であり、有料サポートよりも効果的であることがよくあります。グーグルについては、rseek.orgがあります。R-is-slowケースの99%は、いくつかの考え方で解決できます。巨大なデータを扱うパッケージもあります(SASでも簡単ではありません)。Rはプログラミング言語、SASは拡張SQLです。

2
+1 この回答役に立つので便利ですが、Rのサポート、速度、および大量のデータを処理する能力についてのあなたの指摘は時代遅れであるか、かなり急速になっていると思います。
Matt Parker、

2
@Mattと@mbqのRパフォーマンスに関するコメントを2番目に紹介しますが、Rは実際には(N)LMEにとってかなり良いことを追加したいと思います。Doug Batesが2009年DSCカンファレンスで行った講演を覚えています。彼は、lme4パッケージが多くのランダムな影響をどのように簡単に処理できるかを示しました(たとえば、教育評価で遭遇)。私自身の(ただし限られた)経験(SAS NLMIXED R lme4)は、その点を確認します。Rは、複雑なIRTモデルを適用する場合、SASよりも遅くなく、大規模なデータの遺伝的セットも処理します(巧妙なC実装のおかげです)。 。
2010年

1

私の好みはPython、そしておそらくJavaです。まず、本当のプログラミング言語です。第二に、それらは最も人気のある言語です(TIOBEインデックス)。複数のスクリプト言語を使用して、これらの言語間で変換することもできます。以前、私はDMeltプラットフォームhttp://jwork.org/dmelt/を使用して統計計算を実行していましたが、2Dおよび3Dのグラフィックスに非常に感銘を受けました。これは、専門的な論文で簡単に実現できます。Rパッケージはグラフィックスに私を感心させませんでした。


2
これは、統計的推論のための最も一般的な言語の問題に対処していません。それは主にあなたの個人的な好みについてであり、人気のあるプログラミング言語について言及しています。
Nick Cox
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.