R、bash、Python、asciidoc、(La)TeX、オープンソースソフトウェア、またはun * xツールの熱狂的なユーザーとして、私は客観的な答えを提供できません。さらに、MS Excelやあらゆる種類のスプレッドシートの使用に反対することがよくあるので(データやデータの一部は表示されますが、他には何がありますか?)、私は議論に積極的に貢献しません。私だけではない、例えば
私の同僚は、後方互換性の欠如などのために、すべてのマクロを失いました。別の同僚は、「それらを見る」ためだけに遺伝データ(800,000マーカーで遺伝子型分類された約700人)をインポートしようとしました。Excelは失敗し、メモ帳もあきらめました... viで「それらを見る」ことができ、いくつかのsed / awkまたはperlスクリプトでデータをすばやく再フォーマットできます。したがって、スプレッドシートの有用性について議論する際に考慮すべきさまざまなレベルがあると思います。小さいデータセットで作業していて、基本的な統計データのみを適用したい場合は、それで問題ありません。次に、結果を信頼するか、ソースコードをいつでも求めることができますが、NISTベンチマークを使用してすべてのインラインプロシージャのクイックテストを行う方が簡単な場合があります。上記のリストの更新として、MS Excelの新しいバージョンはその正確性の改善を実証したように見えますが、これは単にこれが真の統計ソフトウェア(IMHO)ではないという理由だけで、統計を行う良い方法に対応するとは思いません統計分析、Keeling and Pavur、9つの統計ソフトウェアパッケージの信頼性の比較研究(CSDA 2007 51:3811)。
それでも、10または20枚のうち約1枚(生物医学、心理学、精神医学)にはExcelで作られたグラフィックが含まれていますが、灰色の背景、水平の黒い線、または自動の凡例を削除することもあります(Andrew GelmanとHadley Wickhamは確かにそれを見たときに私)。しかし、より一般的には、FlowingDataの最近の世論調査によると、最もよく使用される「ソフトウェア」である傾向があります。これは、ブライアンリプリー(MASS Rパッケージを共同執筆し、パターン認識に関する優れた本、とりわけ):
自分をからかわないでください:統計に最も広く使用されているソフトウェアはExcel(B. Ripley via Jan De Leeuw)、http: //www.stats.ox.ac.uk/~ripley/RSS2002.pdfです。
さて、あなたがそれがあなたの統計を終わらせるための迅速で簡単な方法をあなたに提供すると感じたら、なぜですか?問題は、そのような環境では実行できないこと(または、少なくともややこしいこと)がまだあるということです。いくつか例を挙げると、ブートストラップ、順列、多変量探索的データ分析について考えます。VBA(スクリプトでもプログラミング言語でもない)に精通していない限り、R(またはMatlab、Python)でデータに対する小さな操作でもより適切に処理できると思う傾向があります。たとえば、いわゆるdata.frame)。何よりも、Excelはデータアナリストにとって非常に優れたプラクティスを促進していないと思います(ただし、どの "cliquodrome"にも適用されます。データ処理の記録を維持する必要性に関するMedstatsの議論分析とデータ編集の文書化)、そして、私はこの実用的な統計に関する投稿をExcelの落とし穴のいくつかを比較的説明するものだと見つけました。それでも、それはExcelに適用されますが、GDocsにどのように変換されるのかわかりません。
作品の共有については、Github(またはソースコードの場合はGist)またはDropbox(EULAは一部の人々を思いとどまらせるかもしれませんが)は非常に良いオプション(改訂履歴、必要に応じて許可管理など)であると思う傾向があります。基本的にバイナリ形式でデータを保存するソフトウェアの使用を奨励することはできません。R、Matlab、Stata、SPSSにインポートできることは知っていますが、私の意見では:
- データは確実にテキスト形式である必要があり、別の統計ソフトウェアで読み取ることができます。
- 分析は再現可能である必要があります。つまり、分析用の完全なスクリプトを提供し、いつでも別のオペレーティングシステムで実行する必要があります(この近くの理想的なケースにアプローチします)。
- 独自の統計ソフトウェアは、認知されたアルゴリズムを実装する必要があり、統計モデリングの現在のベストプラクティスを反映するように更新する簡単な方法が必要です。
- 選択する共有システムには、バージョン管理機能と共同機能を含める必要があります。
それでおしまい。