実用的なデータ分析プロセスとは何ですか?


15

各データ分析プロジェクトについて、ほとんどの統計データアナリストが経験する分析プロセスを知りたい、または参照したいと思います。

データ分析プロジェクトを完了するために「リスト」を作成する場合、アナリストは次のことを行う必要があります。

  1. 最初にプロジェクトの要件を収集し、
  2. 以前にそれらの要件に基づいてデータ分析を計画/設計する
  3. 実際にデータを前処理する、
  4. データ分析を実行し、
  5. 彼の分析結果に基づいてレポートを作成します。

この質問については、ステップ2の詳細に興味があります。しかし、分析者はデータ分析の出力に応じて計画や設計を変更する必要があるため、これは実際には明確ではありません。このテーマに関する参考文献はありますか?

回答:


17

私のお気に入りの「計画」または「リスト」は、Scott Emersonの文書「データ分析へのアプローチを整理する」です。

注:最後の2ページは「博士号試験の一般要件」という見出しの下にありますが、そこに与えられたアドバイスは、分析の問題に取り組むために一般化されています。


ドキュメントのあらゆる部分が大好きです。貴重な参考資料をありがとう。
泰-ソンシン

5

Stata使用したデータ分析のワークフローは、特にStataユーザーとして(だけではありませんが)優れた本であることがわかりました。私は意見が合わないものをたくさん見つけましたが、それでも私が特定の方法で物事をする理由を明確にするのに役立ちました。


4
+1、ただし、注意事項:この本は、あなたがStataユーザーである場合にのみ価値があります。私はStataを使用していません(実際には持っていません)。一方、私はLongが好きなので、これをライブラリからチェックアウトしました。誰にとっても良い情報がたくさんあると確信していますが、Stataの使用と完全に絡み合っているため、ドメインの一般情報を抽出することは不可能です。
GUNG -復活モニカ

2

SPSS社(現在はIBMに属している)によって作成されたCRISP-DMは、データマイニングプロセスの頭字語であり、「データ分析」と同じです。SASには、SEMMAと呼ばれる同様のプロセスがあります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.