頻繁に、探索的分析でウサギの穴を掘り下げたように感じる傾向は、あなたが尋ねている実質的な質問を見失うためだと思います。私は時々自分でそれを行い、その後、自分の目標が何であるかを思い出さなければなりません。たとえば、特定のモデルを構築しようとしていますか、または既存のモデルの妥当性を評価しようとしていますか?データに関する問題の証拠(つまり、法医学データ分析)を探していますか?または、これは分析の初期段階で、正式なモデルの開発に進む前に、特定の質問を非公式に調査しています(たとえば、2つの変数の間に関係がありますか)。要するに、あなたがプロットとテーブルをクランキングするのに気づいたが、あなたの当面の目標が何であるか、またはそのプロット/テーブルが関連する理由を明確に述べることができないなら、あなたはあなたが知っている
私は、プログラムを書いているのか記事を書いているのかに関係なく、書くのと同じように探索的データ分析にアプローチしようとします。どちらの場合でも、最初にアウトラインを作成せずに開始しません。もちろん、そのアウトラインは変化する可能性があります(頻繁に変化します)が、1つなしで書き始めることは非効率的であり、最終製品の品質が低下することがよくあります。
WRTの組織では、各アナリストが自分に合ったワークフローを見つける必要があります。そうすることで、他の人のワークフローを厳格に追おうとするよりもIMOの方が重要になります(ただし、他の人がやっていることからアイデアを得るのは常に役立ちます)。プログラムで作業している場合(つまり、一連の結果を生成/再生成するために実行できるコードを記述している場合)、作業をgitにチェックインしている場合、この点ですでに多くの先を行っています。コードを整理するのに少し時間をかける必要があるのではないかと思うので、そのために、アウトラインに従うことをお勧めします。たとえば、分析ファイルを比較的短く、ターゲットを絞って、それぞれが特定の質問(たとえば、特定の回帰モデルの診断プロット)に答えるようにします。プロジェクトのサイズと複雑さに応じて、これらを1つまたは2つのレベルでサブディレクトリに整理します。このようにして、プロジェクトは自己文書化されます。ディレクトリ、サブディレクトリ、およびファイルのリストビュー(各ファイルの上部にあるコメントと共に)は、理論的にはアウトラインを再現する必要があります。
もちろん、大規模なプロジェクトでは、データのクリーニングと管理を行うコード、特定のタイプのモデルを推定するために作成したコード、または作成した他のユーティリティもありますが、これらは実質的な範囲に収まりませんデータ分析の概要です。プロジェクトフォルダーの別の部分に整理する必要があります。
更新:これを投稿した後、「行き止まり」に関するあなたの質問に直接対処していないことに気付きました。分析セット全体に価値がないと本当に判断した場合、gitで作業している場合は、「この分析行は破棄されなかったため、生産的。」書いたものをくしゃくしゃにしてゴミ箱に捨てるのとは異なり、必要に応じていつでも後の作業に戻ることができます。
ただし、考えているアウトラインから進んでいくと、いわゆる行き止まりが少なくなることがわかると思います。代わりに、価値のある関連する質問の調査に時間を費やす場合-これがヌルの発見につながったり、予想どおりにならない場合でも、おそらくあなたがしたことと結果の記録を保持したいでしょう最低限、これを後で繰り返すのを間違えないように)。これらを「付録」のように、アウトラインの一番下に移動するだけです。