探索的データ分析のためのグラフのコメントの保持


8

探索的データ分析を行う際に、グラフを印刷したり、コメント/注釈などを書き出すことがよくあります。

人々はより良​​い電子的方法論についての提案を持っていますか?私は特にpython / Rに興味があります。

探索的作業を遅くすることはないが、私が行った洞察を記録するのに役立つ、「迅速な(そして汚い)」何かを探しています。

私が想像できることは、PDFとしてグラフを生成し、コメントを追加することです。

理想的には、これをプログラムで行うオプションが欲しいので、グラフをやり直すと、「自動的に」コメントを追加できるようになります。


1
私が時々行うことは、R(pdfの最後の別のページに)別のプロットを追加し、それをpasteコメントに使用することです。
hplieninger 2017年

3
これはプログラミングの質問に似ており、私が正しければ、R-helpまたはStackOverflowでより良い応答が得られる可能性があります
mdewey

1
@mdewey、私はそれをRの統計ワークフローと見なしています-私の「提案された解決策」は単に「pdfにコメントを書き込む方法」であることに同意しますが、統計学者は以前にこの問題に直面しており、まったく異なるアプローチを提案している可能性がありますグラフに関連付けられたノートを追跡するという一般的な問題に。
seanv507 2017年

3
私の生徒は、MS Wordにグラフを貼り付けてコメントを追加することなく、プロンプトを表示せずにこれを行います。私はすべて歌い、すべて踊る自動化された方法への関心に感謝しますが、時にはローテクが最高のテクです。
Nick Cox

1
これは一般的な関心事だと思います。私はpython / Rに重点を置いて、ここでのガイドラインに反しています。
Nick Cox

回答:


5

これは、多くの人が便利だと思った簡単な解決策です。些細なことに気づいたとしても、私は反対しません。これは、統計ソフトウェア、オペレーティングシステム、およびその他のコンピューティングの詳細を横断します。

グラフをコピーしてお気に入りのワードまたはテキストプロセッサに貼り付け、独自のコメントを追加するだけです。つまり、MS Word、TeX、LaTeXをサポートするソフトウェアなどです。

それでおしまい。明らかに利点は、シンプルさ(習得するものは何もない)と柔軟性(必要なものを好きなように追加する)です。

これは自動化されたソリューションではありません。しかし、自動化されたソリューションでさえ、グラフ上の情報とあなたのコメントが供給されることに依存しているので、それは何が違うのでしょうか?


2
あなたはそれを過小評価していると思います。「貼り付け」ではなくファイルへのリンクを追加した場合(つまり、latexなど)、グラフが更新されると、ドキュメントが更新されるため、「自動化」されます。さらに、グラフの生成をレイアウトから分離できるという事実が好きです(たとえば、ページに3つのグラフをフィットするか、2 x 2のレイアウトにフィットするか)
seanv507

3

Jupyter Notebookを強くお勧めします。JupyterNotebookを使用すると、コードブロック、プロット、メモ/ドキュメントが点在するドキュメントを作成できます。ドキュメントには、(CrossValidatedへの書き込みと同様に)自動的にレンダリングされるマークダウンとラテックスを含めることができます。コードブロックを実行すると、生成されたテキスト出力とプロットがドキュメントにインラインで追加されます。コードブロックを変更して再実行し、出力/プロットを更新できます。これは物事をインタラクティブにテストするのに便利です(たとえば、コード/パラメータを微調整して何が起こるかを確認します)。特に何か変更した場合は、図をエクスポートして従来の静的ドキュメントに貼り付けるよりも簡単だと思います。ノートブックをPDFなどにエクスポートして、静的コピーを取得できます。

オープンソースであり、Python、R、その他の言語で動作します。インターフェースはブラウザベースなので、クロスプラットフォームでノートブックを簡単に共有できます。自分のマシンでバックエンドを実行することも、ウェブサイトでノートブックをホストして、どこからでも他のユーザーが編集/表示/実行できるようにすることができます(コードはサーバーで実行されます)。どうやら、並列計算用の計算クラスターへのフロントエンドとしてノートブックを構成する方法があります。


私は何度もそれを試しましたが、それが非常にうまく機能したとは本当に確信していません。私はこれが行われたプレゼンテーションを見てきましたが、(どんなプレゼンテーションについても)かなりの労力がかかると思われます。EDAについての私のポイントは、あなたがたくさんのグラフなどをやっているということです-プレゼンテーションするには多すぎます...プレゼンテーションであなたは最高を示します。私の印象に反する例を歓迎します。
seanv507 2017

2

R notebooksRStudio内でますます多くの分析を行う傾向があります。このようにして、コード、注釈、およびグラフを1か所にまとめることができ、常にPDFを生成する必要がありません。これは、リアルタイムの節約になります。エディターでテキストとコードを記述し、ボタンをクリックすることで、コードが実行され(そしてグラフが描画され)ます。したがって、テキスト、コード、およびプロットは、きちんとまとまります。マウスを数回クリックするだけで、HTMLまたはPDFに変換することも非常に簡単です。私は主にRを使用しているため、これがPythonでどのように機能するかはわかりません。


2

なんらかの文芸的プログラミングが必要なようです。 RもたらすのSweave、およびKnitrとのインターフェイスそのLaTeXの。編集可能なドキュメント(Wordドキュメントなど)のODFweaveや、複数のタイプ(上記に加えてHTML など)を出力できるRMarkdownなど、さまざまな種類の出力形式には他のオプションがあります。他の統計ソフトウェアには一般に類似した機能があります。

(これらの使用には事前の作業が少しあります。通常、同様のレポートを必要とする長期プロジェクトの代わりに、1回限りのプロジェクトを行うため、@ NickCoxのダンプまたはファイルへのコピー方法を使用しますコメントを書いてください。)


1

R:いくつかの基本的な情報を含むPDFにプロットを追加することがあります。これは、注釈が短く、paste追加情報を提供できるようにプロットデータに関連している場合に最も役立ちます。例えば:

pdf("cars-plots.pdf")
plot(cars)
plot.new()
legend("center", bty = "n", legend =
           paste0("Data: 'cars'\n",
                  "cor = ", round(cor(cars)[1, 2], 2), "\n",
                  "N = ", nrow(cars), "\n",
                  Sys.Date()))
dev.off()

あるいは、より長い注釈がある場合は、R Markdownを使用してレポートを作成することが解決策になる場合があります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.