タグ付けされた質問 「data-visualization」

データの視覚化は、データの視覚的表現の研究です。マップとチャートは最も一般的なタイプのデータ視覚化ですが、他にもたくさんあります。

10
IPython Notebook matplotlibプロットをインラインにする方法
MacOS XでIPython NotebookをPython 2.7.2およびIPython 1.1.0で使用しようとしています。 matplotlibグラフィックをインラインで表示できません。 import matplotlib import numpy as np import matplotlib.pyplot as plt %matplotlib inline 私は%pylab inlineipythonコマンドライン引数も試しました--pylab=inlineが、これには違いがありません。 x = np.linspace(0, 3*np.pi, 500) plt.plot(x, np.sin(x**2)) plt.title('A simple chirp') plt.show() インライングラフィックの代わりに、私はこれを取得します: <matplotlib.figure.Figure at 0x110b9c450> そしてmatplotlib.get_backend()、私が'module://IPython.kernel.zmq.pylab.backend_inline'バックエンドを持っていることを示しています。


11
パンダを使用して相関行列をプロットする
膨大な数の機能を備えたデータセットを持っているので、相関行列の分析は非常に困難になりました。dataframe.corr()pandasライブラリの関数を使用して取得した相関行列をプロットしたいと思います。この行列をプロットするためにパンダライブラリによって提供される組み込み関数はありますか?

14
統計分析とレポート作成のワークフロー
カスタムレポートの作成に関連するデータ分析のワークフローについて、知識はありますか?ユースケースは基本的にこれです: クライアントは、データ分析を使用するレポートを委託します。たとえば、水区の人口推定や関連マップなどです。 アナリストは一部のデータをダウンロードし、データを変更して結果を保存します(たとえば、単位あたりの人口の列を追加したり、地区の境界に基づいてデータをサブセット化したりします)。 アナリストは、(2)で作成されたデータを分析し、彼女の目標に近づきますが、さらに多くのデータが必要であるため、(1)に戻ります。 テーブルとグラフィックスがQA / QCを満たし、クライアントを満足させるまで繰り返します。 表とグラフィックを組み込んだレポートを作成します。 来年、幸せなクライアントが戻ってきて、更新を求めています。これは、仕様が変更されない限り、新しいダウンロード(たとえば、昨年の建築許可の取得)によってアップストリームデータを更新し、[RECALCULATE]ボタンを押すのと同じくらい簡単なはずです。 現時点では、ディレクトリを作成して、できる限りその場限りで作成します。もっと体系的なアプローチが欲しいので、誰かがこれを理解してくれることを願っています...私は、スプレッドシート、SQL、ARCGIS、R、およびUnixツールを組み合わせて使用​​しています。 ありがとう! PS: 以下は、さまざまな中間データセット(.RDataサフィックス付き)とスクリプト(.Rサフィックス)の依存関係をチェックする基本的なMakefileです。Makeはタイムスタンプを使用して依存関係をチェックします。そのためtouch ss07por.csv、このファイルが依存しているすべてのファイル/ターゲットよりも新しいことがわかり、指定されたスクリプトを実行してそれらを適宜更新します。これは、SQLデータベースに入れるステップや、sweaveなどのテンプレート言語のステップを含む、まだ進行中の作業です。Makeは構文がタブに依存していることに注意してください。したがって、カットアンドペーストする前にマニュアルをお読みください。楽しんでフィードバックしてください! http://www.gnu.org/software/make/manual/html_node/index.html#Top R = / home / wsprague / R-2.9.2 / bin / R persondata.RData:ImportData.R ../../DATA/ss07por.csv Functions.R $ R --slave -f ImportData.R persondata.Munged.RData:MungeData.R persondata.RData Functions.R $ R --slave -f MungeData.R report.txt:TabulateAndGraph.R persondata.Munged.RData Functions.R $ R --slave -f …

12
リモートサーバーでTensorboardを実行するにはどうすればよいですか?
私はTensorflowを初めて使用するので、自分が何をしているかを視覚化することで大きなメリットが得られます。Tensorboardは便利な視覚化ツールであることを理解していますが、リモートのUbuntuマシンで実行するにはどうすればよいですか?

4
X軸をmatplotlibのプロットの上部に移動する
matplotlibのヒートマップに関するこの質問に基づいて、x軸のタイトルをプロットの上部に移動したいと考えました。 import matplotlib.pyplot as plt import numpy as np column_labels = list('ABCD') row_labels = list('WXYZ') data = np.random.rand(4,4) fig, ax = plt.subplots() heatmap = ax.pcolor(data, cmap=plt.cm.Blues) # put the major ticks at the middle of each cell ax.set_xticks(np.arange(data.shape[0])+0.5, minor=False) ax.set_yticks(np.arange(data.shape[1])+0.5, minor=False) # want a more natural, table-like display ax.invert_yaxis() ax.xaxis.set_label_position('top') …

3
D3.jsを学ぶための良い本[終了]
閉まっている。この質問はスタックオーバーフローのガイドラインを満たしていません。現在、回答を受け付けていません。 この質問を改善してみませんか?Stack Overflowのトピックとなるように質問を更新します。 6年前休業。 この質問を改善する 見てD3.js興味があったのでこの本を買いました!私は間違っているかもしれませんが、それは満足のいくものではありませんでした。 誰もがD3.jsデータ可視化のマスタリングのための優れた資料を持っていますか? 私は多くの可能性を見ることができ、D3.js非常に熱心で興味があります。 前もって感謝します! 更新: Scott Murray著のInteractive Data Visualization for the Webを読み終えました。お試しください。無料です。

4
pcolorを使用したmatplotlibのヒートマップ?
このようなヒートマップを作成したいと思います(FlowingDataに表示されます): ソースデータはここにありますが、ランダムデータとラベルを使用するのが適切です。 import numpy column_labels = list('ABCD') row_labels = list('WXYZ') data = numpy.random.rand(4,4) ヒートマップの作成は、matplotlibで十分簡単です。 from matplotlib import pyplot as plt heatmap = plt.pcolor(data) そして、私は正しいように見えるカラーマップ引数を見つけました:heatmap = plt.pcolor(data, cmap=matplotlib.cm.Blues) しかし、それを超えると、列と行のラベルを表示し、データを正しい方向(左下ではなく左上)で表示する方法がわかりません。 試みが操作するheatmap.axes(例えばheatmap.axes.set_xticklabels = column_labels、すべて失敗しています)。ここで何が欠けていますか?

5
PythonのMatplotlibとデータのリストを使用してヒストグラムをプロットする方法は?
matplotlib.hist()関数を使用してヒストグラムをプロットしようとしていますが、その方法がわかりません。 リストがあります probability = [0.3602150537634409, 0.42028985507246375, 0.373117033603708, 0.36813186813186816, 0.32517482517482516, 0.4175257731958763, 0.41025641025641024, 0.39408866995073893, 0.4143222506393862, 0.34, 0.391025641025641, 0.3130841121495327, 0.35398230088495575] 名前(文字列)のリスト。 各棒のy値として確率を作成し、x値として名前を付けるにはどうすればよいですか?

5
matplotlib棒グラフに値ラベルを追加する
比較的簡単なものに行き詰まりました。以下に示すコードは、私が取り組んでいるより大きなプロジェクトに基づいたサンプルです。すべての詳細を投稿する理由は見当たらないので、持ってきたデータ構造をそのまま受け入れてください。 基本的に、私は棒グラフを作成しています。棒に値ラベルを追加する方法(棒の中央またはそのすぐ上)を理解することができます。Web上のサンプルを調べていましたが、自分のコードでの実装は成功していません。私は解決策が「テキスト」または「注釈」のいずれかであると信じていますが、私は:a)どちらを使用するかわからない(そして一般的に言えば、いつ使用するかわからない)。b)値ラベルを表示するためにどちらも取得できない。以下の私のコード、あなたの助けに感謝します。前もって感謝します! import numpy as np import pandas as pd import matplotlib.pyplot as plt pd.set_option('display.mpl_style', 'default') %matplotlib inline # Bring some raw data. frequencies = [6, 16, 75, 160, 244, 260, 145, 73, 16, 4, 1] # In my original code I create a series and run on that, # …

7
Graphite以外のstatsdデータのGUI?[閉まっている]
閉まっている。この質問はスタックオーバーフローのガイドラインを満たしていません。現在、回答を受け付けていません。 この質問を改善してみませんか?Stack Overflowのトピックとなるように質問を更新します。 5年前に閉鎖。 この質問を改善する 生産用のグラファイト/ statsdをインストールしました。本当に満足していますが、同僚の1人から、見栄えを良くする方法はないかと尋ねられました。正直言って、同じことをしなかったとは言えません。 おそらく素晴らしいフロントエンドのグラフ作成ライブラリの1つとHTTPプッシュを使用して、データをより適切にレンダリングする、Graphite UIに代わるものはありますか?

1
ggplot2プロットエリアマージン?
プロットタイトルとその下のプロット領域(データのあるボックス)の間のスペースを増やす簡単な方法はありますか?同様に、軸のタイトルと軸のラベルの間にスペースを入れたいと思います。 つまり、「タイトルを少し上に、y軸のタイトルを少し左に、x軸のタイトルを少し下に移動する」方法はありますか?

8
CSV列を階層関係に変換する方法はありますか?
分類レベルが列になっている700万の生物多様性レコードのcsvがあります。例えば: RecordID,kingdom,phylum,class,order,family,genus,species 1,Animalia,Chordata,Mammalia,Primates,Hominidae,Homo,Homo sapiens 2,Animalia,Chordata,Mammalia,Carnivora,Canidae,Canis,Canis 3,Plantae,nan,Magnoliopsida,Brassicales,Brassicaceae,Arabidopsis,Arabidopsis thaliana 4,Plantae,nan,Magnoliopsida,Fabales,Fabaceae,Phaseoulus,Phaseolus vulgaris D3でビジュアライゼーションを作成したいのですが、データ形式はネットワークである必要があり、列の異なる値はそれぞれ、特定の値の前の列の子です。私はcsvからこのようなものに行く必要があります: { name: 'Animalia', children: [{ name: 'Chordata', children: [{ name: 'Mammalia', children: [{ name: 'Primates', children: 'Hominidae' }, { name: 'Carnivora', children: 'Canidae' }] }] }] } 1000のforループを使用せずにこれを行う方法については、思いつきませんでした。誰かがこのネットワークをpythonまたはjavascriptで作成する方法について提案がありますか?

3
観察によってヒストグラム観察を構築するためにgganimateを使用しますか?より大きなデータセット(〜n = 5000)で機能する必要がある
報奨金は、期限が切れる明日。この質問への回答は、+ 200の評判バウンティの対象となります。 maxは信頼できるソースからの回答を探しています。 正規分布からポイントをサンプリングしgganimate、最後のフレームに完全なドットプロットが表示されるまで、パッケージを使用してドットプロットを1つずつ作成します。 大規模なデータセット〜5,000〜20,000ポイントで機能するソリューションが不可欠です。 ここに私がこれまでに持っているコードがあります: library(gganimate) library(tidyverse) # Generate 100 normal data points, along an index for each sample samples <- rnorm(100) index <- seq(1:length(samples)) # Put data into a data frame df <- tibble(value=samples, index=index) dfは次のようになります。 > head(df) # A tibble: 6 x 2 value index <dbl> <int> …
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.