私が研究しているいくつかのdatavis手法をテストするために使用できる既存のデータセットを検索しています。
私はRに含まれているようないくつかのリソースを知っています(試してみるplot(Orange)
か、ここを参照してください)。
しかし、私はそれを一歩前進させたいと思います:
- 視覚化ツールをテストするのに最適な実際のデータセットはどれですか?
- 学術論文やdatavisに関する教育用スライドで使用したデータセットはどれですか。
- グラフ化の利点を示す実例の中で最も良い例はどれですか。
私が研究しているいくつかのdatavis手法をテストするために使用できる既存のデータセットを検索しています。
私はRに含まれているようないくつかのリソースを知っています(試してみるplot(Orange)
か、ここを参照してください)。
しかし、私はそれを一歩前進させたいと思います:
回答:
インターネット上で利用できるデータベースは多数あります。主題に応じて、さまざまなソースを取得できます。
たとえば、人間開発のサブジェクトエリアでは、(http://hdrstats.undp.org/)にデータソースがあります。
http://hdrstats.undp.org/en/tables/default.html
気候変動の観測については、(http://www.ipcc-data.org/)に高解像度の気候データが掲載されたWebがあります。次に例を示します。
http://www.ipcc-data.org/obs/cru_ts2_1.html
どちらの例にも、出版された科学論文で使用されている実際のデータが含まれており、大量のデータが含まれています。時間関連および/または空間関連のデータ。これらのデータの可視化の可能性は無限大です。
私が使用したいAnscombeの回帰を行うときにプロットすることの重要性を示すために、(Rでも利用可能)データセットを。慣れていない場合は、4つのデータセットすべてがまったく異なるように見えても、4つのデータセットすべてから同じ回帰直線と診断が得られます。以下のプロットを取り、残差プロットに変換して、回帰を実行した後に残差で探す可能性がある問題を説明できます。
グラフ化の利点を示す実例の中で最も良い例はどれですか。
どんな大きなテーブルでも。例として、「公式の国勢調査表」のグーグル画像。以下のようなものが表示されます。
また、ゲルマンらを見てください。(2002)私たちが宣べていることを実践しましょう:テーブルをグラフに変える。アメリカの統計学者56:121-130
ウィリアムS.クリーブランドは2冊の本でグラフィックの優れた使用法を満載しており、データの視覚化でグラフを作成するためのデータとコードは彼のWebサイトにあります。
おそらくあなたはすでにこれらを知っていますが、ここではとにかくそれらがあります:
UCI機械学習Repositor yは、多くの公的にアクセス可能な、実世界のデータ・セットを持っています。
米国政府は、そのデータセットの多くをdata.govで公開しています。
トリッキーな視覚化データが必要な場合は、分類タスクを検討することをお勧めします。UCI MLRに設定されたBag of Wordsにはいくつかの優れたプロパティがあるように見えますが、(私がそれを使用してからしばらくの間)間違えられる可能性があります。
ここにいくつかあります。
Sci2ツールのサンプルデータセット
http://wiki.cns.iu.edu/display/SCI2TUTORIAL/2.5+Sample+Datasets
Sci2ツールにバンドルされているサンプルデータセット。
Tableauサンプルデータセット
https://public.tableau.com/s/resources?qt-overview_resources=1#qt-overview_resources
Tableauを使い始めるためのサンプルデータセット。
素晴らしいパブリックデータセット
https://github.com/caesar0301/awesome-public-datasets/blob/master/README.rst
パブリックデータソースのこのリストは、ブログ、回答、およびユーザーの応答から収集され、整理されています。ほとんどのデータセットは無料ですが、一部は無料ではありません。
このスレッドはかなり古く、このバンプがいくつかの新しい貢献を期待しています!
ここでデータセットの負荷に気づきました:
http://www.inside-r.org/howto/finding-data-internet
それが何かの用途かどうか分からないのですか?
視覚化については教えていないので、具体的な質問についてはコメントできません。