統計グラフィックスの「こんにちは、世界」はありますか?


25

コンピュータプログラミングでは、「hello、world」と呼ばれる新しい言語またはシステムを学習/指導するための古典的な最初のプログラムがあります。 http://en.wikipedia.org/wiki/Hello_world_program

グラフパッケージを使用するための古典的な最初のデータ視覚化はありますか?もしそうなら、それは何ですか?そうでない場合、良い候補者は何でしょうか?


3
当サイトへようこそ!私たちのよくある質問は、「あなたは唯一のあなたが直面している現実の問題に基づいて実用的な、釈明質問をする必要があります。」と尋ねるん 実際の問題について詳しく説明していただけますか?
whuber

3
統計グラフィックの「標準テスト項目」があれば、それを特定して、開発中のトレーニング資料に含めたいと思います。
アブラハムDフラックスマン

2
グラフィカルアプリケーションは多種多様であるため、一部の標準グラフィックまたはユニバーサルグラフィックを思い付くのは困難です。歴史的に有名なバニーや3Dグラフィックス用のティーポットなど、特定の種類のグラフパッケージにいくつかの標準があります。質問に回答できるようにするには、トレーニング資料の対象となるパッケージをより具体的にすることが役立ちます。
whuber

1
良い点、ありがとう。R、STATA、Python、およびJavascriptの統計グラフィックスについて、少なくとも何かを含めます。
アブラハムDフラックスマン

@AbrahamDFlaxman私はこの「トレーニング資料」と誰と何のためにそれが意図されているのか興味があります。もっと言えますか?
ピーターフロム-モニカの復職

回答:


9

2つの考え:

A.「Hello World」の本質を理解しようとすると、1行のテキストを印刷する有効なプログラムを生成するために、プログラミング言語で行う必要のある最低限の作業です。つまり、「Hello World」は単変量のデータセットである必要があり、統計プログラムまたはグラフィックプログラムにプラグインできる最も基本的なものです。

B.「Hello World」をグラフ化することを知りません。最も近いのは、RのAirPassengersなどのさまざまな統計パッケージに含まれている典型的なデータセットです。Rでは、Hello Worldグラフステートメントは次のようになります。

plot (AirPassengers)  # Base graphics, prints line graph

または

qplot (AirPassengers) # ggplot2, prints a bar chart

または

xyplot (AirPassengers) # lattice, which doesn't have a generic plot

個人的には、最も単純なグラフは折れ線グラフで、YにX個のアイテムがあり、Xの範囲は1:Nであると思います。しかし、それは標準ではありません。


1
これと他の答えからのコンセンサスは、現在、統計グラフィックスの「ハロー、世界」はないということです。YとXのN個のアイテムが1:Nの範囲にある単変量データセットの提案は説得力があると思います。「hello、world」にさらに類推すると、小さなNと記憶に残るYがあるといいでしょう。N= 5およびY =(3,1,4,1,5,9)についてどう思いますか(つまりpiの桁数)?たぶんそれはあまりにもマチです。
アブラハムDフラックスマン

1
@AbrahamDFlaxman:私はそれが素晴らしいとは思わない、素晴らしいと思う。記憶に残る、短く、グラフは単なる直線などではありません。データはよく知られており、特定のプログラムに関連付けられていないため、より多くのポイントが必要な場合は任意に拡張できます。私はそれに投票します!
ウェイン

24

散布図から始めて、4つのい相関関係を示します。


2
+1。ただし、何らかの形式のラインプロットなど、もう少し一般的なものを検討することをお勧めします。結局、線分を描くことができるとすぐに、何でも描くことができます。これは、「Hello、world!」の背後にある考え方を反映しています。プログラムから読み取り可能な出力を取得できたら、コンピューターと通信できることがわかり、残りは単なる詳細です:-)。(詳細は難しい可能性があります。IBM360メインフレームのアセンブリコードの記述を学習するとき、出力を取得する最も簡単な方法は、RAMに保存し、実行の最後にエラーを作成し、システムに16進数のコアダンプを出力させることでした!)
whuber

Anscombeのカルテットは合計すると統計グラフの「ハロー、世界」として使用するには多すぎると思いますが、彼の論文の図1は良い候補です。しかし、他の答えが単変量データセットの場合を示しており、私はそれに傾いています。
アブラハムDフラックスマン

7

正規分布したランダム変数のサンプルのヒストグラム。


私はこれがどのように見えるかが好きですが、多分ヒストグラムは散布よりも多くのデータ処理を必要とし、正規分布からサンプルを思い付くことは気が散るかもしれません。
アブラハムDフラックスマン

これはMatplotlib Webページの最初の例であることに気付きました。matplotlib.org
Abraham D Flaxman

5

答えは「いいえ」だと思います。つまり、あなたの質問に対する一般的な合意はありません。

@StasKは散布図を指します。

しかし、私は何をするかを検討plotRます:それはデータに依存します!

単変量統計は、二変量統計よりも簡単であると言えます。それで...おそらく最も基本的なことはヒストグラムです。またはおそらく棒グラフ。多分密度プロット。

「Hello、World!」のポイントなら コンピューターに何かをさせることができることを示すことです。そうすれば、どんなプロットでもできると思います。


1
おそらく、標準のテスト項目がないことは、あなたが正しいことを示しており、実証されているシステムで最も単純なプロットを使用することがより適切です。ただし、比較が難しくなります。
アブラハムDフラックスマン

5

Hello Worldとして正確に適格かどうかはわかりませんが、Rには多くのパッケージに組み込まれたデモもあります。例えば

library(graphics)
demo(graphics)

パッケージで利用可能ないくつかの基本的なグラフィックをユーザーに案内します。各画像上でマウスをクリックするだけで、基本的なグラフィックスの図を表示できます。わずか2行で、ユーザーは統計用のRグラフィックスの刺激的な機能のいくつかを紹介します。

グラフィックを生成するための対応するコードがRコンソールに表示されます。

ここに画像の説明を入力してください


2

データの視覚化には2つの「Hello World」タイプのプログラムがあったと思います。

Print( "Hello World"):正規分布変数のヒストグラム、または単純なX、Y散布図のようなもの。

Hello Worldの原理を取り入れ、ユーザー入力やエスケープ文字などで遊んでいるセクションのような、もう少し複雑なものについては、Irisデータセットで遊んでいると思います。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.