量的データ、質的データ、またはその両方の公称、序数、およびバイナリですか?


9

私はデータ型を取り巻いていて、いくつかの助けが必要です:

ここに画像の説明を入力してください

上記の画像(ここから取得)を見ると、次のようなデータ型があります。

  • 定量的(離散、連続)
  • 定性的(名詞(N)、序数(O)、二項(B))。

ここに画像の説明を入力してください

しかし、次の写真(ここから)を見ると、カテゴリは次のとおりです。

  • 定量的(離散(NOB))
  • 定性

1つの画像は定性的にNOBがあり、もう1つの画像は定性的にNOBです。どちらが正しいか?


5
「個別データ」の説明にあるすべての箇条書きは誤りであり、誤解を招くものです。
whuber

回答:


5

これらの類型は、説明するほど簡単に混乱する可能性があります。

たとえば、バイナリデータ、多くの紹介文やコースで紹介されているように、確かに定性的に聞こえます:はいまたはいいえ、生き残ったか死んだか、現在か欠席か、男性か女性か、何でも。しかし、2つの可能性1または0をスコアリングすると、すべてが完全に定量的です。このようなスコアリングは、あらゆる種類の分析の基礎となります。女性の比率は、男性ではいくつかの0、女性では1の平均にすぎません。私が7人の女性と3人の男性に出会った場合、平均1、1、1、1、1、1、1、0、0、0で比率0.7を取得できます。バイナリレスポンスを使用すると、ロジットとプロビットの回帰などに至るまでの道が広く開かれます。これは、他の制御または影響を与える、生き残った割合、分数、または確率などの変化に焦点を当てています。コーディングが恣意的であることを心配する必要はありません。男性の比率は、女性の比率から1を引いたものです。

名義データまたは順序データを検討する場合も、ほぼ同じことが当てはまります。そのようなデータの分析は、最初に各カテゴリに分類される数を数えることにかかっているため、好きなだけ定量化できます。円グラフと棒グラフは、初期の頃に最初に見られたように、それを示しているので、説明でこれを見逃しているアカウントの数に困惑しています。

別の言い方をすれば、生のデータまたは元のデータを、最初に報告されたとき、たとえばスプレッドシートまたはデータベースのセルに表示されるときに分類できます。しかし、その元の形式は不変ではありません。あまりにも多くの表面的な教科書を読んで困惑して死に至ったような何かを想像してみてください。証明書にそれを書くことができますが、統計分析はそこで止まることはありません。数の集計(地域と期間におけるそのような死亡の数)、率の低下(リスクのある集団と比較した場合の数)などがあります。

したがって、データが最初にどのようにエンコードされるかによって、他の方法での使用や他の形式への変換が妨げられることはほとんどありません。データの語源が明らかになりました:元のラテン語を文字通り翻訳すると、それらはあなたに与えられたとおりですが、他の多くの形式に変換することに対する規則はありません。


5

全部まとめた写真が一枚も見つからなかったので、勉強してきたものをもとに作りました。測定のスケールをデータ型と同じダイアグラムに置くのは混乱を招くので、そこに違いがあることを示しようとしました。

ここに画像の説明を入力してください

あなたの助けと考えに感謝します!よろしく、傾いて


離散的な量的変数(カウントなど)も、間隔または比率スケールを使用して測定できます!たとえば、こちらをご覧ください。
Rodvi

3

それは「定量的データ」と「定性的データ」の意味によって異なります。

あなたが引用する2つのサイトでは、用語の使い方が異なっていると思います。たとえば、次のように尋ねるとします。

Did you vote for Obama, Romney, someone else or no one in the presidential election?

これはどのようなデータですか?変数は名目です。名前のみであり、順序はありません。しかし、重要なのは、どれだけ多くの候補者を選ぶかということです。これは、オバマ氏(またはロムニー氏など)について彼らが最も気に入っている点についてのインタビューの書き起こしである可能性がある定性的データとは対照的です。

それを見るより良い方法は、量的データを量的変数から明確に区別することです。


最初のケースでは、大統領名を保持する変数が1つあります。変数は定性的であり、正確には名目上のものです。2番目のケースでは、すべての大統領名が投票者を保持する個々の変数に対応しています。有権者名が既知であり、有権者名を保持している場合、変数は名目です。投票数を保持している場合、変数は定量的であり、正確には比率スケールです。
Ioannis Iliadis-Ilousis

2

これらのグラフはどちらも正しくありません。それらはかなり無意味であり、あなたは混乱するでしょう(矛盾は別として)。

彼らは、システムをモデル化するために、基本的な変数のタイプと変数の選択のアイデアを融合させているようです(pdfを使用)。

3つの基本的な変数タイプ(サブタイプを除く)があります:名義(カテゴリー/定性)、序数、および連続(数値、定量)。序数には、質的および量的性質の両方があります。

属性は実際には基本的なタイプではありませんが、適切な管理図を選択するときに通常はそのように説明されます。システムをモデル化するのに最適なPDFを選択します。これは「属性データ」と呼ばれることもありますが、タイプは名目です(別名カテゴリなど)。Nickが述べたように、名義を数えるので、数値型と混同される可能性がありますが、そうではありません。


1
マンデータは、あなたが言っていることに基づいて、上記のチャートにどのような変更を加えますか?私はあなたの助けに感謝します。よろしく、傾く
傾く

Mandata、さまざまな専門家からのこれらすべてのチャートは部分的に正しいです。重要なのは、人々は言葉や概念を完全に同一ではなく理解しているが、ある程度長い間または短い間、自分の快適な理解に積み重ねることを好むということです。たとえば、序数スケールを「量的」と呼ぶことを拒否する人もいれば、「量」が存在の潜在的な潜在的カテゴリーの明示であるかどうかに応じて受け入れる人もいます。
ttnphns

@リーニング。そのチャートはあなたの最後のものより良いです。私は、タイプ自体ではなく、タイプの品質を離散と見なします。公称および順序付けは完全に離散的ですが、可算(有限または無限)の定量的も離散的です。Binaryも型の特徴です(それは離散のサブセットです)。バイナリはめったに順序付けられず、ほとんどの場合、名義変数で表されます。カテゴリーと名義は同義語です。順序付けられた変数の違いはほとんど意味がなく、部分的または完全に不明であるか、関連がない(後者は意味がないことを意味する)可能性がありますが、私はそれを主張しません。
mandata 2016

@ttnphns、私はあなたが精神で言っていることに同意しますが、どちらにも深刻な概念上の誤りがあります。1つ目は、基本的なデータタイプである管理図の選択に使用される属性データタイプの考え方を組み合わせたものです。2番目は、連続のサブセットである離散のサブセットとして名義を持ちます。私は離散をサブセット化するかもしれませんが、名義は定性に属しています。名目上のイベントを個別に数えるからかもしれませんが、それが理由であってもそれは正しくありません。
mandata 2016

インターバル/レシオ理論は変数の型を説明する有効な方法だとは思いません。数学に自信がない場合、どの関数が妥当かを判断するのに適しているかもしれませんが、それ以上に、同じ次元または単位を表す場合、あるスケールを別のスケールの変換と見なします。
mandata 2016

1

測定のレベルと関連する概念について検索しているときにこの質問を見つけました。問題のチャートにはコンテキストが不足していると思います。分類を行うときは、目的に応じてオブジェクトをグループ化するためのルールを定義します。それで、目的は何ですか?そして変数について話しているのですか?

測定レベルに従って変数を分類でき、次のルールで4つのスケール(グループ)を作成できます。

名義:変数の属性は名前(カテゴリ)によってのみ区別され、順序(ランク、位置)はありません。
ordinal:変数の属性は順序(ランク、位置)によって区別されますが、それらの間の相対的な差異の程度はわかりません。
interval:変数の属性は、それらの間の差異の程度によって区別されますが、絶対的なゼロはなく、属性間の比率は不明です。
ratio:変数の属性は、それらの間の差異の程度によって区別され、絶対ゼロがあり、属性間の比率を見つけることができます。

そして、これはスタンリー・スミス・スティーブンスからの唯一のアプローチです。他にもいくつかの類型があります。

連続変数と離散変数は、一連の実数と次のような数学的概念です。

連続変数は、この範囲の任意の値を取ることができます。許可される値の数は数えられません。
一方、離散変数の場合、範囲内で許可される値の数は有限または無限に無限です。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.