タグ付けされた質問 「central-tendency」

4
データが歪んでいるときに平均を使用する必要がありますか?
多くの場合、導入された導入統計テキストは、平均がサンプルデータおよび/または外れ値に敏感であることを説明することにより、平均を中央値と区別します偏った母集団分布に対して、これは、データが対称的でない場合に中央値が優先されるという主張の正当化として使用されます。 例えば: 特定のデータセットの中心傾向の最適な測定値は、値の分布方法によって異なります。...データが対称でない場合、中央値が中心傾向の最適な測定値であることがよくあります。平均値は極端な観測値に敏感であるため、外れたデータ値の方向に引っ張られ、結果として過度に膨張または過度に収縮する可能性があります。」— Pagano and Gauvreau、(2000)Principles of Biostatistics 、第2版。 (P&Gは、BTW、手元にあったそれらを選び出していないそれ自体)。 著者はこうして「中心傾向」を定義します:「データのセットの最も一般的に調査された特性はその中心、または観察が集中する傾向があるポイントです。」 これは、データ/分布が対称であるときに平均を使用することだけが、中央値に等しいときにのみ平均を使用するということと同じことなので、中央値、期間のみを使用するという率直な方法として私を襲います。編集: whuberは、中心傾向の堅牢な測定値と中央値を混同していることを正しく指摘しています。したがって、導入された統計の算術平均と中央値の特定のフレーミングについて議論していることに留意することが重要です(ここで、モードは別として、中心傾向の他の尺度は動機付けられていません)。 平均値の効用を中央値の挙動からどれだけ逸脱するかで判断するのではなく、これらを中心性の2つの異なる尺度として単純に理解すべきではないでしょうか?言い換えれば、歪度に敏感であることは平均の特徴です。同様に、「中央値は歪度にほと​​んど影響されないため、中央値は良くありません。したがって、中央値は平均と等しい場合にのみ使用してください」と有効に主張できます。 (モードは、この質問に関与していないのが非常に賢明です。)

1
なぜ中心傾向の測定から始めるのですか?
で教え記述統計を、中心傾向の尺度は、例えばスプレッドの対策前に、早い段階で出てきます。私にとっては、他の多くの特性を学ぶ前に、データの中心的な傾向、つまり場所について学ぶことは十分に自然ですが、これは私が教えられた方法に由来しているだけかもしれません。 しかし、なぜ中心的傾向が最初に学ぶべきであるかについて、良い動機はありますか? 特定の中心傾向(平均、中央値、最頻値など)にデータに関するほとんどの情報が含まれているとは言えません。また、最も重要な情報が含まれているとは言えません(相対的な重要性は実際にデータの使用目的に依存するため)。 しかし、代わりに何が言えるでしょうか?
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.