私の質問は、中央値がモードよりも大きく、モードが平均よりも大きく、平均が範囲よりも大きくなることを可能にする一連のデータはありますか?もしそうなら、この状況を可能にするパターンまたはデータセットの特定の特性はありますか(多分ある種の歪度...)?
PS私はタイプミスを修正しました。すでに与えられた回答のいくつかは、中央値が反対の状況に関連しています
私の質問は、中央値がモードよりも大きく、モードが平均よりも大きく、平均が範囲よりも大きくなることを可能にする一連のデータはありますか?もしそうなら、この状況を可能にするパターンまたはデータセットの特定の特性はありますか(多分ある種の歪度...)?
PS私はタイプミスを修正しました。すでに与えられた回答のいくつかは、中央値が反対の状況に関連しています
回答:
質問はすでに肯定的に回答されていますが、構築の観点からこれにアプローチしましょう-これを行うデータのセットをどのように作成しますか?
まず、3つすべての位置測定を常に範囲より大きくできることに注意してください。単に中央値>モード>平均を持つ予備データセットを作成し、範囲を計算します。次に、(範囲平均)+(小さな正の)をすべてのデータ値に追加して、最終的なデータセットを取得します。これにより、3つの位置測定値がすべて範囲を超えます。
そのため、問題を中央値>モード>平均のデータセットを見つけることに減らしました。
適切な中央値とモードのデータがすでにあると想像してください。平均値を中央値と最頻値よりも小さくするには、平均値が引き下げられるデータの大部分よりも十分下に単一の値を配置するだけです。モードを変更せずに、データの大部分のすぐ上に2番目の値を配置して、中央値を維持できます。これで、単に中央値>モードを持つ既存のデータセットを変更し、希望する平均値を持つデータセットを取得できます。
したがって、中央値>モードで作成します。これを行うには、1つの値を繰り返します(2回発生する唯一の値の場合は、サンプルモードです)。次に、中央値を大きくするのに十分な他の値を追加します。これは例です:
21, 21, 22, 23, 24
中央値は22ですが、モードは21です。
次に、中央値またはモードを変更せずに平均値20を作成する方法で、前述のように2つのポイントを追加します。現在のポイントの合計は111なので、140-111 = 29に追加する2つのポイントが必要です。そのうちの1つは24よりも大きくする必要があります。25にしましょう。次に、小さい方のポイントは29-25 = 4です。
したがって、データセットは次のようになります。
4, 21, 21, 22, 23, 24, 25
平均値は20、モードは21、中央値は22です。
次に、範囲との関係を修正します。範囲は何ですか?現在は平均よりも大きい25-4 = 21です。すべてのデータ値に何かを追加して、平均を21より大きくするだけで、範囲は変わりません。2を追加するだけで十分です。(範囲平均+ 1 = 2なので、を取ったことがわかります)
したがって、最終的なデータセットは
6, 23, 23, 24, 25, 26, 27
範囲はまだ21、平均は現在22、モードは23、中央値は24です。
したがって、この段階的なアプローチは非常に使いやすいものです。要約すれば:
中央値>モードで小さなデータセットを作成するには、最小値を繰り返し、大きい値をすべて区別します(並べ替えた値を使用するのが最も簡単です)。5ポイントにすると便利です(中央値を移動して中央値を指定できるため)が、必要に応じて4ポイントにすることもできます。
中央値またはモードを変更しない2つのポイントを追加することにより、中央値より下の平均を取得します(つまり、2つの異なる/シングルトン値はモードを妨害せず、前のデータのいずれかの側にそれらを配置すると、中央値が保持されます。より大きい値を配置します。現在のすべてのデータのすぐ上に、最小値を計算して、全体の平均がモードのすぐ下に来るようにします。これにより、7つのデータポイントに移動します。
範囲を計算します。すべてのデータ値に定数(範囲-平均+)を追加します。これにより、平均が範囲を超えることが保証されます。これが最終的なデータセットです。
Rでこれらの計算を確認します。
x <- c(6, 23, 23, 24, 25, 26, 27)
data.frame(
range=diff(range(x)),
mean=mean(x),
mode=max(as.numeric(names(table(x))[table(x)==max(table(x))])),
median=median(x)
)
range mean mode median
1 21 22 23 24
(もし私たちが偶然に複数のモードを生成した場合、この計算はそれらのうち最大のものを見つけようとすることに注意してください)
はい、そのようなセットを思いつくのは難しくありません。
S = {0、1、2、3、4、4、1000}
中央値= 3、モード= 4、平均値= 144.85、範囲= 1000
この種類のデータは、平均値が中央値よりも高いため、平均して中央値よりも高い値が下の値よりも離れていることを意味して、右に曲がります。
順序に関係なく、答えはイエスです。分布のサブセットであるデータセットは、左側の裾が右側の裾よりも重いため、モードは中央値よりも小さく、中央値は平均よりも小さく、平均は範囲よりも小さくなります。1/2より大きいモードのベータ分布はその特性を持ちます。モードを特定の位置に配置したい場合は、狭い(小さい)標準偏差の小さいパーセンテージを追加することで混合分布を作成できますが、そのモードを配置したい場所にはどこでも、たとえばDiracような高い分布があります。