タグ付けされた質問 「median」

中央値は、データまたは確率分布の半分を下回る値です。サンプルサイズが奇数の場合、中央値は、順序付けされたサンプルの「中央」値です。

1
対数正規分布の中央値の推定量としてサンプル中央値をいつ使用するのですか?
私自身は常に幾何平均を使用して対数正規中央値を推定します。ただし、業界では、サンプルの中央値を使用するとより良い結果が得られる場合があります。したがって、問題は、サンプル中央値を母集団中央値の推定量として確実に使用できる開始カットオフ範囲/ポイントがあるかどうかです。 また、サンプルの幾何平均は中央値のMLEですが、偏りはありません。偏りのない推定量は、が既知の場合、ます。実際には、は常に不明であるため、バイアスされた修正推定量 (下記を参照)が使用されます。MSEが小さく偏りがないため、このバイアス補正されたgeomean推定量はより優れているとする論文があります。ただし、実際には、サンプルサイズが4〜6しかない場合、バイアス補正は意味がないと主張できます。σ β CGMσβ^CGM0= exp(μ^- σ2/ 2N)β^CGM0=exp⁡(μ^−σ2/2N)\hat{\beta}_{\mbox{CGM0}}=\exp(\hat{\mu}-\sigma^2/2N)σσ\sigmaβ^CGMβ^CGM\hat{\beta}_{\mbox{CGM}}σσ\sigma 偏りがないとは、推定器が真の母集団パラメーターを中心とし、パラメーターの下でも過大でもないことを意味します。正に歪んだ分布の場合、中心は平均ではなく中央値です。 変換に対する不変量は、現在の領域で重要なプロパティです(DT50と劣化率kの間の変換、k = log(2)/ DT50)。元のデータと変換されたデータに基づいて、異なる結果が得られます。 限られたサンプルサイズの場合、平均不偏性は誤解を招く可能性があります。バイアスはエラーではなく、不偏推定量はより大きなエラーを与える可能性があります。ベイジアンの観点からは、データは既知で固定されており、MLEはデータを観察する確率を最大化し、バイアス補正は固定パラメーターに基づいています。 サンプルの幾何平均推定量はMLEで、中央値に偏りがなく、変換に対して不変です。バイアス補正されたgeomean推定器よりも望ましいと思います。私は正しいですか? Assummingバツ1、X2、。。。、XN〜LN(μ 、σ2)X1,X2,...,XN∼LN(μ,σ2)X_1,X_2,...,X_N \sim \mbox{LN}(\mu,\sigma^2) β= exp(μ )β=exp⁡(μ)\beta = \exp(\mu) β^GM= exp(μ^)= exp(∑ ログ(X私)N)〜 LN(μ、 σ2/ N)β^GM=exp⁡(μ^)=exp⁡(∑log⁡(Xi)N)∼LN(μ,σ2/N)\hat{\beta}_{\mbox{GM}}= \exp(\hat{\mu})= \exp{(\sum\frac{\log(X_i)}{N})} \sim \mbox{LN}(\mu,\sigma^2/N) β^SM= 中央値(X1、X2、。。。、XN)β^SM=median(X1,X2,...,XN)\hat{\beta}_{\mbox{SM}}= \mbox{median}(X_1,X_2,...,X_N) β^CGM= exp(μ^- σ^2/ 2N)β^CGM=exp⁡(μ^−σ^2/2N)\hat{\beta}_{\mbox{CGM}}= \exp(\hat{\mu}-\hat\sigma^2/2N) ここで、とは対数平均とlog-sd、とはと MLEです。σ μ σ μ σμμ\muσσ\sigmaμ^μ^\hat\muσ^σ^\hat\sigmaμμ\muσσ\sigma 関連する質問:サンプル中央値の分散には、近似式ます。この式を使用するのに十分な大きさのサンプルサイズとは14Nf(m)214Nf(m)2\frac{1}{4Nf(m)^2}

3
複数のリッカートアイテムの中央値の違いをテストする方法は?
アンケート調査では、雪、滑りやすさなどのさまざまな冬の気候要因が、歩行や自転車の動作の選択にどのように影響するかについて、回答者に態度を示すように依頼しました。500人の個人と回答で構成されるサンプルは、非常に否定的から非常に肯定的(通常の尺度)までの5段階の評価形式でした。 さまざまな質問に対する回答を比較したい場合、データは序数であるため、中央値は適切なツールだと思います。比較するということは、差の確率が有意であるかどうかを示すためのさまざまな統計的検定があることを知っています(t検定または非パラメトリック検定など)。しかし、ここで説明した種類のデータに対してこれらのテストを使用できるかどうか、少し混乱しています。 中央値の比較に使用する検定統計量はありますか? または、適切であれば、データを間隔スケールに転送する必要がありますか?

2
中央値の差をテストする
2つの分布のサンプルを考えて、中央値の差のテストを探しています(中央値が異なるという証拠のためにnullを拒否します)。両方の分布について何も仮定しません。この状況の標準テストはありますか? ムードの中央値検定は知っていますが、分布がシフトしていることを前提としています。一部の。私はこれらの情報源でこの主張を支持します:F2(t )=F1(t − a )F2(t)=F1(t−a)F_2(t) = F_1(t-a)A ∈ Ra∈Ra \in \mathbb{R} リンク1 リンク2 LINK3

3
中央値>モード>平均>範囲
私の質問は、中央値がモードよりも大きく、モードが平均よりも大きく、平均が範囲よりも大きくなることを可能にする一連のデータはありますか?もしそうなら、この状況を可能にするパターンまたはデータセットの特定の特性はありますか(多分ある種の歪度...)? PS私はタイプミスを修正しました。すでに与えられた回答のいくつかは、中央値が反対の状況に関連しています

1
IID正規確率変数のセットの中央値の平均と分散は何ですか?
レッツ、...、同一の独立を持つ確率変数配布さX1X1X_1XnXnX_nN(μ 、σ2)N(μ,σ2)N(\mu, \sigma^2) サンプル平均が。バツ¯=1んΣんi = 0バツ私X¯=1n∑i=0nXi\bar{X} = \frac{1}{n}\sum^n_{i = 0}{X_i}N(μ 、σ2ん)N(μ,σ2n)N(\mu, \frac{\sigma^2}{n}) ただし、サンプルの中央の分布が何であるか、特にその平均値と分散値を見つけるのに苦労しています。m個の電子のDi a n (X)median(X)median(X) 2つの条件間で実行する必要があるテストの数を減らすために、定義済みのグループにいくつかの機能をまとめようとしているので、質問します。 これに対する単純な答えがない場合、私が疑っているように、私は分散、特にとの違いを知ることに興味があります。m個の電子のDi a n (X)median(X)median(X)バツ¯X¯\bar{X}


1
ベータ分布の部分的な期待値(切り捨てられたベータの平均)を計算する方法は?
ベータ分布がa = 2、b = 3の場合、区間[0、1] = a /(a + b)= 2/5 = 0.4および中央値=(a- 1/3)/(a + b-2 / 3)= 0.39、近いです。 私はpythonの解決策を探しています。scipy.stats.betaを使用して、間隔[ 0、0.4 ]の中央値をパーセントポイント関数で計算できます(cdfの逆数-パーセンタイル): beta.ppf(0.4/2,a,b) = 0.2504 このベータ分布では、全体の平均と中央値が近いため(それぞれ0.4と0.39)、間隔[0、0.4]の中央値を使用して、間隔[0、0.4]の期待値(平均)を推定します。 間隔[0、0.4]の期待値(平均)を計算する方法はありますか?

1
二変量中央値のデータと信頼 "楕円"(領域?)を見つけますか?
二変量中央値の周りのデータと信頼楕円を計算する方法について疑問に思っています。たとえば、次のデータの二変量平均のデータ楕円または信頼楕円を簡単に計算できます(ここではデータ楕円のみを示しています)。 library("car") set.seed(1) df <- data.frame(x = rnorm(200, mean = 4, sd = 1.5), y = rnorm(200, mean = 1.4, sd = 2.5)) plot(df) with(df, dataEllipse(x, y, level = 0.68, add = TRUE)) しかし、私は二変量中央値に対してこれをどのように行うのかと苦労していますか?単変量の場合、リストラップをブートストラップして必要な間隔を生成することができますが、これを二変量の場合に変換する方法がわかりませんか? @Andy Wが指摘したように、中央値は一意に定義されていません。この例では、そのポイントでの観測間の距離のL1ノルムを最小化するポイントを見つけることにより、空間中央値を使用しました。観測されたデータポイントから空間中央値を計算するために最適化が使用されました。 さらに、実際のユースケースにおけるx、yデータペアは、非類似度マトリックスの主座標分析の2つの固有ベクトルであるため、特定の攻撃手段を提供する場合、xとyは直交している必要があります。 実際の使用例では、ユークリッド空間の点のグループのデータ/信頼楕円を計算します。例えば: 分析は、グループ間の分散の均一性のリーベン検定の多変量類似体です。多変量中心傾向の尺度として空間中央値または標準グループの重心を使用し、空間中央値の場合の上の図のデータ楕円に相当するものを追加します。

1
PDFの中央値を計算する方法
私は統計に不慣れで、課題からの質問を解決するのに苦労しています。確率密度関数があり、その中央値を計算する必要があります これが関数です: f(x )= 2 xe−バツ2、x > = 0f(x)=2xe−x2,x>=0f(x) = 2xe^{-x^2}, x>= 0 答えは ログ2−−−−√log⁡2\sqrt{\log 2}。 誰か助けてもらえますか?私は学ぼうとしています
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.