タグ付けされた質問 「trimmed-mean」

4
データのウィンザライズとトリミングの相対的なメリットは何ですか?
データのウィンソライズとは、データセットの極値を各端から特定のパーセンタイル値に置き換えることを意味し、トリミングまたは切り捨てにはこれらの極値の削除が含まれます。 平均または標準偏差などの統計を計算する際に、外れ値の影響を軽減するための実行可能なオプションとして、両方の方法について説明していますが、一方を選択する理由はわかりません。 WinsorizingまたはTrimmingを使用することに相対的な利点または欠点はありますか?1つの方法が望ましい特定の状況はありますか?実際にはもっと頻繁に使用されていますか、それとも基本的に交換可能ですか?

3
トリミング率とトリミング平均のプロットをどのように解釈できますか?
宿題の質問の一部として、最小と最大の観測値を削除してデータセットのトリミング平均を計算し、結果を解釈するように求められました。トリミングされた平均は、トリミングされていない平均よりも低かった。 私の解釈では、これは基礎となる分布が正に歪んでおり、そのため、左尾が右尾よりも密度が高いためだと考えられました。このゆがみの結果、高いデータムを削除すると、低いデータを削除するよりも平均が下にドラッグされます。これは、非公式に言えば、「代わりに待機している」データが少ないためです。(これは合理的ですか?) その後、私はトリム平均計算にトリミングパーセンテージが、これをどのように影響するか不思議に始め種々のために。興味深い放物線の形になりました: バツ¯tr(k )バツ¯tr⁡(k)\bar x_{\operatorname{tr}(k)}k = 1 / n 、2 / n 、… 、(n2− 1 )/ nk=1/n、2/n、…、(n2−1)/nk = 1/n, 2/n, \dotsc, (\frac{n}{2}-1)/n これをどのように解釈するのかよくわかりません。直観的には、グラフの勾配は中央値のデータポイント内の分布の部分の負の歪度(に比例)であるように思われます。(この仮説は私のデータでチェックアウトしますが、私はしか持っていないので、あまり自信がありません。)kkkn = 11n=11n = 11 このタイプのグラフには名前がありますか、それとも一般的に使用されていますか?このグラフからどのような情報を収集できますか?標準的な解釈はありますか? 参考のため、データは4、5、5、6、11、17、18、23、33、35、80です。

2
トリミングされた平均と中央値
緊急サービスへのすべての呼び出しと救急車部門の応答時間のデータセットがあります。記録を開始しなかった(値が0である)場合や、クロックを停止しなかった(値が非常に高くなる可能性がある)場合があるため、応答時間にいくつかの誤りがあることを認めました。 私は中心的な傾向を知りたいのですが、異常値を取り除くために中央値またはトリミングされた平均値を使用する方が良いかどうか疑問に思っていましたか?

2
トリミングされた分布は、最尤推定量を意味しますか?
サンプル平均は、最尤推定量である正規分布のための 。サンプル中央値の最尤推定量である用のラプラス分布(二重指数分布と呼ばれます)。通常(μ 、σ )m ラプラス(m 、s )μμ\mu通常(μ 、σ)Normal(μ,σ)\text{Normal}(\mu,\sigma)メートルmm ラプラス(m 、s )Laplace(m,s)\text{Laplace}(m,s) トリミングされたサンプルの平均が最尤推定量である位置パラメーターを持つ分布は存在しますか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.