幾何平均と算術平均について、互いに非常に近いもの、たとえば〜0.1%に重要なものはありますか?そのようなデータセットについてどのような推測をすることができますか?
私はデータセットの分析に取り組んできましたが、皮肉なことに、値は非常に近いことがわかりました。正確ではないが、近い。また、算術平均幾何平均不等式の簡単な健全性チェックとデータ収集のレビューにより、値をどのように考え出したかという点で、データセットの整合性について怪しいものはないことが明らかになりました。
幾何平均と算術平均について、互いに非常に近いもの、たとえば〜0.1%に重要なものはありますか?そのようなデータセットについてどのような推測をすることができますか?
私はデータセットの分析に取り組んできましたが、皮肉なことに、値は非常に近いことがわかりました。正確ではないが、近い。また、算術平均幾何平均不等式の簡単な健全性チェックとデータ収集のレビューにより、値をどのように考え出したかという点で、データセットの整合性について怪しいものはないことが明らかになりました。
回答:
算術平均は、算術平均幾何幾何平均(AMGM)の不等式を通じて幾何平均に関連しています。
ここで、場合に等しいことが達成されます。したがって、おそらくデータポイントはすべて非常に近いものです。
@Alex Rの答えを詳しく説明すると、AMGMの不平等を確認する1つの方法は、ジェンセンの不平等効果です。ジェンセンの不等式により: 次に、両側の指数関数を取得します: 1
以来、右側は幾何平均です。
AMGMの不等式は、いつほぼ同等になりますか?ジェンセンの不等効果が小さい場合。ここでジェンセンの不平等効果を促進するのは、凹、対数の曲率です。対数に曲率がある領域にデータが分散している場合、効果は大きくなります。対数が基本的にアフィンである領域にデータが分散している場合、影響はわずかです。
たとえば、データの変動がほとんどなく、十分に小さい近傍にまとめられている場合、対数はその領域のアフィン関数のようになります(微積分のテーマは、滑らかで連続的な関数に十分にズームインすると、それは線のように見えます)。データが十分に近い場合、データの算術平均は幾何平均に近くなります。
レッツの範囲を調べるそれらの算術平均(AM)が小さい倍数であることを考えると1 + δ(との幾何平均(GM)のδ ≥ 0)。質問では、δ ≈ 0.001しかし、我々は知らないのn。
測定単位を変更してもこれらの平均の比率は変わらないため、GMが単位を選択します。したがって、我々は最大にするためにシークX nは制約を受けるxは1 + X 2 + ⋯ + X N = N (1 + δ )とX 1 ⋅ X 2 ⋯ X N = 1。
これは、ことによって行われる、言うと、X N = Z ≥ X。かくして
そして
解間ルートで0と1の
簡単に繰り返し見つけることができます。ここで、最適ののグラフでとZの関数としてのδのためには、N = 6 、20 、50 、150、左から右へ:
がかなりのサイズに達するとすぐに、1.001という小さな比率であっても、1つの大きな外側のx n(上部の赤い曲線)および密集したx iのグループ(下部の青い曲線)と一致します。
他の極端な場合、が偶数であると仮定します(簡単にするため)。半とき最小範囲が達成され、xがiを一つの値に等しく、X ≤ 1と他の半分を別の値に等しくZ ≥ 1。解決策(簡単に確認できます)は
小さいため、我々は無視することができるδ 2を近似値として、また、近似のk 番目の一次へのルートを与え
範囲は約。
この方法で、データの可能な範囲の上限と下限を取得しました。 データ量に大きく依存していることがわかりました。上限は、範囲がごく小さなδでも認識できることを示しており、それにより、データポイントが実際に互いにどれだけ近くにある必要があるかという感覚が向上し、範囲にも下限が設定されています。
同様の分析を簡単に実行することで、分散や変動係数など、スプレッドの他の尺度に関してx iがどれだけ密にクラスター化されているかを定量的に知ることができます。
x=c(-5,-5,1,2,3,10); prod(x)^(1/length(x))
[1] 3.383363