リンクされた質問は、いくつかのデータポイントが複数回発生する、データポイントごとの均等に分散された分散を処理するためのショートカットとして、重みを使用して対処しています。
@whuberはコメントで、すべてのデータポイントの分散が等しい状況に対処しました。だから私はそれらが等しくない状況に対処します。この状況では、最適な加重平均は、加重されていない、つまり均等に加重された平均よりも分散が低くなります。
加重平均は、使用して重みが、等しい、そして分散を有し=。したがって、すべてのi に対しておよびを条件として、を最小化したいと考えています。wiΣni=1wixiΣni=1w2iVar(xi)Σni=1w2iVar(xi)Σni=1wi=1wi≥0
Karush-Kuhn-Tucker条件は、この問題の大域的最小値に必要十分であり、凸2次計画問題であることを考えると、閉形式の解になります。
1 = 1 .. n の最適なwi=[1/Var(xi)]/Σnj=1[1/Var(xj)]
対応する最適な加重平均の分散=。1/Σni=1[1/Var(xi)]
対照的に、等しい重み付けは、すべてのiについてを意味します。ここで、nはデータポイントの数です。whuberによって指摘されたように、すべてのデータポイントの分散が等しい場合、等しい重みが最適です。これは、上記の最適な式からわかるようになります。ただし、その式から明らかなように、データポイントの分散がすべて等しくない場合、等しい重みは最適ではなく、実際には、最適な重みよりも(加重平均の)分散が大きくなります。等しく重み付けされた平均の分散、つまり、等しい重みを使用した重み付け平均の分散=。wi=1nwi1n2Σni=1Var(xi)
数値結果の例をいくつか示します。
- 2つのデータポイントがあり、それぞれ1と4の分散があります。重み付けされていない平均の分散は1.25です。それぞれ最適な重み0.8と0.2を使用した加重平均の分散は0.8で、もちろん1.25未満です。
- 3つのデータポイントがあり、それぞれ1、4、9の分散があります。重み付けされていない平均の分散は1.5556です。それぞれ0.7347、0.1837、0.0816の最適な重みを使用した加重平均の分散は0.7347ですが、これはもちろん1.5556未満です。
もちろん、重みの選択が不適切な場合、加重平均が非加重平均よりも大きな分散を持つ可能性があります。最大の分散を持つデータポイントで1の重みを選択し、他のすべてのデータポイントで0を選択すると、加重平均は分散=任意のデータポイントの最大分散になります。この極端な例は、私が提示した最適化問題を最小化するのではなく最大化した結果です。