ここの他の回答は無視してください。これは実際にはまったく逆説ではありません。ここで誰もが無視しているように見える実際の問題は、あなたが実際に見ている確率を間違えているということです。実際、ここには2つのまったく異なる平均値と統計があり、どちらも提案された例(マーケティング)で独自の用途と解釈があります!
まず、顧客ごとに購入した製品の平均数があります。したがって、平均して1人の顧客が1.6個のアイテムを購入します。もちろん、顧客は製品の0.6を超えることしかできません(米や穀物のようなものではなく、継続的な測定値が関連付けられていると仮定します)。
第二に、特定の製品を購入する顧客の平均数があります。変だね?したがって、平均して製品には5.33333333 ...顧客がそれを購入しています。ただし、これは異なります。ここで説明しているのは、購入した製品の数(そのうち3つだけです)ではなく、実際にその製品を購入した人の数です。
このように2つの値を考えてみてください。顧客が1人しかない場合や製品が1つしかない場合、これら2つの値は何を表しますか?結局のところ、単一のデータポイントの平均は、指定されたデータポイントにすぎません。
または、さらに良いことに、チャートを、製品を購入するために費やした金額を与えているかのように考えてください。明らかに、個々の顧客が費やす平均額は、大企業(または単なる中小企業)が提供する製品が平均して稼ぐ金額よりもはるかに少なくなります。会社の幸福について議論するとき、あなたは両方の価値を使う良い方法を考えることができると確信しています。
これをマーケティングスタッフに説明するときは、私が言ったように彼らに説明してください。それはパラドックスではありません。それは全く異なる統計です。ここでの唯一の問題は、実際には、チャートを読むための2つの異なる方法(つまり、製品ごとに購入する人の数対人ごとに購入する製品の数)があることに気づいたことです。
tl; dr最初に説明したのは、個々の顧客が製品の購入に費やすことをいとわない平均金額です。2番目は、特定の製品に対する一般の需要の平均です。なぜ両方が同じものではないのか、おわかりいただけると思います。それらを比較すると、ごみの情報が得られます。
編集
質問は実際に、製品a、b、またはcを購入する顧客が費やした平均金額について尋ねているように見えます。わかった。これは実際には計算上の単なるエラーです。これをパラドックスとは呼びません。それは本当に微妙な動揺です。
列を見てください。列間で共有される人がいます。適切な加重平均を行ったと仮定しましょう。あなたはまだ二度人を追加しています。つまり、平均には2以上の値を持つ余分な人が含まれることになります。1.6でした!基本的に、あなたの平均は次のようになります。
∑ni = 0v a l u e O fPEのR S OのN私∗ v a l u e O fPEのR S OのN私n
それは間違いなく正しい式ではありません。これは加重平均です。ただし、相互排他性を想定しているので、状況に応じて真の平均を取得するように調整します。
∑ni = 0N Uは、mはB のE R O FをPe o p l e B u y私のn グラム私∗ a v e r a ge Sp e n t B yPe r s o n b u y私のn グラム私n
いずれにせよ、あなたは台無しにされた平均を得るでしょう。1つの間違いは、1つのカテゴリの平均の「重み」が大きいため、加重平均の必要性を無視することでした。密度のようなものです。1つの値は、人々が表す密度が高くなります。他の問題は、平均を歪める重複追加です。私はこれらの「パラドックス」のどちらとも呼びません。あなたが何をしていたかを見たら、なぜそれがうまくいかないのか私には明らかでした。加重平均は、その必要性については一目瞭然であり、値を複数回追加したことがわかると思います...それは機能しません。基本的に、値の二乗の平均を取りました。